Sulje

Panu Uotila

Automaattisen litteroinnin läpimurto on lähellä, sen käyttöönotto on Helsingin Sanomissa prioriteetti

automaatio

Teoria väittää: Toimittajan työ nopeutuu lähivuosina, kun haastatteluja ei tarvitse purkaa käsityönä. Puheentunnistus on Suomessa käytössä jo sairaanhoidossa.

Toimituksissa testataan nyt litterointiohjelmia, jotka vapauttavat toimittajat aikaa vievästä ja tylsästä haastattelutallenteiden purkamisesta. Automaattisen litteroinnin laaja läpimurto toimitustyössä on kansainvälisesti lähellä, mutta Suomessa asia on vielä kokeiluasteella. Suomeksi toimivia ohjelmistoja ovat testanneet muun muassa Yle, MTV Uutiset ja Helsingin Sanomat.

Suomi ei ole markkinan pienuuden vuoksi kansainvälisten jättien, kuten Googlen, Microsoftin ja Amazonin, kehityspanostusten kärkiryhmässä. Puheentunnistus on kuitenkin ottanut viime aikoina merkittävän harppauksen eteenpäin. Esimerkiksi terveydenhuollossa Helsingin ja Uudenmaan sairaanhoitopiiri siirtyi lääkäreiden sanelussa automaattiseen puheentunnistukseen vuonna 2019 ja Elisan puhelinpalvelussa sitä hyödynnetään jo laajasti.

Minna Pulli tutki STT:n toimeksiannosta gradussaan litterointiohjelmien hyödyntämistä uutistyössä. Tutkimuksen aineisto on koottu 12 kansainvälisestä uutistoimistosta sekä kuudesta suomalaismediasta. Mukana olleista kansainvälisistä uutistoimistoista puolet on jo ottanut automaattisen puheentunnistuksen vakituiseen käyttöön mutta suomalaismedioista ei yksikään.

Automaattiseen puheentunnistukseen liittyy eettisiä kysymyksiä. On tärkeää, että ohjelma ei kirjaa haastateltavan sanomaksi sellaista, mitä hän ei ole sanonut. Siksi puheentunnistus pystyy parhaimmillaankin vain raakaversion tekemiseen. Toimittajan pitää jatkossakin tarkistaa sitaatteina käyttämänsä kohdat.

Puheentunnistus toimii parhaiten taustameluttomassa tilassa tehdystä tallenteesta, koska se vertaa tallennettua puhetta äänteistä ja kielestä harjoituspuheen perusteella laskemiinsa matemaattisiin malleihin. Tämän vuoksi verkkainen kirjakielinen puhe on sille helppoa, mutta tunnistuksen laatu heikkenee mitä nopeampaa ja puhekielisempää puhe on.

Aalto-yliopiston professori Mikko Kurimo arvioi kuitenkin gradussa, että ohjelmistot kehittyvät lähivuosina aiempaa puhekielisemmän puheen ymmärtämisessä.

Automaatio nopeuttaa lähivuosina toimitustyötä, vähentää rutiinitehtäviä ja mahdollistaa toimittajien keskittymisen asioihin, joihin tekoäly ei kykene.

Pidänkin todennäköisenä, että journalistisia sisältöjä tehdään yhä tiiviimmin ihmisen ja koneen yhteistyössä, jolloin kumpikin keskittyy omiin vahvuuksiinsa. Automatiikan vahvuus on nopeus sekä suurten numeropainotteisten aineistojen hallinta, ihminen puolestaan on hyvä ymmärtämään syy-seuraussuhteita sekä vetoamaan tekstillä tunteisiin.

Fakta

Tutkija: Minna Pulli
Tutkimus: Maisterintutkielma ”Haastattelujen automaattinen litterointi uutistyössä ja haastateltavan oikeudet” on julkaistu Jyväskylän yliopiston kieli- ja viestintäteiden laitoksella journalistiikan oppi­aineessa.

 

Käytäntö vastaa: Helsingin Sanomissa odotetaan kriteerit täyttävää litterointiohjelmistoa parin vuoden sisällä. Toimituksessa ohjelmisto otetaan ”riemusta kiljuen” käyttöön, kunhan toiminnan ja lähdesuojan ongelmat on ratkaistu.

Helsingin Sanomien digitaalisesta kehittämisestä vastaava toimituspäällikkö Esa Mäkinen, miksi automaattista litterointia ei vielä hyödynnetä Hesarissa?

– Ensinnäkin ongelmana on suomenkielisen puheentunnistuksen laatu. Kokeilemamme palvelut eivät ole vielä tyydyttäneet. Lisäksi haastattelujen tallentamisen prosessi kännyköillä on aiheuttanut teknisiä ongelmia.

– Suurin ongelma on lähdesuojaan ja eurooppalaiseen tietosuojalainsäädäntöön liittyvät kysymykset. Kaikki julkaisematon materiaali on lähdesuojan piirissä, ja meillä on paljon vahvan lähdesuojan materiaalia. Järjestelmän pitäisi olla sellainen, että voimme olla sataprosenttisen varmoja, että kukaan ulkopuolinen ei pääse kuuntelemaan tiedostoja ja että niitä ei varsinkaan lähetetä yhdysvaltalaiselle palvelimelle.

Uskotko, että lähivuosina tarjolle tulee kriteerit täyttävä, suomea ymmärtävä ohjelmisto?

– Uskon vahvasti, että seuraavan parin vuoden sisällä tulee toimiva järjestelmä. Lainsäädännön lisäksi puheentunnistuksen kehitystä vauhdittaa puheella ohjattavien laitteiden, kuten älykaiuttimien kehitys. Olettaisin, että ainakin Google ja Amazon alkavat tehdä toimivia ohjelmistoja, kun ne saavat ensin toimivat softat isommille markkinoille.

Aiotteko ottaa automaattisen litteroinnin käyttöön?

– Sen käyttöönotto kuuluu meillä kärkiprioriteetteihin.

– Uskon, että toimittajat riemusta kiljuen tappelisivat, kuka pääsee ensimmäiseen koulutukseen, kun haastatteluja ei enää tarvitsisi litteroida. Ohjelmisto helpottaisi toimittajien elämää ja auttaisi heitä keskittymään sisällön tekemiseen.

Hesarissa uusin tapa hyödyntää automaatiota on käyttäjäkohtainen digietusivun suosittelu, joka otettiin käyttöön helmikuussa. Miten lukijat ovat ottaneet sen vastaan?

– Postitiivisesti. Puolella lukijoista suosittelu oli automaattisesti päällä ja puolella pois päältä. Selkeästi isompi osa lukijoista on laittanut sen päälle kuin ottanut pois päältä. Tämä on meille indikaatio siitä, että ihmiset haluavat itselleen räätälöidyn etusivun.

Hesari hyödyntää uutisrobotiikkaa pörssikatsausten, sääennustusten, menovinkkien ja uusimpana koronan tartuntatilannejuttujen tekemisessä. Onko uutisautomatiikassa laajennusmahdollisuuksia?

– Korona on uutisrobotiikan graalin malja, koska siinä tulee joka päivä uusia, kiinnostavia lukuja. Luvuista saa koneella aikaan enemmän ja mielenkiintoisempaa kuin mitä ihminen saisi aikaan samassa ajassa.

– Olimme aiemmin sitä mieltä, että täysautomaatio on hyvä tavoite. Nyt olemme päätyneet siihen, että puoliautomaatio voi olla iso kehityslinja. Uutisrobotiikkaa pitää ajatella siitä näkökulmasta, miten voimme auttaa toimittajia tekemään työnsä paremmin.

Fakta

Tekijä: Helsingin Sanomien toimituspäällikkö Esa Mäkinen
Kokemus: Työskennellyt Helsingin Sanomien toimituspäällikkönä vuodesta 2017. Aiemmin Mäkinen on työskennellyt Helsingin Sanomissa vuodesta 2007 muun muassa toimittajana ja datadeskin vetäjänä. Mäkinen oli Ylioppilaslehden päätoimittaja vuosina 2004–2006.

Tilaa Suomen Lehdistön uutiskirje. Tilaa Suomen Lehdistö.

Kommentit

Tosin minulle uutinen että HS:n äpissä oli digietusivun suosittelu, ja että se oli automaattisesti päällä. Voi hyvinkin olla että monet eivät edes tiedä että sellainen on ja että sen voi ottaa pois päältä.

SS