Tilaa Uutiskirje!

Tanskalainen mediayhtiö Zetland kehitti litterointiin työkalun, joka kääntää puheen tekstiksi myös suomeksi

Zetlandin toimitusjohtaja ei halunnut maksaa toimittajilleen robottityöstä, jota kaikki vieläpä inhosivat. Good Tapen ”moottori” on tekoäly-yhtiö Open AI:n puheentunnistusmalli.

Vuonna 2012 perustettu verkkomediayhtiö Zetland on myös teknologiayhtiö ”niin kuin useimmat mediayhtiöt nykyään”, toimitusjohtaja Tav Klitgaard sanoo. Hänen mukaansa Zetland säästää litterointiohjelmansa avulla jo tuhansia eurojen arvosta työtä kuukaudessa. Kuva: Nicolai Westh
Ajankohtaiset

Haastattelunauhojen litterointi oli työniloa, aikaa ja rahaa syövä työvaihe. Ja asia, josta tanskalaisen verkkomedian Zetlandin toimituksessa voi puhua imperfektissä.

Kun tanskaksi toimivaa työkalua ei löytynyt markkinoilta, Zetland rakensi sellaisen itse. Loppuvuodesta julkaistu Good Tape on toistaiseksi ilmainen ja suunniteltu journalisteille. Se toimii verkkoselaimessa muutaman napin painalluksella.

Tämä voi olla hyvä uutinen myös suomalaistoimituksille.

Good Tape litteroi tekstiä kiinan, espanjan, katalaanin ja kymmenien muiden kielien ohella myös suomeksi.

Zetlandin toimitusjohtaja Tav Klitgaard kertoo, ettei halunnut maksaa toimittajille tunteja vievästä robottityöstä, jota kaikki myös syvästi inhosivat.

– Ongelma litteroinnissa on ollut, että se on toiminut lähinnä vain englanniksi ja saksaksi ja ohjelmat ovat olleet järjettömän kalliita, hän sanoo.

”Good Tapen laatu ei johdu siitä, että olemme tekoälyvelhoja, vaan siitä, että Whisperin malli on sen moottori.”

Good Tape toimii Klitgaardin mukaan tanskaksi jo niin hyvin, että nauhoituksen voi tehdä jopa kadulla puhelimella, ja litterointi on 95-prosenttisesti oikein.

– Jos tarvitset tarkan sitaatin, täytyy ehkä vielä kuunnella se kohta. Siinä säästyy silti valtavasti aikaa.

Suomen Lehdistö testasi Good Tapea suomeksi. Se litteroi studiossa äänitetyn podcast-nauhoituksen lähes virheettömästi, tosin ei sanatarkasti. Aikaleimojen avulla epäselvät kohdat on helppo tarkistaa.

Toisella testinauhalla oli iPhonella äänitetty äänenlaadultaan huonompi haastattelu. Sen Good Tape litteroi merkittävästi kehnommin, ja paikoin tekstistä oli vaikea päästä kiinni edes puhuttuihin teemoihin.

Klitgaard arvioi, että toistaiseksi malli toimii heikommin suomeksi kuin tanskaksi: suomeksi noin 90 prosenttia tekstistä litteroituu oikein, mutta äänenlaatu vaikuttaa.

Nyt Zetland kerää palautetta myös suomalaisilta käyttäjiltä. Tarkoitus on opettaa mallia.   

Good Tapen pohjalla on Whisper AI, joka on muun muassa jutustelevasta tekoälystään ChatGPT:stä tunnetun Open AI:n malli automaattiseen puheentunnistukseen. Whisper AI on kuitenkin avoimen lähdekoodin malli, eli kuka tahansa voi kehittää ja kopioida sitä.

– Good Tapen laatu ei johdu siitä, että olemme tekoälyvelhoja, vaan siitä, että Whisperin malli on sen moottori, Klitgaard sanoo.

Hänen mukaansa pohjoismaiset kielet ovat Zetlandin huomion kohteena, sillä muu maailma ei varsinaisesti ole kiinnostunut niistä.

”Jos toimittajat käyttävät tätä työkalua, ehkä he ehtivät ajatella jutun kulmaa hieman pidempään tai soittaa vielä yhdelle lähteelle.”

Litterointityökalujen käytön kompastuskiviä tähän saakka ovat olleet suomen kielellä toimivan ohjelman puutteen lisäksi turvallisuus, kuten lähdesuojan huomioiminen.

Miksi siis luottaa Good Tapeen?

Tav Klitgaardin mukaan ennen kaikkea siksi, että Good Tape on tutkivaa journalismia tekevän mediatalon tuote. Palvelu on myös GDPR-yhteensopiva.

Hänen mukaansa litteroiminen Good Tapella on niin turvallista kuin tiedon kulkeminen pilvipalveluissa ylipäätään voi olla. Data esimerkiksi liikkuu salattuna ja pysyy EU:ssa, ja äänitiedosto tuhotaan heti litteroinnin jälkeen. Salauskäytännöt ovat samankaltaisia kuin Googlen ja Microsoftin pilvipalveluissa.

– Mutta on tärkeää ymmärtää, että sataprosenttista turvaa ei ole, ellei haastatteluja säilytä päänsä sisällä.

Tekijät luonnehtivat Good Tapen turvallisuusosiossa, etteivät he suosittele palvelun käyttöä esimerkiksi henkilöille, jotka raportoivat tiedustelusta.

Tällä hetkellä Good Tape on käyttäjille ilmainen, mutta tulevaisuudessa malli on freemium. Silloin osa lisäominaisuuksista, kuten kenties litterointijonon ohitus parissa minuutissa, maksaa. Myös ammattilaiskäytöstä todennäköisesti tulee maksullista.

– Saattaa kuulostaa hieman pörröiseltä, mutta teemme tätä parantaaksemme journalismia. Se on Zetlandin missio. Jos toimittajat käyttävät tätä työkalua, ehkä he ehtivät ajatella jutun kulmaa hieman pidempään tai soittaa vielä yhdelle lähteelle, Klitgaard sanoo.

Lisää aiheesta

Lehtiarkisto

Tilaa uutiskirje

Varmista, että pysyt kärryillä, ja tilaa Suomen Lehdistön uutiskirje. Viikoittaisessa kirjeessä kerromme media-alan uusista kokeiluista, hyvistä käytännöistä, ilmiöistä ja sen, missä nyt mennään.

Podcast