Sulje

Suomessa kehitetään omaa uutisrobottia

• Sillä aikaa kun robotti etsii väsymättä verkosta aiheita, kerää tietoja ja kirjoittaa pikku-uutisen onnettomuudesta, toimittaja voi keskittyä vaikeisiin aiheisiin. Näin visioivat automaattisen uutisnenän kehittäjät.

 

Toimittaja, eikö sinulle ole suotu uutisnenää? Ei hätää, usean yliopiston ja yrityksen voimin kehitellään koneellista uutisvainua.

Kyse ei ole Stats Monkey -robotista, joka jo kirjoittaa baseball-uutisia rapakon takana tilastojen ja numeerisen aineiston pohjalta.

Viestintäalan yhteisessä Next Media -hankkeessa kehitetään konetta, joka seuloo uutisaiheita ja -lähteitä rakenteettomasta datasta, kuten sosiaalisen median ja keskustelupalstojen tekstimassasta ja kuvista. Visio on, että kone myöhemmin myös kirjoittaa pikku-uutisia esimerkiksi onnettomuuksista.

Kuulostaa scifiltä.

 

Huteja ja paikallisuutisia

Dosentti Juhani Huovelin Helsingin yliopiston fysiikan laitokselta on ollut mukana kehittämässä viranomaisille välineitä löytää terroritekojen valmistelijoita verkosta.

Nyt tehtävä on vaikeampi: sen sijaan että seurattaisiin tiettyjä aiheita, koneelle yritetään opettaa, mikä tekstimassassa on uutisarvoista.

– Uutiskoneen fiksuus on, että se löytää poikkeamat tavanomaisista puheenaiheista, Huovelin pelkistää.

Mekanismi on monimutkainen.

Apuna tutkijoilla on STT-Lehtikuvan arkiston jutut kymmenen vuoden ajalta. Arkiston sanaston avulla kone on opetettu tunnistamaan puheenaiheita ja sanojen välisiä assosiaatioita. Se tietää, mistä on puhuttu viime aikoina ja huomaa uudet aiheet ja sanayhdistelmät.

Kone tarjoaa uutisiksi varmasti paljon huteja.

Mutta se hoksaa, jos eri puolilla sosiaalista mediaa hälistäisiin yhtäkkiä ”Lady Gaga” ja ”Eurokankaassa” tai ”huumeruiskut” ja ”Brahenpuistossa”. Myös ilmiöaiheet kuten karppaus olisi luultavasti koneen avulla löydetty aiemmin.

Erityisen hyvin kone toimii alhaisen uutisriman hyperpaikallisessa journalismissa, johon projektin testialustana toimiva kaupunkilehti Metro on erikoistunut.

Uutiskoneen käyttöliittymää valmistelevan 2Generalin Juha Kauniston mukaan ohjelma voisi auttaa työkaluna myös datajournalismissa.

Sosiaalisen median viestien lisäksi koneeseen voidaan syöttää vaikka säätiedot tai onnettomuustilastot alueittain. Yhdistelemällä tietoja, kuvia ja karttoja syntyisi myös uudenmuotoista journalismia.

 

Testiversio on jo käytössä

Jo tällä hetkellä uutisnenän testiversio haistelee aiheita Helsingin Sanomien ja Metron kaupunkitoimituksessa.

– Mutta ambitiotaso on korkeammalla, siinä että saadaan tehtyä automaattisesti uutisia. Toki siihen on aika paljon matkaa, että toimittaja saa eteensä oikoluettavan tekstin, jonka voi vain hyväksyä, Kaunisto sanoo.

STT:n arkiston avulla Helsingin yliopiston kielitieteilijät luovat perusuutisen malleja, joita kone käyttää kirjoittaessaan. Toimittaja voi tarkistaa robotin käyttämät lähteet ja muokata sen tekstiä.

Automaattisen uutiskoneen kehittämisessä on kuitenkin paljon mutkia.

Yksi suurimmista on se, ettei sosiaalisen median lyhenteitä ja slangia vilisevä kieli vastaa koneelle opetettua suomea.

Puhekieltä käännetään kirjakieleksi joukkoistamalla. Metro.fi:hin linkattuun slangisanakeräimeen on naputettu pari tuhatta käännöstä, mutta lisää tarvitaan.

 

Robotti ei korvaa ihmistä

Ennen kuin kukaan hiillostuu: kyllä biologistakin uutisnenää tarvitaan, ja kipeästi!

Valittujen palojen päätoimittaja Raimo Möysä arvioi joulukuussa Helsingin Sanomissa, että tulevaisuudessa 90 prosenttia uutisista tekee robotti. HS:n kehityspäällikkö Santtu Parkkonen pitää väitettä utopistisena.

– Eihän kone pysty ikinä korvaamaan haastatteluja ja on paljon tietoa, jota se ei saa, Parkkonen sanoo.

Hän vastaa Metro.fi:n kehityksestä ja vetää Next Median hyperlocal-hankeryhmää, jossa uutisnenääkin kehitetään.

Projektin tarkoitus on löytää toimitustyöstä laajemminkin vaiheita, joita voi automatisoida. Tänä vuonna syntyy prototyyppi ohjelmasta, joka tuottaa lehteen tapahtumatiedot rakenteellisesta datasta.

– Toimituksissa on yhä vähemmän resursseja käytössä. Jos esimerkiksi tapahtumatietoja ja perusuutisia voidaan tuottaa automaattisesti, toimittajille jää aikaa keskittyä vaikeisiin uutisiin, joista kukaan ei halua kertoa, Parkkonen sanoo.

> Slangisanakeräin löytyy täältä.

 

Mikä Next Media?

  • Media-alan innovaatioihin, uusiin liiketoimintamalleihin ja -konsepteihin tähtäävä tutkimusohjelma, joka käynnistettiin Viestinnän Keskusliiton aloitteesta.
  • Ohjelmasta haluttiin yritysvetoinen, jotta tieto hyödynnettäisiin tehokkaasti. Next Media on Tieto- ja viestintäteollisuuden tutkimus Tivit Oy:n innovaatio-ohjelma ja sitä koordinoi Sanoma.
  • Next Media keskittyy kolmeen aihepiiriin: julkaisemiseen uusilla alustoilla, hyperpaikalliseen sisältöön ja kuluttajien mediankäytön muutoksiin. Hanke jakautuu kymmeniin osaprojekteihin.
  • Vuosina 2010–2013 hankkeeseen kuluu 34 miljoonaa euroa, joista 70 prosenttia tulee julkisista lähteistä eli Tekesiltä ja tutkimuslaitoksilta ja loput yrityksiltä.
  • Mukana on noin 60 yritystä ja kahdeksan tutkimuslaitosta.
Kommentit

Hei,

Hienoa nähdä että Uutisnenän kaltaiset ideat ovat ottamassa laajemminkin tuulta. Idea uutuusarvoa automaattisesti louhivasta uutismassasta ei ole uusi.

Mm. Oulun yliopistossa on kehitetty TV-ohjelmista automaattisesti uutuusaiheita havaitseva tiedonhallinnan sovellus jo vuonna 2010. Verkossa vuosia pyörinyt koepalvelu löytää ja yhdistelee tietoja erilaisista TV-ohjelmalähetyksistä ja tarjoaa haku ja etsintäpalveluja käyttäjille. Uutispilvi-palvelu näyttää viikoittaisia löydettyjä aiheita TV-uutisista havaittuna ja auttaa ihmisiä havaitsemaan nopeasti mitä asioita televisiossa on ollut esillä.

Tutkimuspalvelua voi käydä kokeilemassa osoitteissa:
http://www.kuukkelitv.fi/mediaseina
http://www.kuukkelitv.fi/uutispilvi

Lisätietoja tutkimuksestamme voi tiedustella osoitteesta
mika piste rautiainen miuku ee piste oulu piste fi

Mika Rautiainen