Dumma datorer är historia

Karisbördige André Mansikkaniemi disputerar i ämnet taligenkänning. Bild: Sofia Westerholm

Allt startade från att han råkade få syn på en annons i en tidning. Nu, över sex år senare, är det äntligen dags för André Mansikkaniemi att disputera i ämnet taligenkänning.

– Jag har alltid varit intresserad av datateknik och kognitiva applikationer, men att det blev doktorandstudier var ändå något av en slump.

André Mansikkaniemi är född och uppvuxen i Karis men bor för tillfället i Esbo. En akademisk karriär var inget han hade planerat men i dag ser han ändå att det akademiska arbetet passar honom mycket bra.

– Jag är lugn och eftertänksam. Självständigt jobb passar mig. Kanske jag innerst inne är något av en nörd, säger Mansikkaniemi roat.

Efter sex års hårt arbete är han nu klar att disputera från Aalto-universitetet i ämnet taligenkänning. Ämnet är ännu rätt okänt i Finland, men kort beskriver Mansikkaniemi taligenkänning som att det handlar om att lära en dator att omvandla tal till text.

– Att känna igen tal och förstå det är inget problem för människan, men en dator måste läras upp att göra det. Det gäller att skapa algoritmer som sedan gör det möjligt för datorn att översätta det talade språket till text.

Utvecklingsutrymme för Finland

Trots att vårt land i många avseenden ligger i spetsen då det gäller teknisk utveckling, finns det fortfarande mycket utrymme för utveckling inom taligenkänning.

– Här finns egentligen endast ett större företag som kommersiellt sysslar med taligenkänning, medan situationen är helt annan i övriga närliggande länder, säger André Mansikkaniemi.

Han säger att de största inom it-branschen, såsom Google och Amazon, starkt satsar på utveckling av taligenkänning.

Så nära som i Stockholm är ämnet också mycket känt och där är utvecklingstakten en helt annan än i Finland.

– Jag tror definitivt att en framtid också finns här, men först måste man inse att detta inte är något att vara rädd för. Det här är ett verktyg, inte något som kommer att ersätta människan.

Att lära en dator avläsa tal och omvandla det till text är enligt Mansikkaniemi ett sätt att förenkla vardagen för vem som helst, men speciellt hörselskadade kan ha stor nytta av det. Med välutvecklade algoritmer kan långa filmer på ett ögonblick få undertexter och på så vis kan även hörselskadade ta del av dem.

– Basen vi har nu är rätt bra, man kan till exempel omvandla enkelt nyhetstal till text. För svårare dialekter och mindre planerat språk behövs ytterligare utveckling för att en dator ska förstå det, säger Mansikkaniemi.

Utlandet lockar

Inför disputationen, i dag, känner Mansikkaniemi sig trygg.

– Nu för tiden är disputationen mer av en formalitet. Avhandlingen granskas på förhand av två förhandsgranskare, så själva disputationstillfället går mest ut på att sitta där och debattera.

Hur framtiden kommer att se ut är något han grubblar mer över.

– I Finland finns inte många företag som satsar på detta. I London och Stockholm är läget helt annat så kanske det blir att åka utomlands, vem vet.

Dagen efter disputationstillfället är dock välplanerad.

– Att över sex års arbete nu är klart ska definitivt firas med en traditionell doktorskaronka i sällskap av släkt, vänner och arbetskamrater. Fast först gäller det väl att överleva själva disputationen, konstaterar André Mansikkaniemi skämtsamt.