Puheteknologia kehittyy kovaa vauhtia. Samalla nousee esiin kysymyksiä siitä, onko ihmisten yksityisyyden suoja vaarassa.

Huhtikuussa uutisoitiin, että verkkokauppajätti Amazonilla on tuhansia työntekijöitä kuuntelemassa yhtiön Echo-älykaiutinten keräämiä tallenteita. Tällä on tarkoitus parantaa kaiuttimen puheentunnistusta.

Amazon Alexan, Applen iOS-laitteiden Sirin ja Google Assistantin kaltaiset puheentunnistuksella toimivat sovellukset ovat herättäneet jo aiemmin huolta siitä, että ihmisiä kuunnellaan salaa.

Aalto-yliopistossa automaattista puheentunnistusta tutkiva professori Mikko Kurimo ei pidä tätä teoriassa mahdottomana mutta muistuttaa realiteeteista.

– Dataa on niin valtavasti, että on mahdotonta kuunnella kaikkea.

Kurimo huomauttaa, että esimerkiksi jo merkittävä osa Google-hauista tehdään kirjoittamisen sijasta puhehaulla puheentunnistusta hyödyntäen. Tutkimuslaitos ComScore on arvioinut, että vuoteen 2020 mennessä kaikista verkkohauista 50 prosenttia tapahtuu puhehaulla.

Mahdollistavaa teknologiaa

Kurimo tiivistää puheteknologian kolmella tapaa. Yksi: ihminen puhuu ja kone ymmärtää häntä. Kaksi: kone pyrkii tulkitsemaan ihmisten välistä puhetta. Kolme: kone puhuu eli tuottaa synteettistä puhetta.

Turun yliopiston Tulevaisuuden teknologioiden laitoksen apulaisprofessori ja kieliteknologiaryhmän vetäjä Filip Ginter kutsuu puheteknologiaa mahdollistavaksi teknologiaksi. Esimerkiksi puhetta tuottavan navigaattorin voi katsoa parantavan autoilijan turvallisuutta. Puheteknologia on myös kriittinen apu esimerkiksi kuulo- ja näkövammaisille.

Tutkijat uskovat, että tulevaisuudessa teknologia valjastetaan entistä voimakkaammin avuksi tilanteisiin, joissa henkilöt eivät puhu samaa kieltä.

– On jo olemassa ensimmäisiä sovelluksia, joiden avulla ihmiset, joilla ei ole yhteistä kieltä, pystyvät keskustelemaan keskenään, Ginter kertoo.

Toisaalta pelottavimmasta päästä ovat skenaariot siitä, että puheteknologiaa käytetään toisen ihmisen äänen matkimiseen. Ginterin mukaan tällaista on jo nähty.

Ginter pitää puheteknologian haasteena sitä, että sen opettamiseen tarvitaan suuret määrät litteroitua puhedataa eli opetusaineistoa. Iso kysymys on, kuinka aineisto kerätään ja litteroidaan.

– Päättäjien olisi tärkeää ymmärtää, että harjoitusdatan kerääminen on iso urakka. Pienet, yksittäiset yritykset eivät pysty siihen yksin. Olisi etsittävä rahoitus- ja yhteistyömuotoja, miten sitä voidaan tukea. Yhteistyö yliopistojen kanssa on oleellista.

Mikko Kurimon mukaan Suomessa on käynnissä joitakin aloitteita siitä, että dataa kerättäisiin yhdessä.

Aina on mahdollista, että joku kuuntelee

Onko huoli salakuuntelusta turhaa? Kurimon ja Ginterin mielestä ei, mutta he myös arvioivat, että riskejä helposti liioitellaan.

Riskien kannalta on merkitystä, tietävätkö ihmiset mikrofoneista.

– En ole varma, ymmärtävätkö esimerkiksi kaikki uuden äly-tv:n ostajat, että siinä on hyvä mikrofoni. Laitteet ovat nykyään puheohjattavia, joten tv:tä voisi myös kuunnella. Voisi kuvitella, että monelle ei tule asia edes mieleen eikä muutenkaan täysin hallita sitä, mitä kaikkea netissä kiinni oleva laite tekee, Ginter pohtii.

Hänen mielestään on olennaista olla tietoinen siitä, että jokin mikrofonilla varustettu laite voi ainakin teoriassa kuunnella. Toinen kysymys on, kiinnostaako ketään kuunnella juuri sinua?

– Sillä on väliä, kuunteleeko jonkin sovelluksen algoritmi, josta olen tietoinen, vai kuunteleeko ihminen. Salaa ei saisi kuunnella koskaan, Ginter painottaa.

Mikko Kurimo vertaa puheteknologiaa kameroihin. Kuinka huolissaan ihmiset ovat siitä, että esimerkiksi kodinkoneissa olevat kamerat kuvaavat heitä salaa?

– Videokuva on jopa yksityisempi kuin ääni, Kurimo huomauttaa.

Oma yksityisyys asetetaan tietyllä tapaa alttiiksi vaaroille myös hakukoneita käyttäessä, kun vastauksia haetaan muun muassa erilaisiin terveyskysymyksiin.

Eroaako puhe henkilötiedoista?

Tutkijat ovat yhtä mieltä siitä, että jonkinlaista sääntelyä tarvitaan. Filip Ginter katsoo, etteivät kovin rajoittavat kiellot kuitenkaan toimi.

Hän pitää tärkeänä, että lainsäädäntö velvoittaa yritykset kertomaan kuluttajille laitteen mikrofonista sekä kuuntelun ja äänen tallentamisen mahdollisuudesta. Jokaisen pitäisi pystyä päättämään itse, antaako luvan kuuntelulle ja tietojen keräämiselle.

– Vähän kuin tietosuoja-asetus GDPR – yllättävän paljon on sallittu, kunhan ihminen antaa suostumuksen henkilötietojensa keräämiseen.

Ihmisten suostumusta tietojen tallentamiselle edellyttää myös julkisoikeuden professori Susanna Lindroos-Hovinheimo Helsingin yliopistosta. Hänkin viittaa EU:n laajuiseen tietosuojasääntelyyn.

– Suostumuksen kysyminen on yritykselle tapa varmistaa, että tietoja voi kerätä ja tallentaa. Ihmisellä pitäisi olla oikeus myös kieltää se, Lindroos-Hovinheimo sanoo.

Jos ihmisestä kerätään jotakin sellaista tietoa, josta hänet voi tunnistaa, on kyseessä lain mukaan suojattava henkilötieto. Tällaisia tietoja ei saa pääsääntöisesti kerätä, ellei sille ole laissa säädettyä perustetta. Lindroos-Hovinheimon mukaan oikeudellinen ongelma on paljon pienempi, jos yksilöä ei voi tunnistaa tiedoista.

Professorin mielestä voidaan kysyä, onko puhe jotenkin erityistä henkilötietoa verrattuna esimerkiksi nimeen, sosiaaliturvatunnukseen tai kuvaan. Hän ei näe juridisesti eroa sillä, onko tieto kirjoitettua vai puhuttua. Puheen sisältö ratkaisee, onko se tulkittavissa arkaluontoiseksi.

Suomen rikoslaki kieltää salakuuntelun yksityisyyden suojaan nojaten.

– Oikeudelliseen arviointiin vaikuttaa se, kuka kuuntelee, miten, mihin tarkoitukseen ja kauanko tietoja säilytetään. Näitä pitää katsoa aina tapauskohtaisesti, Lindroos-Hovinheimo korostaa.

Sääntelyssä säilytettävä tasapaino

Ihmisten yksityisyyttä on suojattu Suomessa lainsäädännöllä jo vuosikymmeniä. Pitääkö yksityisyydensuojaa varjella entistä tiukemmin, kun teknologia kehittyy?

– EU:ssa on ollut nähtävissä aika voimakaskin trendi, että teknologinen kehitys on uhka ihmiselle, Lindroos-Hovinheimo arvioi.

Vaikka lainsäätäjillä on vahva intressi suojata kansalaisia, on sääntely samalla tietynlaista kompromissien hakemista. Myös yritysten toimintaedellytykset on turvattava.

Lindroos-Hovinheimon mukaan huomioon on otettu se, että innovaatiot olisivat yhä mahdollisia, data liikkuisi ja EU:ssa toimivat yritykset pystyisivät kilpailemaan Yhdysvaltojen, Intian ja Kiinan kanssa.

– Jos sääntelyä ei uudisteta ja modernisoida, eri toimialoilla toimivat yritykset voivat saada kilpailuetua toisiin nähden. Sääntelyn osalta on pyritty siihen, että kaikille on samat säännöt teknologista huolimatta.

Julkisoikeuden professorin mielestä on loogista, että sääntely on ylikansallista. Esimerkiksi Googlen ja Amazonin kaltaiset verkkojätit toimivat globaalisti. Valtioiden on vaikea puuttua teknologisiin ja oikeudellisiin kysymyksiin yksin.