Internetistä haetaan päivittäin valtava määrä tietoa. Mitä hyötyä tästä voi olla talouden ennakoimisessa?

Teksti Joona Widgrén, ekonomisti OP Ryhmässä @OP_Ekonomistit
Julkaistu 7.8.2017

Valtaosa tekemistämme internet-hauista liittyy tarpeisiimme tai kiinnostuksen kohteisiimme. Yhdistelemällä näitä yksittäisiä hakuja voidaan saada arvokasta informaatiota ihmisten aikomuksista. Tämä informaatio saattaa olla hyödyllistä talouden ennustamisessa. Esimerkiksi henkilö, jolla on uhka jäädä tai joka on ehkä jo jäänyt työttömäksi, hakee todennäköisesti avoimia työpaikkoja sekä tietoa työttömyyskorvauksen hakemisesta. Kasvu tämänkaltaisten hakusanojen käytössä taas saattaa viitata siihen, että työttömyys on kääntymässä nousuun.

Internet-haut voidaan ajatella ikään kuin eräänlaiseksi kyselyaineistoksi. Erona tavallisiin kyselyihin on kuitenkin se, että aineisto on jatkuvasti saatavilla ilman sen suurempia ponnisteluita. Lisäksi aineiston kerääminen on huomattavasti halvempaa, kun puhelinhaastattelun sijaan, tutkijat voivat keskittyä pohtimaan hakusanoja, jotka kertovat käsiteltävästä ilmiöstä. Internet-haut antavat todennäköisesti myös rehellisempiä vastauksia kuin kyselyt, sillä ihmiset eivät varsinaisesti vastaa kysymyksiin vaan aineisto syntyy muun toiminnan oheistuotteena.

Hakukoneyhtiö Google julkaisee hakuja koskevaa aineistoa Trends palvelussaan. Palvelun avulla käyttäjä pystyy vertailemaan eri hakusanojen suosiota muihin hakusanoihin verrattuna. Palvelu raportoi todellisten hakumäärien sijaan hakusanan suosiosta kertovan indeksin. Hakuja on mahdollista rajata maantieteellisesti koskemaan tiettyä maata, tai joissain maissa myös pienempiä alueita. Palvelun antama indeksi kertoo käyttäjälle hakusanan viikoittaisen tai kuukausittaisen suosion verrattuna muihin tehtyihin hakuihin. Indeksi vaihtelee 0 ja 100 välillä siten, että se saa arvon 100 silloin kuin hakusanan suosio on korkeimmillaan.

Miksi internet-hakuja ei sitten käytetä sen enempää talouden ennakoimiseen? Suurin ongelma lienee sopivien hakusanojen valitseminen. Aina ei ole täysin selvää, miten hakusanojen suosion muutosta tulisi tulkita. Toisaalta kaikkiin ennustettaviin ilmiöihin ei ole edes mahdollista keksiä sopivia hakutermejä kuvaamaan ilmiötä. Lisäksi hakukäyttäytyminen ja siten myös käytettävät hakusanat muuttuvat ajan myötä. Onkin erittäin tärkeää pohtia tarkasteltavan ilmiön ja hakutermien välistä yhteyttä. Esimerkiksi bruttokansantuotteen ennustaminen internethauilla on hyvin vaikeaa. Tuskin mikään hakusana tai hakusanojen yhdistelmä kertoo tuotannon muutoksesta.

Internethakuja on käytetty käytännössä korkeintaan vain hyvin lyhyelle ennustehorisontille. Useimmat aiheeseen liittyvät tutkimukset käsittelevät nykyhetken ennakoimista, eli nowcastingia. Koska viralliset tilastot julkaistaan usein pitkälläkin viiveellä, on reaaliaikaisemman tiedon saaminen erittäin hyödyllistä. Talouden nykytilan tunteminen on erityisen tarpeellista poikkeuksellisissa olosuhteissa, esimerkiksi kriisin aikana.

Internetin hakukoneaineistot on kuitenkin vain yksi esimerkki suurten datamassojen, eli big datan, hyödyntämisestä talouden ennustamisessa ja ennakoimisessa. Esimerkiksi internetin kauppapaikat, kuten Amazon kerää valtavia määriä dataa tuotteiden hinnoista ja niiden kehityksestä. Luottokorttiyhtiöillä taas on massiivinen määrä tietoa ihmisten kulutuksesta. Toistaiseksi valtaosa tästä aineistosta on tutkijoiden ulottumattomissa, mutta avoin data tekee tuloaan, joten uusia aineistoja aukeaa jatkuvasti käyttöön.

Esimerkiksi Etlassa on käynnissä kokeiluja internethakujen käytöstä talouden ennakoimiseksi. www.etla.fi/etlanow-asunnot/

Kirjoittaja Joona Widgrén työskentelee ekonomistina OP Ryhmässä. Hänen kiinnostuksensa kohteita ovat erityisesti data-analyysi sekä makrotalous.