Tiedonhaku ja tekoäly

Tiedonhaku on ydinasioita kirjastotyössä ja olenkin ollut kiinnostunut myös siitä, mitä uusia mahdollisuuksia tekoälyn kehitys tuo tiedonhakuun. Aihe on varsin monitahoinen ja tässä tekstissä pyrin tuomaan esiin joitain näkökulmia enkä niinkään muodostamaan kokonaiskuvaa aiheesta. Kerron myös tekoälyä käyttävästä Yewno Discovery -nimisestä hakutyökalusta, joka ei ole vielä kovin tunnettu Suomessa.

Sen perusteella mitä olen lukenut ja havainnoinut vaikuttaa siltä, että tiedonhaussa siirrytään pois hakusanakeskeisestä ajattelusta. Hakusysteemit pystyvät käsittelemään myös pidempiä tekstejä ja ovat entistä parempia näyttämään yhteyksiä asioiden välillä, joten jatkossa ei ole enää niin tärkeää osata valita juuri ne osuvimmat hakusanat. Perinteinen hakutuloslista vaikuttaa myös saavan haastajia ja hakuun liittyviä käsitteitä ja hakutuloksia ilmaistaan yhä visuaalisemmin ja niin, että eri käsitteiden suhteita on entistä helpompi hahmottaa.

Iris.AI:n exploring-osion aihekartta.

Koneoppiminen tiedonhaussa: se tapahtui jo

Ensin täytyy muistaa, että yhden tekoälyn osa-alueen, koneoppimisen, tuominen kaikista tavallisempiin tiedonhakukanaviin, internetin hakukoneisiin, on tapahtunut jo aikaa sitten. Googlen panostuksista koneoppimiseen on kirjoitettu jo vuonna 2016, jolloin koneoppiminen tai tekoäly eivät olleet samalla tavalla suuren yleisön kiinnostuksen kohteena kuin tällä hetkellä. Search Engine Journal kirjoitti vuoden 2018 alussa jutun yleisellä tasolla siitä, mitä tiedetään koneoppimisen hyödyntämisestä hakukoneissa. Esimerkkeinä käytössä olevista sovellutuksista mainitaan muun muassa kuvahakuun liittyvä kuvientunnistus, mainosten parempi kohdentaminen, käyttäjien aikeiden entistä tehokkaampi tunnistaminen sekä luonnollisen kielen parempi ymmärtäminen esimerkiksi synonyymien ja uusien ilmausten osalta.

Hakukoneiden tekemä personointi lienee jo yleisesti hyvin tiedossa ja siinä voidaan käyttää hyödyksi koneoppimista. Kannattaa kuitenkin muistaa, että eri tiedonhakuympäristöissä termiä personointi voidaan käyttää eri merkityksissä. Huomasin eilen kirjaston hakuliittymästä tietoa hakiessani, että Primon käyttöliittymässä voi valita tulosten personoinnin, joka kuitenkaan ei kuvauksesta päätellen tarkoita sitä, että hakuliittymä oppisi käyttäjän käytöksestä vaan sitä, että käyttäjä voi valita (ja halutessaan myös tallentaa omiin tietoihinsa) tätä ensisijaisesti kiinnostavat tieteenalat. Sinänsä ihan näppärän kuuloinen toiminto!

Tulevaisuuden hakukone on eksploratiivinen

Esimerkkikuva Yewnon tavasta hahmottaa konseptien välisiä suhteita.

Helsingin Yliopiston verkkosivuilla on aikaisemmin tänä vuonna julkaistu kattava uutinen tulevaisuuden hakukoneista. Suomen tieteellisen kirjastoseuran tällä viikolla järjestettävässä 90-vuotisjuhlaseminaarissa kuullaan aiheesta lisää. Juttu avaa hyvin sitä, mitä muuta uutta tekoäly voi tuoda tiedonhakuun kuin personointia tai edistyneempiä kuvahakutoimintoja.

Eksploratiivisuus on yksi uudenlaisten hakukoneiden ominaisuus. Käytännössä se tarkoittaa sitä, että hakukone osaa entistä paremmin tarjota käyttäjälle tietoa, jota tämä ei välttämättä osaa muotoilla tarvitsevansa. Eksploratiiviset hakukoneet myös ryhmittelevät hakutuloksia uudella tavalla, tarjoavat myös haun ulkopuolista tietoa ja ehdottavat uusia hakutermejä käyttäjälle. Myös personointi kehittyy nykyisestä.

Kiinnostava näkökulma edellä linkkaamassani uutisessa oli se, miten Googlen ylivalta vaikuttaa tiedonhaun kehittymiseen ihan yleisellä tasolla. Uudenlaiset hakusysteemit eivät kovin helposti pääse nousemaan suosioon, koska käyttäjät ovat tottuneita Googlen tapaan tehdä tiedonhakua ja odottavat hakutuloslistojen näyttävän samalta kuin Googlessa. Toki Googleenkin tulee uusia ominaisuuksia kaiken aikaa.

Uusia tapoja ja tuotteita tieteellisen tiedon hakuun

Markkinoilla on jo nyt uudenlaisia tuotteita tieteelliseen tiedonhakuun. Olen jo aikaisemmin blogissani maininnut Iris.AI:n, joka tiedän olevan käytössä ainakin muutamissa korkeakoulukirjastossa Suomessa. Täällä Yhdysvalloissa olen törmännyt Yewno Discover -hakupalveluun, joka on käytössä ainakin MIT:n ja Stanfordin kirjastossa ja jälkimmäinen on myös ollut mukana sen kehitystyössä. Tästä artikkelista voit lukea tarkemmin Yewnon syntytarinasta. Yewnoa voi käyttää sen omassa käyttöliittymässä tai sen voi integroida näkymään kirjaston omassa hakuliittymässä.

En tiedä onko eksploratiivisille hakukoneille yksiselitteisiä kriteerejä ja lasketaanko Yewno sellaiseksi, mutta joka tapauksessa Yewnossa tuntuu olevan monia edellä kuvailemiani eksploratiivisen haun ominaisuuksia. Kuuntelemassani Yewnon esittelyssä korostettiin sitä, että palvelu sopii tilanteisiin, jossa käyttäjä ei tarkkaan tiedä mitä etsii ja jossa suoraviivaisen tiedonhaun (search) sijasta on tarve löytää tai keksiä jotain (discover). Yewnossa ei pyritä löytämään yksinkertaisia vastaavuuksia hakutermille vaan tuomaan laajemmin esille konsepteja ja niiden yhteyksiä toisiinsa. Hakutuloksia ryhmitellään miellekarttamaisesti ja kartalla on helppo liikkua termistä toiseen.

Yewnon esittelyvideo Yewnon YouTube-kanavalta.

Iris.AI:ta ja Yewnoa vertaa helposti toisiinsa, koska ne ovat molemmat esimerkkejä tekoälyn hyödyntämisestä tieteellisen tiedon haussa. Palvelut ovat kuitenkin kuitenkin perusajatukseltaan varsin erilaisia. Iris.AI tuntuu keskittyvän vahvemmin perusteellisen tieteellisen tiedonhakuprosessin läpikäymiseen kun taas Yewno on suunniteltu skaalautumaan erilaisille käyttäjille ja tuotetta markkinoidaan myös lukiotason oppilaitoksiin. Palvelut haravoivat myös osin erilaisia sisältöjä. Iris.AI keskittyy nimenomaan open access -aineistoon. Yewnon sisältöihin kuuluu sekä avointa aineistoa että suurten julkaisijoiden aineistoja. Yewnon tuloksista saa linkityksen maksullisiin aineistoihin, jotka kirjastolla on käytössä ja hakuja on mahdollista rajata käsittämään vain aineiston, johon omalla kirjastolla on pääsy.

Iris.AI ja Yewno toimivat molemmat englanniksi, Yewnoa pystyi lisäksi käyttämään ainakin saksaksi ja kiinaksi. Suomen kielen tulo kielivalikoimiin ei taida olla kovin todennäköistä kummankaan palvelun osalta. Yliopistoympäristössä tätä tuskin koetaan ongelmaksi, mutta AMK-kirjaston näkökulmasta mahdollisuus käyttää palvelua myös suomeksi olisi upea lisä. Ainakin itsestäni tuntuu siltä, että juuri eksploratiivisen tyyppistä tiedonhakua olisi helpointa tehdä omalla äidinkielellä. Tutkijoiden osalta voi usein olla, että oman alan terminologia on vähintään yhtä tuttua englanniksi.

Lähivuosina on kiinnostava seurata, kuinka laajasti kirjastot hankkivat käyttöön uudenlaisia hakupalveluita, oli niissä käytetty tekoälyä tai ei. Perinteisesti kirjastot ovat korostaneet sisältöjen hankkimista asiakkailleen, mutta ainakin Iris.AI ja Yewno ovat nimenomaan hakutyökaluja, jotka johdattavat joko avoimeen sisältöön tai kirjaston hankkimiin aineistoihin. Toki tähänkin mennessä kirjastot ovat hankkineet muutakin kuin tietoaineistoja, esimerkiksi viitteidenhallintaohjelmistoja. On myös mahdollista, että suuret julkaisijat tai Google tuovat tässä tekstissä kuvailemani tapaisia hakuominaisuuksia omiin tietokantoihinsa. Tieteellisten julkaisujen avoimen saatavuuden laajeneminen saattaa myös lisätä kirjastojen valmiutta ohjata määrärahoja työkaluihin, jotka tarjoavat uudenlaisia tapoja löytää tietoa.

Leave a Reply

Your email address will not be published. Required fields are marked *