Fulbright-syksyn puoliväli on käsillä. Alan oivaltaa, että kaiken mahdollisen aihetta liippaavan lukeminen on mahdotonta, ja nyt pitää entistä selkeämmin rajata, mihin käytän loppuajan. Hetkittäin on sellainen olo, että toistaiseksi on ennen kaikkea ehtinyt tajuta sen, miten eri lailla lähtisi työskentelyään järjestämään jos nyt voisi aloittaa syksyn alusta. Arvelen, että en ole ensimmäinen MCPD-stipendiaatti, joka ajattelee näin!
Uuden tiedon löytymisen osalta on sekä hyviä että huonoja signaaleja. Tänään ja eilen olen tavannut muutamia aiheeseeni enemmän perehtyneitä ihmisiä, ja suurin osa heidän vinkkaamistaan lähteista ja tahoista, joihin kannattaisi ottaa yhteyttä oli jo entuudestaan tuttuja. Tämän ainakin haluan tulkita merkiksi siitä, että olen osapuilleen perillä siitä, mitä on meneillään. Toisaalta, törmäsin juuri tänään hyvin sattumanvaraisen Twitter-hortoilun jälkeen tietoon Library of Congressissa järjestetystä koneoppimista kirjastossa käsitelleestä tapaamisesta, joka pidettiin syyskuussa, muutaman päivän sisällä siitä kun itse vierailin kyseisessä kirjastossa. Tapahtumalla ei ilmeisesti ollut verkkosivuja, mutta Google Driveen on kerätty kokoelma esitysdioja kahteen eri settiin, lookbookiin ja lightning talkseihin. Näiden perustavanlaatuinen ero ei taida täysin aueta jos ei ole ollut tilaisuudessa paikalla, mutta joitain kiinnostavia juttuja dioista voi bongata.

Välillä on vaikea määritellä, mikä oikeastaan on kirjastoihin ja tekoälyyn liittyvä asia tai case-esimerkki. Ensinnäkin jo tekoälyn määritelmä on hivenen häilyvä (ei tästä sen enempää, mutta mieleeni juolahti linkata tähän Twitter-klassikkoon). Toisaalta myös kirjasto ja sen kokoelmat eivät ole ihan niin yksiselitteinen asia kuin ennen tänne tuloa ajattelin. Iso osa koneoppimista hyödyntävistä kirjastoalan esimerkkitapauksista Yhdysvalloissa liittyy erityiskokoelmiin (special collections), joita ei samassa mittakaavassa ole suomalaisissa korkeakoulukirjastoissa olemassa. Erityiskokoelmia tuntuu olevan vähän kaiken tyyppisillä kirjastoilla, ei pelkästään suurilla ja tunnetuilla. Alunperin ajattelin, että special collection -termi liittyisi nimenomaan vanhoihin kirjoihin, mutta itse asiassa ne voivat pitää sisällään lähes mitä tahansa: filmejä, erilaisia videoformaatteja, vanhoja kirjoja, pienpainatteita, karttoja ja eilen näkemässäni tapauksessa jopa rekka-autojen pienoismalleja. Taisipa joku mainita, että heidän kokoelmiinsa kuuluu myös (etävarastossa säilytettävät) kengät, joita joku keskeinen henkilö on käyttänyt.

Perussyy sille, että erityiskokoelmia on vähän joka kirjastossa on se, että millään taholla ei ole keskitettyä vastuuta kulttuuriperinnön keräämisestä samaan tapaan kuin eri maissa toimivilla kansalliskirjastoilla tai audiovisuaaliseen aineistoihin keskittyvillä instituutioilla. Osa erityiskokoelmista voi liittyä esimerkiksi kampusalueen historiaan tai yliopiston kotikaupunkiin, mikä kuulostaa varsin loogiselta ja tämän tyyppisiä kokoelmia tiedän Suomessakin olevan. Erikoiskokoelmien säilyttämisen tehdään myös jonkinlaista työnjakoa eri kirjastojen välillä. Välillä kokoelmat tuntuvat hieman sattumanvaraisilta ja perustuvat yksittäisten tahojen lahjoituksiin tai työhön kokoelman saamiseksi kyseiseen kirjastoon. University of Marylandissa on maailmanlaajuisestikin harvinaisen kattava kokoelma japanilaisia julkaisuja toisen maailmansodan jälkeisiltä vuosilta, jolloin Japani oli Yhdysvaltojen miehittämä. Myös Japanin kansalliskirjasto arvostaa kokoelmaa ja on osallistunut sen digitointiin (oivalsin muuten vihdoin, että Japanese Diet Library ei suinkaan ole ruoka-alan erityiskirjasto vaan maan kansalliskirjasto!). George Washington Universityssä on puolestaan osana työläishistorian kokoelmia erään ammattikuskien ammattiliiton nimikkokokoelma, joka sisältää muun muassa edellä mainitsemani rekka-autojen pienoismallit.

Monessa tapauksessa kirjastojen konferensseissa ja muualla esittelemät koneoppimiskokeilut liittyvät työhön erityiskokoelmien parissa, esimerkiksi valokuvien tai videokuvien tunnistukseen. Yleisemmällä tasolla erityiskokoelmien kanssa tehdään erilaisia kokeiluja, koska niitä halutaan tuoda entistä vahvemmin osaksi opetusta ja varmasti myös siksi, että ne ovat uniikkeja kokoelmia, joihin liittyvä data lienee kirjastojen omassa hallussa. Sinänsä kokeilut vaikkapa juuri kuvantunnistuksen kanssa eivät yllätä, mutta itse en ainakaan ennen tänne tuloani mieltänyt tällaisten kokeilujen olevan osa juuri korkeakoulukirjaston toimintaa.