Euroopan unioni Vipuvoimaa EU:lta

Euroopan aluekehitysrahaston (EAKR) rahoittaman hankkeen kuvaus

1 Hanke

Hankekoodi: A71219

Hankkeen nimi: Digitaalisen tiedonhallinnan tutkimus- ja kehittämiskeskus - Digitalia

Toimintalinja: 2. Uusimman tiedon ja osaamisen tuottaminen ja hyödyntäminen

Erityistavoite: 4.1. Tutkimus-, osaamis- ja innovaatiokeskittymien kehittäminen alueellisten vahvuuksien pohjalta

Suunnitelman mukainen toteutusaika: Alkaa 1.5.2015 ja päättyy 31.7.2017

Toiminnan tila: Toiminta päättynyt

Vastuuviranomainen: Etelä-Savon maakuntaliitto

2 Hakijan perustiedot

Hakijan virallinen nimi: Kaakkois-Suomen Ammattikorkeakoulu Oy

Organisaatiotyyppi: Ammattikorkeakoulu

Y-tunnus: 2472908-2

Jakeluosoite: Patteristonkatu 3D

Puhelinnumero: 01535561

Postinumero: 50100

Postitoimipaikka: Mikkeli

WWW-osoite: http://www.xamk.fi

Hankkeen yhteyshenkilön nimi: TALSI NOORA MAARIT

Yhteyshenkilön asema hakijaorganisaatiossa: tutkimusjohtaja

Yhteyshenkilön sähköpostisoite: noora.talsi(at)mamk.fi

Yhteyshenkilön puhelinnumero: 0406485020

Hakijoiden lukumäärä tai tuen siirto -menettely:

Osatoteuttajat

3 Suunnitelman mukainen tiivistelmä toteutuksesta

Hankkeen tavoitteena on perustaa Mikkeliin Digitaalisen tiedonhallinnan tutkimus- ja kehittämiskeskus. Tämä kaksivuotinen hanke on keskuksen perustamisen ensimmäinen vaihe. Hanke pohjautuu Mikkelin ammattikorkeakoulun (Mamk) ja Helsingin yliopiston Kansalliskirjaston Digitointi- ja konservointikeskuksen tutkimus- ja kehitystyöhön. Lisäksi yhteistyötä on tehty mm. Mikkelin yliopistokeskuksen ja Elinkeinoelämän keskusarkiston kanssa. Tutkimus- ja kehittämiskeskus tukee sekä toimijoiden tavoitteita että Etelä-Savon maakuntaohjelman älykkään erikoistumisen strategiaa. Perustettava keskus on kansallisesti ja kansainvälisesti merkittävä edustaen digitaalista kärkiosaamista maakunnassa.

Tutkimus- ja kehittämiskeskus syventää osaamista digitaalisessa tiedon hallinnassa ja säilyttämisessä. Hankkeessa on kaksi tutkimusaluetta: 1) datasta tiedoksi ja tieto käyttöön sekä 2) digitaalisen säilyttämisen menetelmät ja välineet. Lisäksi hankkeeseen kuuluu olennaisesti 3) verkosto- ja kumppaniyhteistyö. Mamk toteuttaa kaikkia kolmea kokonaisuutta. Kansalliskirjaston Digitointi- ja konservointikeskus osallistuu ensimmäiseen tutkimusalueeseen ja verkostoyhteistyöhön. Kokonaisuudet ovat avattuna tarkemmin alla.

1) Ensimmäinen tutkimusalue tuottaa tiedonhallinnan ja -keruun menetelmiä ja työkaluja erityyppisille toimijoille. Esimerkiksi organisaation toiminnassa syntynyt data voidaan muuttaa ymmärrettäväksi ja hyvin kuvailluksi tiedoksi, jonka alkuperä, ominaisuudet ja merkitys tunnetaan. Tällä tavoin suurista datamääristä saadaan esille olennaiset ja tärkeät asiat – ja data muuttuu tiedoksi. Tietomäärät, jotka ovat mahdottomia käsitellä ihmisvoimin, pystytään hallitsemaan ja saattamaan hyödynnettävään muotoon hankkeessa kehitettävillä älykkäillä ja oppivilla digitaalisilla ratkaisuilla. Kehitettävät ratkaisut perustuvat mm. automaattiseen tiedon keruuseen, luokitteluun ja rikastamiseen. Tutkimus- ja kehitystoiminta tukee organisaation toiminnan digitalisoitumista, kun jalostettua tietoa voidaan hyödyntää mm. jakamalla, visualisoimalla ja analysoimalla. Lisäksi tutkimusalueella kartoitetaan keinoja, joilla kansalaiset ja pienyritykset voivat hallita omaa ja itseään koskevaa digitaalista tietoaan.

Kansalliskirjaston Digitointi- ja konservointikeskus tuottaa hankkeessa tutkimustietoa ja sovelluksia suurten tietomäärien käsittelyyn. Tutkimusta johtaa Kansalliskirjaston ja Helsingin yliopiston digitaalisten aineistojen tutkimuksen professori. Hankkeessa käytetään tilastotieteellistä koneoppimista laajojen aineistojen käsittelyyn ja jalostamiseen sekä kehitetään artikkeleiden poimintaa digitoidusta, miljoonien sivujen lehtiaineistosta. Tuloksina syntyy myös artikkelien referoinnin tai käännösteknologian pilotteja, tekstinlouhinnan tutkimusta sekä opetussisältöjä ja opinnäytetöitä Mamkille. Lisäksi tutkimustyö helpottaa kansalaisten ja tutkijoiden pääsyä digitoituihin aineistoihin ja lisää hakumahdollisuuksia niiden käytössä.

2) Toinen tutkimusalue varmistaa, että tuotettu ja käyttöön saatettu tieto säilyy käytettävissä ja on luotettavaa. Etenkin digitaalinen pitkäaikaissäilyttäminen vaatii säilytysmedioiden, tiedostomuotojen ja säilytysalustojen tutkimusta ja testausta. Tutkimusalueessa selvitetään mm. digitaalisen tiedon siirtämistä vanhentuneilta alustoilta ja medioilta seuraaville säilytysratkaisuille, eli tehdään migraatiotutkimusta. Ajankohtaisena tutkimuskohteena ovat pilvipalveluiden ja muiden hajautettujen ratkaisujen käyttö säilyttämisessä ja niiden riskien hallinta. Tutkimusalue tuottaa selvityksiä ja tutkimustietoa tiedostomuotojen ja medioiden hallinnasta, migraatioprosesseista ja -strategiasta sekä erilaisista pitkäkestoiseen sähköiseen säilyttämiseen tarkoitetuista alustoista.

3) Kolmas toiminta-alue kattaa pilotoinnin, kansallisen ja kansainvälisen verkostoyhteistyön, vaikuttavuuden lisäämisen sekä projektihallinnon. Kumppani-, kehitys- ja tutkimusverkostot mahdollistavat tulosten pilotoinnin, hyödynnettävyyden ja ovat olennainen osa tutkimustiedon vaihtoa mm. Helsingin yliopiston ja Aalto-yliopiston, kieliteknologian alan FIN-CLARIN-konsortion, Mikkelin yliopistokeskuksen ja ammattikorkeakoulujen kanssa. Hanketoimijat osallistuvat kansainvälisiin tapahtumiin, joissa esitellään projektia ja siinä tehtyä tutkimus- ja kehitystyötä. Lisäksi hankkeessa varmistetaan osallistuminen digitaalisen tiedonhallinnan kansainvälisiin hankkeisiin. Myös Etelä-Savossa järjestetään kansainvälisiä toimialaan liittyviä tapahtumia.
Hankkeessa perustettava tutkimus- ja kehittämiskeskus yhdistää Mamkin ja Kansalliskirjaston Digitointi- ja konservointikeskuksen osaamista, asiantuntijoita sekä tutkimusta. Keskus kehittää alueen vahvuuksia ja toimintojen yhteistä koordinointia.

Hankkeen jälkeen keskuksen tavoitteena on luoda uutta ja yhteistä hanke- ja innovaatiotoimintaa. Hankkeessa tuotettava tieto hyödyttää alueen osaavia ja erikoistuneita pienyrityksiä sekä muistiorganisaatioita, joita ovat esimerkiksi arkistot, kirjastot ja museot. Lisäksi tuotettu tieto hyödyttää julkista sektoria ja järjestö- ja yhdistystoimintaa. Hanke tuottaa näille tahoille soveltuvia keinoja sähköiseen tiedonhallintaan ja luotettavaan säilyttämiseen. Lisäksi hanke edistää digitaalisen tiedon avaamista, louhimista, saatavuutta ja hyödyntämismahdollisuuksia.

4 Hankkeen kohderyhmät

4.1 Varsinaiset kohderyhmät

Pääasiallisia kohderyhmiä ovat yritykset ja kansalaisyhteiskunta sekä niiden digitaalista aineistoa säilyttävät, käsittelevät, tutkivat ja tarjoavat organisaatiot, kuten muistiorganisaatiot, yritysten tiedonhallintatoimijat ja yksityisarkistot. Mamkin digitaalisen tiedonhallinnan koulutus ja TKI-toiminta.

Alueella toimivat tutkija- ja opiskelijayhteisöt (Mamk) saavat uusinta tietoa tiedonlouhinnasta, koneoppimisesta ja aineiston analysoinnin menetelmistä. Lisäksi tutkijayhteisöt voivat jakaa kokemuksiaan aineistojen käsittelystä yhteisissä seminaareissa ja muissa tapaamisissa. Tiedonvaihtoa ja yhteistyötä voidaan tehdä kansallisten tutkijayhteisöjen, esim. kieliteknologian, tietojenkäsittelytieteen ja Digital Humanities –tutkijaverkoston ja kansainvälisten yhteisöjen kanssa.

Digitoitujen sanoma- ja aikakauslehtiaineistojen nykyiset käyttäjät ovat esimerkiksi tutkijoita, sukututkijoita, senioreita, opiskelijoita, koululaisia ja harrasteryhmiä. He saavat hankkeen tuloksena mm. parempia hakupalveluja aineistoihin. Käyttäjätilastot osoittavat, että Kansalliskirjaston digitoituja sanoma- ja aikakauslehtiä käytetään Mikkelissä yhtä paljon kuin Mikkeliä kokoluokkaa suuremmissa kaupungeissa Suomessa. Palvelua käytetään ympäri Suomen. Koti- ja ulkomainen käyttö oli v. 2014 noin yhteensä 10,7 miljoonaa sivulatausta.

4.2 Välilliset kohderyhmät

- Kansalaiset, kansalaisyhteiskunnan ja yritysten toiminnasta kiinnostuneet tutkijat
- Digitaalisen tiedon kulttuuriseen ja yritystoimintaan liittyvät uudelleenkäyttäjät
- Tiedotusvälineet
- Harrastustoiminta ja viihdekäyttö
- DigitalMikkelin toimijat
- Mikkelin kaupunki
- Etelä-Savon alue
- Kansalliskirjaston Digitointikeskuksen Aviisi-hankkeen lehtitalot Länsi-Savo ja Maaseudun Tulevaisuus.

5 Projektin julkinen rahoitus, euroa

Myönnetty EU- ja valtion rahoitus: 706 773

Toteutunut EU- ja valtion rahoitus: 676 222

Suunniteltu julkinen rahoitus yhteensä: 1 177 955

Toteutunut julkinen rahoitus yhteensä: 1 132 149

6 Maantieteellinen kohdealue

Maakunnat: Etelä-Savo

Seutukunnat: Mikkelin

Kunnat: Mäntyharju, Hirvensalmi, Pertunmaa, Kangasniemi, Puumala, Mikkeli

Toteutuspaikan osoite, jos hanke toteutetaan yhdessä paikassa

Jakeluosoite:

Postinumero:

Postitoimipaikka:

7 Hakemusvaiheessa ilmoitettavat arviot hankekohtaisista seurantiedoista

7.1 Uusien työpaikkojen määrä (kysytään vain erityistavoitteisiin 1.1, 2.1 ja 3.1 kuuluvissa hankkeissa)

Suunniteltu: 7, joihin työllistyvät naiset 3

Toteutunut seurantatietojen mukaan: 0.00, joihin työllistyvät naiset 0.00

7.2 Uusien yritysten määrä (kysytään vain erityistavoitteeseen 1.1 kuuluvissa hankkeissa)

Suunniteltu: 0, joista naisten perustamia 0

Toteutunut seurantatietojen mukaan: 0.00, joista naisten perustamia 0.00

8 Horisontaaliset periaatteet

8.1 Sukupuolten tasa-arvo

Hankkeessa on tehty toimintaympäristön analyysi sukupuolinäkökulmasta: Kyllä
Hankkeen vaikutuksia sen tutkimus- ja kehittämiskohteissa tullaan arvioimaan useista näkökulmista huomioiden myös esimerkiksi sukupuoleen, ikään, alueellisuuteen ja koulutustaustaan liittyvät kysymykset. Hankkeessa noudatetaan Mikkelin ammattikorkeakoulun ja Helsingin yliopiston sukupuolten tasa-arvosta ja valtavirtaistamisesta annettuja periaatteita.
Sukupuolinäkökulma on huomioitu hankkeen toiminnassa (valtavirtaistaminen): Kyllä
Hankkeessa toteutetaan sukupuolisensitiivisiä käytäntöjä ja huomioidaan valtavirtaistamisen periaatteet.
Hankkeen päätavoite on sukupuolten tasa-arvon edistäminen: Ei
Hankkeen päätavoitteena ei ole sukupuolten tasa-arvon edistäminen.

8.2 Kestävä kehitys

VälitönVälillinen
Ekologinen kestävyys
Luonnonvarojen käytön kestävyys 0 5
Tuotteiden ja palveluiden digitalisoituminen sekä aineistojen digitoiminen edistää vähähiilisyyttää ja luonnovarojen kestävää käyttöä.
Ilmastonmuutoksen aiheuttamien riskien vähentäminen 0 5
Tuotteiden ja palveluiden digitalisoituminen sekä aineistojen digitoiminen edistää vähähiilisyyttää ja luonnovarojen kestävää käyttöä.
Kasvillisuus, eliöt ja luonnon monimuotoisuus 0 0
Pinta- ja pohjavedet, maaperä sekä ilma (ja kasvihuonekaasujen väheneminen) 0 0
Natura 2000 -ohjelman kohteet 0 0
Taloudellinen kestävyys
Materiaalit ja jätteet 0 0
Uusiutuvien energialähteiden käyttö 0 0
Paikallisen elinkeinorakenteen kestävä kehittäminen 6 0
Tutkimus- ja kehittämistoiminta tukee paikallisia mikro- ja pk-yrityksiä digitaalisen liiketoiminnan kehittämisessä.
Aineettomien tuotteiden ja palvelujen kehittäminen 8 0
Hankkeessa edistetään digitaalisten tuotteiden ja palveluiden kehittämistä.
Liikkuminen ja logistiikka 0 5
Digitaalisten aineistojen tarjoaminen vähentää ihmisten tarvetta liikkua tiedon perässä ja vähentää aineistojen vastaanottoon tarvittavaa logistiikkaa.
Sosiaalinen ja kulttuurinen kestävyys sekä yhdenvertaisuus
Hyvinvoinnin edistäminen 7 0
Hanke edistää hyvinvointia tarjoamalla tietoa ja elämyksiä digitaalisten palveluiden kautta.
Tasa-arvon edistäminen 7 0
Hanke edistää tasa-arvoisia mahdollisuuksia ja yhdenvertaisuutta koskien digitaalisten aineistojen saavutettavuutta.
Yhteiskunnallinen ja kulttuurinen yhdenvertaisuus 7 0
Hanke edistää tasa-arvoisia mahdollisuuksia ja yhdenvertaisuutta koskien digitaalisten aineistojen saavutettavuutta.
Kulttuuriympäristö 8 0
Hanke digitalisoi, jakaa ja tallentaa kulttuuriympäristöä koskevaa tietoa.
Ympäristöosaaminen 0 0

9 Loppuraportin tiivistelmä

Tieto on yhä useammin peruskivi, jolle organisaatioiden menestys ja arvon luominen rakentuu. Hyödymme digitaalisuudesta vain jos osaamme hyödyntää digitaalista tietoa mielekkäällä ja tehokkaalla tavalla.

Hankkeessa perustettiin Mikkeliin Digitaalisen tiedonhallinnan tutkimus- ja kehittämiskeskus Digitalia, josta on tullut kansallisesti ja kansainvälisesti merkittävä toimija. Keskus edustaa digitaalista kärkiosaamista maakunnassa. Digitaalisen tiedonhallinnan tutkimus ja kehitys edellyttää monialaista yhteistyötä ja muun muassa humanististen tieteiden, tietotekniikan ja kirjastoalan osaamista, joita Digitalia tarjoaa.

Digitalia edistää digitaalisten tietoaineistojen avaamista, louhimista, saatavuutta ja hyödyntämismahdollisuuksia. Digitaalisia aineistomassoja ei voida käsitellä ihmisvoimin. Tarvitaan automatisoituja, älykkäitä ja oppivia ratkaisuja.

Hankkeen myötä Digitaliasta on tullut haluttu yhteistyökumppani ja sillanrakentaja, joka yhdistää digitaalisen tiedonhallinnan, arkistoinnin ja aineistojen käytön kehittämisestä kiinnostuneita toimijoita. Hankkeen kohderyhmiä olivat erityisesti muistiorganisaatiot (arkistot, kirjastot), koulutus- ja tutkimusorganisaatiot sekä eri tieteenaloilla toimivat tutkijat, sukututkijat ja kansalaiset.

Hankkeessa rakennettiin aktiivisesti kumppanuusverkostoja. Tärkeitä kansainvälisiä yhteistyökumppaneita ovat eurooppalainen tiedonhallinnan ja arkistoinnin yhteistyöfoorumi DLM-forum, Stanfordin yliopiston kirjasto sekä digitaalista arkistointia kehittävä E-Ark -konsortio. Kotimaassa yhteistyötä tehtiin muun muassa Päivälehden arkiston ja Helsingin kaupunginarkiston kanssa. Digitalia on digitaalisen humanismin keskuksen HELDIGin etäpiste ja yhteistyökumppani Mikkelissä. Verkostoituminen digitaalisen humanismin kansallisten ja kansainvälisten osaajien kesken on vahvaa, mikä tarjoaa jatkossa pohjaa mm. eurooppalaisiin alan hankkeisiin osallistumiseen.

Hankkeen asiantuntijat vastasivat työpakettien toteuttamisesta ja hankkeessa tuotetun tiedon levittämisestä. Hankkeen tuloksena syntyi 49 julkaisua, joista noin puolet kansainvälisiä julkaisuja. Digitalia piti useita asiantuntijapuheenvuoroja seminaareissa. Lisäksi järjestettiin tapahtumia yhteistyökumppaneille ja suurelle yleisölle.

Tapahtumista voidaan nostaa esille digitaalisen tiedon kesäkoulun konseptin luominen ja ensimmäinen kesäkoulu elokuussa 2016. Toteutus on ainutlaatuinen Suomessa ja toi alan uusimman tiedon niin ammattilaisten kuin opiskelijoiden saataville. Kesäkoulu sai osallistujilta hyvää palautetta yleisarvosanan ollessa 3,9 / 5.

Xamkissa avoimen lähdekoodin arkistoratkaisua pilotoitiin kansalaiskäytössä ja testattiin ratkaisun soveltuvuutta henkilökohtaisen aineiston säilyttämiseen (Kansalaisarkisto). Pdf-asiakirjojen käytettävyyttä parannettiin automaattisen pilkonnan avulla. Pilottiaineistona pilkottiin ja tuotiin käyttöön Helsingin kaupunginarkistossa olevat kaupunginvaltuuston esityslistat ja mietinnöt. Lisäksi tuotettiin automatisoitu työnkulku, jolla Outlookin sähköpostikansiot muuntuvat automaattisesti ja nopeasti arkistokelpoiseen ja laitteistoriippumattomaan esitysmuotoon. Ratkaisulle on ollut kysyntää sekä kotimaassa että kansainvälisesti. Muunnoksen yhteydessä mahdollistettiin ja demottiin sähköposteista rakentuvien keskusteluverkostojen analyysia koostamalla metatietoa sovellusten käyttöön. Verkostoanalyysista tuotettiin demo Päivälehden arkistolle.

Kansalliskirjaston digitoidut lehdet tarjoavat tutkimukselle ja kansalaisille laajan ja monipuolisen aineiston. Hankkeessa parannettiin aineiston käytettävyyttä ja rikastettiin materiaalia. Tutkimustulokset siirtyvät vaiheittain käyttöön esimerkiksi nimien tunnistamisen hyödyntämisessä. Tuloksena oli digitaalisten aineistojen käyttäjien konkreettisen palvelun paraneminen. Lisäksi digitoitujen sanomalehtien ja aikakauslehtien palvelun käyttöliittymää kehitettiin tutkimuksen mukaisesti. Sukututkijoiden ja tutkijoiden työtä helpottaa digitaalisten lehtien tekstin tarjoaminen kopioitavassa muodossa sekä automaattinen lähdeviite.

Hanke kehitti hankeosapuolten verkosto-osaamista, tietojohtamisen osaamista ja valmiuksia laajojen ja monimutkaisten hankekokonaisuuksien hallintaan. Tietämys ja osaaminen sähköisten asiakirjojen ja aineistojen käsittelystä, säilyttämisestä ja hyödyntämisestä on syventynyt, samoin kuin ymmärrys asiakastarpeista näiden kehittämisessä. Koko Etelä-Savon alueen osaaminen vahvistui mm. koneoppimisen ja tekstinlouhinnan alalla.

Hankkeen tuloksena digitaalisten aineistojen saatavuus ja hyödyntämismahdollisuudet esimerkiksi tutkimustarkoituksiin ovat aiempaa paremmat. Palaute yhteistyökumppaneilta osoitti, että Digitalian tuottamista ratkaisuista on ollut konkreettista hyötyä ja ne ovat lisänneet mahdollisuuksia hyödyntää aineistoja.