Euroopan unioni Vipuvoimaa EU:lta

Euroopan aluekehitysrahaston (EAKR) rahoittaman hankkeen kuvaus

1 Hanke

Hankekoodi: A76179

Hankkeen nimi: Infrapunaspektroskopiaan perustuva uusi, edullinen ja nopea diagnostinen testi COVID-19:lle ja muille virusinfektioille

Toimintalinja: 2. Uusimman tiedon ja osaamisen tuottaminen ja hyödyntäminen

Erityistavoite: 4.1. Tutkimus-, osaamis- ja innovaatiokeskittymien kehittäminen alueellisten vahvuuksien pohjalta

Suunnitelman mukainen toteutusaika: Alkaa 1.8.2020 ja päättyy 30.4.2022

Toiminnan tila: Toiminta päättynyt

Vastuuviranomainen: Pohjois-Pohjanmaan liitto

2 Hakijan perustiedot

Hakijan virallinen nimi: Oulun Yliopisto

Organisaatiotyyppi: Yliopisto

Y-tunnus: 0245895-5

Jakeluosoite: PL 8000

Puhelinnumero: 0294 48 0000

Postinumero: 90014

Postitoimipaikka: Oulun Yliopisto

WWW-osoite: http://www.oulu.fi

Hankkeen yhteyshenkilön nimi: Saarakkala Simo Jaakko

Yhteyshenkilön asema hakijaorganisaatiossa: Professori, Tieteellinen johtaja

Yhteyshenkilön sähköpostisoite: simo.saarakkala(at)oulu.fi

Yhteyshenkilön puhelinnumero: 0294486002

Hakijoiden lukumäärä tai tuen siirto -menettely:

3 Suunnitelman mukainen tiivistelmä toteutuksesta

Viimeisen neljän vuoden aikana julkaistujen tutkimusten perusteella infrapunaspektroskopia on lupaava menetelmä eri infektioiden tunnistamiseen ihmisen kudos- tai nestenäytteestä. Infrapunaspektroskopiaa on sovellettu mm. hepatiitti B- ja C-virusten, dengueviruksen sekä malarian tunnistamiseen verinäytteestä. Menetelmässä hyödynnetään infrapunasäteilyä, jonka absorptio näytteessä riippuu sen molekulaarisesta koostumuksesta. Mittauksen tuloksena saadaan infrapuna-absorptiospektri, josta voidaan kehittyneiden tekoälymenetelmien avulla oppia tunnistamaan tietylle virusinfektiolle tyypillinen ”sormenjälki”. Menetelmä on halpa, helppokäyttöinen, nopea (mittaus voidaan suorittaa muutamassa minuutissa), näytteen käsittelyä ei tarvita, ja testitulos voidaan saada heti mittauksen jälkeen.

Tässä hankkeessa on tarkoitus kehittää infrapunaspektroskopiaan perustuva uusi, edullinen ja nopea diagnostinen testi koronavirusinfektiolle (COVID-19) ja muille akuuteille virusinfektioille. Tutkimus suoritetaan yhteistyössä Pohjois-Suomen laboratoriokeskuksen liikelaitoskuntayhtymä NordLabin (www.nordlab.fi) kanssa, missä tällä hetkellä tehdään suurin osa Oulun alueen COVID-19-testeistä polymeraasiketjureaktio (PCR) -menetelmällä. Hanke toteutetaan käytännössä siten, että sama potilasnäyte (hengitystienäyte) mitataan sekä infrapunaspektroskopialla että PCR-menetelmällä, minkä jälkeen opetamme tekoälyalgoritmin tunnistamaan infrapunaspektristä COVID-19-infektiolle tyypillisen spektrisormenjäljen käyttämällä PCR-tulosta referenssinä (ns. kultainen standardi). Tavoitteena on tekoälyn avulla optimoida testin herkkyys (sensitiivisyys) ja tarkkuus (spesifisyys) siten, että infrapunaspektroskopiaa voitaisiin tutkimushankkeen jälkeen (tai jopa sen aikana) käyttää COVID-19-infektioiden testauksessa ilman PCR-vertailumenetelmää. Jos kehitettävät tekoälyalgoritmit saadaan optimoitua COVID-19-infektiolle, mahdollistaa se myös niiden helpon soveltamisen tulevaisuudessa muille virusinfektioille.

Tällä hetkellä akuuttiin koronavirusdiagnostiikkaan käytettävän PCR-testin tuloksen valmistuminen kestää suhteellisen pitkään ja sen kapasiteetti on rajallinen – varsinkin jos koronavirusepidemian toinen aalto osoittautuu suureksi. Näin ollen olisi äärimmäisen tärkeää, että nimenomaan akuuttivaiheen infektion tunnistamiseen olisi herkkiä/tarkkoja sekä laajalti saatavilla olevia testausmenetelmiä, joilla tulos saataisiin heti ilman tuntien tai jopa vuorokausien odottelua. Jos kehitettävä infrapunaspektroskopiamenetelmä osoittautuu toimivaksi, voisi se tarjota merkittävää helpotusta testauskapasiteettiin ja sitä kautta mahdollistaa mm. tehokkaamman tartuntojen jäljityksen. Tämä hankeidea sai lisää vahvistusta huhtikuun alussa julkaistusta uutisartikkelista, jonka mukaan infrapunaspektroskopiaa on jo alettu soveltamaan COVID-19-diagnoosiin Iso-Britanniassa mittaamalla infrapunaspektri suoraan hengitystienäytteestä: https://www.hulldailymail.co.uk/news/hull-east-yorkshire-news/hull-coronavirus-covid-19-test-4003656.amp.

Jos kehitetty infrapunaspektroskopiamenetelmä osoittautuu toimivaksi, uudentyyppisiä virustestejä voitaisiin alkaa tarjoamaan esimerkiksi uuden perustettavan yrityksen puitteissa Pohjois-Pohjanmaan alueella. Toinen liiketoimintamahdollisuus olisi alkaa tarjoamaan testejä yhteistyössä olemassa olevien laboratorioyritysten tai liikelaitosten kanssa yhteistyössä (esim. Nordlab tai Synlab). Eri liiketoimintamahdollisuudet Oulun alueella selvitetään hankkeen aikana.

4 Hankkeen kohderyhmät

4.1 Varsinaiset kohderyhmät

Hengitystieinfektioista kärsivät potilaat, joilta otetaan koronavirusnäytteet.

4.2 Välilliset kohderyhmät

Alkuvaiheessa virustestauksesta hankkeesta hyötyisi – luonnollisesti potilaiden lisäksi - Pohjois-Pohjanmaan alueen liiketoiminta joko uuden Oulun alueelle perustettavan yrityksen myötä tai olemassa olevan yrityksen lisäliiketoimintana.

5 Projektin julkinen rahoitus, euroa

Myönnetty EU- ja valtion rahoitus: 139 928

Toteutunut EU- ja valtion rahoitus: 127 476

Suunniteltu julkinen rahoitus yhteensä: 174 910

Toteutunut julkinen rahoitus yhteensä: 159 345

6 Maantieteellinen kohdealue

Maakunnat: Pohjois-Pohjanmaa

Seutukunnat: Oulun

Kunnat: Oulu

Toteutuspaikan osoite, jos hanke toteutetaan yhdessä paikassa

Jakeluosoite:

Postinumero:

Postitoimipaikka:

7 Hakemusvaiheessa ilmoitettavat arviot hankekohtaisista seurantiedoista

7.1 Uusien työpaikkojen määrä (kysytään vain erityistavoitteisiin 1.1, 2.1 ja 3.1 kuuluvissa hankkeissa)

Suunniteltu: 0, joihin työllistyvät naiset 0

Toteutunut seurantatietojen mukaan: 0.00, joihin työllistyvät naiset 0.00

7.2 Uusien yritysten määrä (kysytään vain erityistavoitteeseen 1.1 kuuluvissa hankkeissa)

Suunniteltu: 0, joista naisten perustamia 0

Toteutunut seurantatietojen mukaan: 0.00, joista naisten perustamia 0.00

8 Horisontaaliset periaatteet

8.1 Sukupuolten tasa-arvo

Hankkeessa on tehty toimintaympäristön analyysi sukupuolinäkökulmasta: Kyllä
Kehitettävä virustestaukseen soveltuva laitteisto sekä siihen liitettävä tekoälypohjainen analyysiohjelmisto tulisi sijoittumaan terveydenhuollon toimialalle, joka on perinteisesti ollut vahvasti naisvaltainen. Tilastokeskuksen mukaan vuonna 2017 terveys- ja sosiaalipalveluiden alalla naisten osuus yleisesti oli 87 % kaikista työntekijöistä. Tarkemmin analysoituna menetelmän mahdollisia soveltajia terveydenhuollossa olisivat todennäköisimmin seuraavat ammattiryhmät: sairaanhoitajat (näytteenottaja), bioanalyytikot (näytteenottaja sekä analyysin suorittaja), lääkärit (testituloksen tulkitsija) sekä mikrobiologit (testituloksen tulkitsija). Tilastokeskuksen PxWeb-tietokannan mukaan vuonna 2017 naisten osuus em. ammattiryhmissä oli seuraava: sairaanhoitajat = 92 %, bioanalyytikot = 95 % sekä lääkärit = 61 %. Mikrobiologeista ei ollut tilastotietoa saatavilla, mutta oletettavasti myös ko. ala on ainakin lievästi naisvaltainen. Näin ollen on selvää, että testausmenetelmän rutiinikäyttäjäkunta olisi naisvoittoista. Testausmenetelmästä hyötyvien potilaiden osalta sukupuolista segregaatiota ei ole, koska Suomessa potilaita ei eritellä tai priorisoida sukupuolen mukaan.
Sukupuolinäkökulma on huomioitu hankkeen toiminnassa (valtavirtaistaminen): Kyllä
Hankkeen kannalta on periaatteessa mahdollista, että sukupuolinen segregaatio jopa vähenisi laboratoriodiagnostiikan alalla, sillä kehitettävä tekoälypohjainen analyysiohjelmisto vaatii ohjelmoijien sekä tekoälyn asiantuntijoiden työpanosta. Esimerkiksi ohjelmoijien osalta 91 % oli miehiä vuonna 2017 (Tilastokeskuksen PxWeb-tietokanta). Lisäksi myös tekoälyn asiantuntijat ovat vahvasti miesvoittoisia. Näin ollen, jos esimerkiksi testauspalvelua tarjoava organisaatio haluaa kehittää menetelmää edelleen sisäisesti, on mahdollista, että alalle palkattaisiin lisää miehiä esimerkiksi em. tehtäviin, mikä vähentäisi sukupuolista segregaatiota.
Hankkeen päätavoite on sukupuolten tasa-arvon edistäminen: Ei
Ei ole hankkeen päätavoite.

8.2 Kestävä kehitys

VälitönVälillinen
Ekologinen kestävyys
Luonnonvarojen käytön kestävyys 0 0
Ei vaikutusta
Ilmastonmuutoksen aiheuttamien riskien vähentäminen 0 0
Ei vaikutusta
Kasvillisuus, eliöt ja luonnon monimuotoisuus 0 0
Ei vaikutusta
Pinta- ja pohjavedet, maaperä sekä ilma (ja kasvihuonekaasujen väheneminen) 0 0
Ei vaikutusta
Natura 2000 -ohjelman kohteet 0 0
Ei vaikutusta
Taloudellinen kestävyys
Materiaalit ja jätteet 0 0
Ei vaikutusta
Uusiutuvien energialähteiden käyttö 0 0
Ei vaikutusta
Paikallisen elinkeinorakenteen kestävä kehittäminen 2 2
Testauskapasiteetin laajeneminen sekä nopeutuminen helpottaa epidemian kurissa pitämistä ja sitä kautta pitää paikallisen elinkeinoelämän "pyörät pyörimässä".
Aineettomien tuotteiden ja palvelujen kehittäminen 3 2
Kehitettävä testausmenetelmä ei korvaa mitään aineellista tuotetta tai palvelua, mutta se olisi kustannustehokkaampi kuin nykyiset testausmenetelmät.
Liikkuminen ja logistiikka 0 3
Kehitettävä menetelmä voisi mahdollistaa nykyistä kustannustehokkaamman testauksen, jolloin testauspaikkoja voisi olla tarjolla alueellisesti laajemmin ja potilaiden siirtymistarpeet lyhenevät.
Sosiaalinen ja kulttuurinen kestävyys sekä yhdenvertaisuus
Hyvinvoinnin edistäminen 6 1
Onnistuessaan kehitettävä menetelmä lisää merkittävästi hyvinvointia ja yhdenvertaisuutta, sillä se voisi mahdollistaa riittävän halvat testaukset kaikille halukkaille.
Tasa-arvon edistäminen 0 0
Ei vaikutusta
Yhteiskunnallinen ja kulttuurinen yhdenvertaisuus 0 0
Ei vaikutusta
Kulttuuriympäristö 0 0
Ei vaikutusta
Ympäristöosaaminen 0 0
Ei vaikutusta

9 Loppuraportin tiivistelmä

Hankkeessa kehitetiin infrapunaspektroskopiaan perustuva diagnostinen testi ja tekoälypohjainen analyysiohjelmisto koronavirusinfektion (COVID-19) tunnistamiseen. Hanke toteutettiin Oulun yliopiston lääketieteellisessä tiedekunnassa yhteistyössä Pohjois-Suomen laboratoriokeskuksen liikelaitoskuntayhtymä NordLabin (www.nordlab.fi) kanssa, mistä saimme hankkeen aikana yhteensä 558 COVID-19 negatiivista ja 558 COVID-19 positiivista nenänielunäytettä (pyyhkäisynäyte). Näytteet oli aikaisemmin analysoitu Nordlabissa PCR-menetelmällä. Tämän lisäksi hankkeen loppuvaiheessa tehtiin myös yhteistyötä Kajaanin yliopistokeskuksen kanssa, mistä saimme hankkeeseen 146 sylkinäytettä. Kajaanin yliopistokeskuksessa oli käynnissä vastaava EAKR-rahoitteinen COVID-19-hanke, missä kehitetään menetelmää koronaviruksen vasta-aineiden tunnistamiseen sylkinäytteistä, ja ohjausryhmän suosituksen perusteella päädyimme tekemään yhteistyötä tämän toisen vastaavan hankkeen kanssa.

Hankerahoituksella ostettiin mittauksiin soveltuva infrapunaspektroskopialaitteisto (Bruker Alpha II, Bruker Optics GmbH, Ettlingen, Saksa), millä mitattiin kaikki 1116 nenänielunäytettä. Laitehankinta oli välttämätön, koska Oulun yliopistossa jo aikaisemmin ollut vastaava laitteisto oli niin kovalla käytöllä, että laiteaikaa ei olisi riittänyt tämän hankkeen laajoihin mittaussarjoihin. Hankkeen loppuvaiheessa kuitenkin käytettiin myös Oulun yliopistoon jo aikaisemmin hankittua vastaavaa laitteistoa (Thermo Nicolet iS5), millä mitattiin 142 sylkinäytettä (haluttiin myös samalla vertailla laitteiden välistä datan laatua). Hanke toteutettiin käytännössä siten, että sama potilasnäyte mitattiin sekä infrapunaspektroskopialla että PCR-menetelmällä (pyyhkäisynäyte) tai vasta-ainemäärityksellä (sylkinäyte). Tämän jälkeen koulutimme tekoälyalgoritmeja tunnistamaan infrapunaspektristä COVID-19-infektiolle tyypillisen spektrisormenjäljen käyttämällä PCR- ja vasta-ainetuloksia referenssinä (ns. kultainen standardi).

Hankkeessa koulutettiin ja kokeiltiin laajalti eri tekoälyalgoritmeja nenänielunäytteiden PCR-tuloksen (positiivinen/negatiivinen) ennustamiseksi mitatuista infrapunaspektreistä. Kuten hankesuunnitelmassa jo arvioitiin, Partial Least Squares Discriminant Analysis (PLS-DA) -tekoälyalgoritmi osoittautui kaikista toimivimmaksi valinnaksi PCR-tuloksen (positiivinen/negatiivinen) ennustamiseksi nenänielunäytteistä. PLS-DA-mallin koulutuksen lopputuloksena saadun mallin AUROC-arvo oli 0.67 (vaihteluväli 0.65-0.69). Mallin tarkkuutta kuvaava arvo oli 0.63 (vaihteluväli 0.60-0.65), mallin sensitiivisyys oli 0.61 (vaihteluväli 0.58-0.65) ja spesifisyys oli 0.64 (vaihteluväli 0.59-0.67). Tulosten perusteella voidaan sanoa, että PLS-DA-malli on aidosti suorituskykyinen mitattujen infrapunaspektrien luokittelussa, eikä sattuma voi selittää saatuja tuloksia. Tulokset jäivät kuitenkin liian alhaisiksi, jotta menetelmää voitaisiin suoraan käyttää COVID-19-infektion seulontatestinä. Tuloksia heikentäviksi tekijöiksi voidaan mainita mitattujen näytteiden pakastus ennen infrapunaspektrien mittausta ja mitattujen näytteiden alhainen viruskonsentraatio. Lisäksi toistomittauksista saatujen spektrien poikkeavuuksien perusteella voidaan olettaa, että näytteiden laimennus- ja inaktivointiliuokset saattavat vaikuttaa näytteen epätasaiseen jakautumiseen, mikä heikentää tekoälypohjaisen analyysin suorituskykyä. Oletettavasti toimivampi tapa olisi mitata näytteet suoraan pyyhkäisynäytteestä ilman mitään laimennusta, jolloin näytekonsentraatio olisi suurempi ja mitatut spektrit tasalaatuisempia. Lisätutkimuksia siis tarvitaan edelleen nenänielunäytteiden ja infrapunaspektroskopian osalta.

Hankkeessa kehitettiin myös graafinen analyysiohjelmisto nenänielunäytteiden infrapunaspektrien tekoälypohjaiseen analysointiin. Ohjelmiston algoritmina käytettiin koulutettua PLS-DA-mallia. Ohjelman käyttöliittymä on hyvin yksinkertainen, sillä käyttäjän tarvitsee vain valita luokitukseen tulevan spektridatan tiedostosijainti ja vahvistaa analyysin suorittaminen. Ohjelma näyttää sen jälkeen käytännössä välittömästi luokitustuloksen. Positiivinen luokitustulos esitetään punaisena (COVID-19 positiivinen) ja negatiivinen luokitustulos sinisenä (COVID-19 negatiivinen). Lisäksi esitetään visuaalisesti analysoitava spektri ja positiivisen luokitustuloksen tapauksessa myös CT-luku (PCR-testin virusmäärää kuvaava luku). Kehitetty käyttöliittymä voitaisiin muuntaa helposti myös muiden vastaavien näytteiden analysointiin.

Hankkeen loppuvaiheessa tutkittiin tekoälypohjaisten mallien kykyä ennustaa vasta-ainetasoja sylkinäytteistä mitatuista infrapunaspektreistä regression ja luokittelun avulla. Tulokset osoittivat, että regressio-tekoälymalleilla ei pystytä ennustamaan vasta-ainetasoja, vaikka hankkeessa kokeiltiinkin laajalti eri regressiomenetelmiä. Sylkinäytteitä ei myöskään pystytty luokittelemaan useisiin eri luokkiin useisiin luokkiin riittävällä tarkkuudella, vaikkakin pelkässä kahden luokan binääriluokituksessa saatiin kohtuullisia tuloksia ns. yhdistelmämallilla, jossa oli mukana pääkomponenttianalyysi (Principal Component Analysis), lineaarinen tukivektorikone (Linear Support Vector Machi) sekä kalibroitu luokittelija (Probability Calibration Classifier). Edellä mainitussa binääriluokituksessa spektrit asetettiin luokkaan nolla, jos vasta-ainetasot olivat pienempiä kuin 29 ja vastaavasti muut spektrit kuuluivat luokkaan yksi. Vasta-ainetaso 29 valittiin luokkien rajaksi siitä syystä, että kumpaankin luokkaan saatiin sama määrä analysoitavia näytteitä eli luokkaan nolla kuului 71 näytettä ja luokkaan yksi 71 näytettä. Tällä yhdistelmämallilla saatiin AUROC-arvoksi 0.72 (vaihteluväli 0.66-0.77). Mallin tarkkuutta kuvaava arvo oli 0.66 (vaihteluväli 0.59-0.72), mallin sensitiivisyys oli 0.63 (vaihteluväli 0.55- 0.72) ja mallin spesifisyys oli 0.69 (vaihteluväli 0.58-0.79). Hankkeessa saavutettujen tulosten perusteella voidaan sanoa, että sylkinäytteitä on oletettavasti mahdollista tutkia infrapunaspektroskopian ja koneoppimisen avulla, mutta mallin validointia varten tarvittaisiin selkeästi enemmän dataa (vähintäänkin useita satoja näytteitä) ja todennäköisesti olisi tarpeen tutkia infrapunasignaalin vahvistamiseen tähtääviä menetelmiä. Suuremmalla datamäärällä olisi mahdollista arvioida realistisemmin mallin yleistymistä ja merkitsevyyttä. Sylkinäytteiden vasta-aineisiin viittaava konsentraatio on luultavastikin ollut heikko (sylkinäytteiden toistomittauksista saatiin toisistaan selkeästi poikkeavia spektrejä), joka vaikuttaa negatiivisesti käytetyn mittausmenetelmän luotettavuuteen, joten signaalin vahvistamiseen tähtäävillä toimenpiteillä voitaisiin pyrkiä optimaalisempaan mittaustulokseen. Sylkinäytteille ei ollut mahdollista suorittaa infrapunaspektrien mittaamista heti näytteiden keräyksen jälkeen, joten myös näytteiden säilytys on saattanut vaikuttaa tuloksiin.

Hankkeen loppuvaiheessa kehitettävälle menetelmälle tehtiin myös liiketoimintaselvitys mahdollisen uudenlaisen virustestauksen markkinoille saattamiseen. Selvityksen perusteella tunnistettiin kolme eri liiketoimintamallia kolmelle eri markkinasegmentille: 1) seulontakäyttö julkisissa organisaatioissa (esim. suuret yleisötilaisuudet, julkiset paikat jne.), 2) seulontakäyttö yksityisissä organisaatioissa (esim. työntekijöiden seulonta työpaikoilla) sekä 3) oireettomien ihmisten seulonta mobiilisti. Nämä kolme liiketoimintamallia rinnakkain luovat perusportfolion liiketoimintamalleja palvelemaan yleisiä skaalautuvuuden, kestävyyden ja toistettavuuden tavoitteita. Lisätietoa liiketoimintaselvityksestä löytyy pyydettäessä hankkeen ja ohjausryhmän materiaaleista (ks. kohta 9 / aineiston säilytys).

Huolimatta siitä, että kliinisesti riittävää suorituskykyä kehitettävälle infrapunaspektroskopiatestille ei tässä hankkeessa onnistuttu saavuttamaan, hanke kuitenkin kokonaisuutena tuotti merkittävästi lisätietoa infrapunaspektroskopian soveltuvuudesta virusnäytteiden ja vasta-ainetasojen mittaukseen. Menetelmää onkin nyt paljon helpompi kehittää edelleen tässä hankkeessa saavutettujen tulosten ja osaamisen perusteella.