Genomförd forskning
Ingvar Carlsson Award 7
Projekt
Probabilistiska modeller och metoder för maskininlärning

Probabilistiska modeller och metoder för maskininlärning

Diarienummer: ICA16-0015
Start- och slutdatum: 170901-211215
Beviljat belopp: 4 000 000 kr
Förvaltande organisation: Linköping University
Forskningsområde: Beräkningvetenskap och tillämpad matematik

Summary

Maskininlärning handlar om konstruktionen av metoder som automatiskt kan lära sig och göra förutsägelser baserat på data. Det är ett av dagens mest aktiva forskningsfält och ett teknikområde som ligger bakom en enorm och växande industri. Med en uppsjö av möjliga användningsområden och ständigt höjda förväntningar på tekniken finns det dock många relevanta tillämpningar där dagens metoder är otillräckliga. Syftet med projektet är därför att utveckla nya metoder för att förbättra och komplettera nuvarande maskininlärningstekniker. Fokus kommer ligga på utvecklingen av probabilistiska modeller och metoder, kapabla att hantera de osäkerheter som i princip all data i praktiken är behäftat med. Existerande metoder bli därigenom ”medvetna” om osäkerheten i deras prediktioner, något som är av yttersta vikt för att kvalitetssäkra de system där metoderna används. Vidare kommer projektet resultera i bättre modeller av komplexa dynamiska och hierarkiska databeroenden och nya metoder för automatisk inlärning av dessa modeller. Projektet är indelat i fyra delprojekt, var och ett av stor betydelse för forskningsområdet. Dessutom kommer två demonstratorer utvecklas i samarbete med svenska företag: Kvalitetssäkring för automatisk klassificering av patologiska bilder, med Sectra AB, samt; Segmentering av energiförbrukning utifrån smarta elmätare, med Greenely AB. Projektet kommer således inte bara förbättra den grundläggande tekniken, utan också ha direkt relevans för svensk industri.

Populärvetenskaplig beskrivning

Maskininlärning handlar om konstruktionen av datorprogram som automatiskt kan lära sig och göra förutsägelser baserat på data. Det är ett av dagens mest aktiva forskningsfält och ett teknikområde som ligger bakom en enorm och ständigt växande industri. För att ge ett exempel: Mikroskopi av vävnadsprover används rutinmässigt inom hälsovården för diagnostisering av olika sjukdomar, t.ex. cancer. Att manuellt analysera mikroskopibilder kan dock vara en svår och väldigt tidskrävande uppgift. För att förbättra och underlätta detta arbete kan maskininlärningsmetoder användas för att automatiskt analysera bilderna och fungera som ett komplement och beslutsstöd till vårdpersonalen. Datorprogrammet i fråga måste utgå ifrån tillgängliga data, i det här fallet mikroskopibilder av ett vävnadsprov, och automatiskt hitta mönster och egenskaper som är relevanta för diagnostiseringen. Kärnan i dessa datorprogram är matematiska modeller som fungerar som kompakta och tolkningsbara beskrivningar av uppmätta data. En speciell typ av matematiska modeller kallas för ”probabilistiska modeller”. Dessa modeller är baserade på sannolikhetslära vilket har fördelen att de inte bara kan ge en beskrivning av den studerade processen, utan även tala om för användaren hur säker eller osäker beskrivningen är. Detta är väldigt viktigt i många tillämpningar för att kunna kvalitetssäkra de system där metoderna används. För att återgå till vårt tidigare exempel: Automatiska diagnostiseringssystem kommer aldrig vara 100 % tillförlitliga. Det är därför väldigt viktigt att systemet kan upplysa vårdpersonalen på osäkra diagnoser så att mänskliga experter kan kopplas in om och när det behövs. Målet med forskningsprojektet är att utveckla nya typer av probabilistiska modeller som kan användas för att göra maskinlärningsalgoritmer "medvetna" om osäkerheten i deras förutsägelser. Vidare kommer projektet resultera i nya metoder för att automatiskt kalibrera dessa modeller utifrån tillgängliga data. Förutom grundläggande forskning inom maskininlärning kommer projektet bidra med två konkreta tillämpningar i samarbete med svenska företag: (1) Frågan om kvalitetssäkring inom automatiska diagnostiseringssystem (som beskrivits i exemplet ovan) kommer behandlas tillsammans med Sectra AB. (2) Metoder för att erhålla detaljerad information om ett hushålls elförbrukning kommer att tas fram tillsammans med Greenely AB. Syftet är att ge konsumenten större inblick i, och möjlighet att minska, sin förbrukning.