Completed research
Ingvar Carlsson Award 7
Projects
Probabilistiska modeller och metoder för maskininlärning

Probabilistic Modeling and Inference for Machine Learning

Reference number: ICA16-0015
Start and end dates: 170901-211215
Amount granted: 4 000 000 SEK
Administrative organization: Linköping University
Research area: Computational Sciences and Applied Mathematics

Summary

Machine learning is one of today's most vibrant scientific fields and, being at the core of data science, it underpins a huge and rapidly growing industry. With a plethora of possible applications and constantly increasing expectations, however, state-of-the-art machine learning methods are still struggling in many highly relevant cases. This project will develop new methodology for addressing some of the limitations of the current state-of-the-art. Specific attention will be paid to probabilistic models for enabling accurate representation and reasoning about the uncertainties omnipresent in practical applications. New probabilistic models will be developed for bringing uncertainty-awareness to state-of-the-art machine learning algorithms and for better capturing complex dynamical and hierarchical data dependencies. Furthermore, the project will result in new computational methods for automatic learning of these probabilistic models from data. The project is organized into four distinct but related subprojects, each with a potentially high impact on the field. Additionally, two industrial demonstrators will be developed in collaboration with Swedish industry: Quality assurance for automatic classification of pathological images, with Sectra AB and; Energy disaggregation from low-frequency smart-meter data, with Greenely AB. The project will thus not only advance the basic machine learning methodology, but also be of direct relevance to Swedish industry.

Popular science description

Maskininlärning handlar om konstruktionen av datorprogram som automatiskt kan lära sig och göra förutsägelser baserat på data. Det är ett av dagens mest aktiva forskningsfält och ett teknikområde som ligger bakom en enorm och ständigt växande industri. För att ge ett exempel: Mikroskopi av vävnadsprover används rutinmässigt inom hälsovården för diagnostisering av olika sjukdomar, t.ex. cancer. Att manuellt analysera mikroskopibilder kan dock vara en svår och väldigt tidskrävande uppgift. För att förbättra och underlätta detta arbete kan maskininlärningsmetoder användas för att automatiskt analysera bilderna och fungera som ett komplement och beslutsstöd till vårdpersonalen. Datorprogrammet i fråga måste utgå ifrån tillgängliga data, i det här fallet mikroskopibilder av ett vävnadsprov, och automatiskt hitta mönster och egenskaper som är relevanta för diagnostiseringen. Kärnan i dessa datorprogram är matematiska modeller som fungerar som kompakta och tolkningsbara beskrivningar av uppmätta data. En speciell typ av matematiska modeller kallas för ”probabilistiska modeller”. Dessa modeller är baserade på sannolikhetslära vilket har fördelen att de inte bara kan ge en beskrivning av den studerade processen, utan även tala om för användaren hur säker eller osäker beskrivningen är. Detta är väldigt viktigt i många tillämpningar för att kunna kvalitetssäkra de system där metoderna används. För att återgå till vårt tidigare exempel: Automatiska diagnostiseringssystem kommer aldrig vara 100 % tillförlitliga. Det är därför väldigt viktigt att systemet kan upplysa vårdpersonalen på osäkra diagnoser så att mänskliga experter kan kopplas in om och när det behövs. Målet med forskningsprojektet är att utveckla nya typer av probabilistiska modeller som kan användas för att göra maskinlärningsalgoritmer "medvetna" om osäkerheten i deras förutsägelser. Vidare kommer projektet resultera i nya metoder för att automatiskt kalibrera dessa modeller utifrån tillgängliga data. Förutom grundläggande forskning inom maskininlärning kommer projektet bidra med två konkreta tillämpningar i samarbete med svenska företag: (1) Frågan om kvalitetssäkring inom automatiska diagnostiseringssystem (som beskrivits i exemplet ovan) kommer behandlas tillsammans med Sectra AB. (2) Metoder för att erhålla detaljerad information om ett hushålls elförbrukning kommer att tas fram tillsammans med Greenely AB. Syftet är att ge konsumenten större inblick i, och möjlighet att minska, sin förbrukning.