Go to content
SV På svenska

High-Performance Data Mining for Drug Effect Detection

Reference number
IIS11-0053
Start and end dates
120101-170331
Amount granted
18 822 680 SEK
Administrative organization
Stockholm University
Research area
Information, Communication and Systems Technology

Summary

Detecting drug effects on different sub-populations may require a very large number of cases, something which is not available during early clinical trials. In addition to an increasing number of models and data repositories within the pharmaceutical industry, the amount of data that can be of high value for such analyses is growing rapidly also outside the industry, both in the form of electronic patient records and registries of prescribed drugs, and in the form of globally collected individual case safety reports. By connecting different sources of information on drugs and their reactions, the quality of decision-making within both the pharmaceutical industry and health-care sector can be significantly improved. However, it is a great challenge to analyze this type of massive, heterogeneous and continuously growing data. The main goal of this project is to develop techniques and tools to support decision-making and discovery of drug effects by analyzing patient records, drug registries, case safety reports and chemical compound data in the form of both structured and unstructured (free text) data. The project will contribute with novel approaches to data mining and clinical text mining and develop a platform for large-scale analysis of massive, heterogeneous and continuously growing data sets. As a pilot case in this project, we specifically study effects on medication for heart diseases, one of the large lifestyle diseases.

Popular science description

För att upptäcka vilka effekter ett visst läkemedel har på olika grupper av patienter krävs betydligt fler fall än vad som normalt finns tillgängligt under utvecklingsfasen av läkemedlet. Förutom den information som finns tillgänglig inom läkemedelsindustrin, så växer mängden data även snabbt utanför denna, både i form av elektroniska patientjournaler och läkemedelsregister och i form av biverkningsrapporter som samlas in från hela världen. Denna information kan vara mycket värdefull för att få svar på om ett läkemedel som är under utveckling kan förväntas få oönskade biverkningar. Genom att koppla ihop olika informationskällor för läkemedelsbiverkningar kan kvaliteten på beslutsfattandet förbättras, inte bara i läkemedelsindustrin utan också inom hälso- och sjukvården. Det är dock en stor utmaning att analysera dessa typer av massiva, olikartade och ständigt växande datamängder. Det huvudsakliga målet med projektet är att utveckla metoder och programvara för att stödja forskare och sjukvårdspersonal med att upptäcka läkemedelseffekter genom att analysera patientjournaler, läkemedelsregister, biverkningsrapporter och kemiska data i olika former. Projektet kommer att bidra med nya metoder för data och textanalys och utveckla en programvara för storskalig analys av massiva och ständigt växande datamängder. Projektet kommer som pilotfall att studera effekter hos läkemedel mot hjärtsjukdomar, vilka hör till de stora välfärdsjukdomarna.