Integrative precision medicine: local data, global context
- Reference number
- BD15-0088
- Start and end dates
- 170101-221231
- Amount granted
- 29 673 095 SEK
- Administrative organization
- Uppsala University
- Research area
- Computational Sciences and Applied Mathematics
Summary
Our ongoing efforts to develop novel anticancer therapies are increasingly dependent on accurate data analytics. Big data methodology holds enormous promise to define new therapeutic strategies in well-defined patient subpopulations, but there are important technical and mathematical challenges ahead. For instance, drug development requires integration of data from multiple systems (cells, mice, humans) to assess the potential of new therapies. Also, the future investigation of specific (local) patient populations of interest will depend on relating to much larger (global) data repositories. In our proposal, we will introduce a first set of accurate and scalable methods to achieve such integrations. The two methods, termed MR-SICS and MLLM, are based on recent developments in high dimensional statistics and aim to detect associations and possible interventions based on multiple types (modalities) of local data in a global context. In a highly innovative demonstration study, we will apply the new methods to model personalised interventions (small molecules and gene targets) in cancer stem cells from 160 Swedish patients, based on multiple sources of external and in-house data. Thus, addressing a major problem in drug development and cancer data analysis, this will establish MR-SICS and MLLM as tools that can translate data into actionable strategies in specific patient groups. Finally we will provide our methods both as a user-friend web tool and as high-performance solvers.
Popular science description
Vår strävan att upptäcka bättre behandlingar mot cancer har blivit kritiskt beroende av storskalig data-analys. Men för att dra nytta av ’big data’ i praktisk cancerforskning kvarstår stora utmaningar. En viktig utmaning har att göra med läkemedelsutveckling: kan man sam-analysera stora data från celler, försöksdjur och människor för att avgöra om ett läkemedel har långsiktig potential? En annan viktig utmaning består i att kunna sätta en patients tumör i ett sammanhang: kan man dramatiskt öka sin förståelse genom att sam-analysera stora data från en grupp av intresse (t ex 100 patienter på KI) i relation till de globala referensdata som nu börjar finnas tillgängliga (t ex 10,000 patienter i USA)? För att möta dessa utmaningar, föreslår vi ett strategiskt program med tre delar: 1. Först ska vi utveckla nya beräkningsbaserade metoder som lämpar sig för att analysera flera sorters cancerdata (t ex mutationer, geners aktivering, epigenetiska förändringar mm) över flera olika populationer (t ex olika former av cancer i nervsystemet). Med hjälp av nya rön inom så kallad högdimensionell statistik föreslår vi två konkreta metoder (vi kallar dem för MR-SICS och MLLM) som är mycket beräkningseffektiva och möjliggör en mer exakt och övergripande analys av multipla stora datamängder. Analysen resulterar i både nya biomarkörer, patientgrupperingar, visualiseringar och statistiskt underbyggda förslag på behandlingsalternativ. 2. För att undersöka potentialen i vår nya metodik kommer vi att utföra en mycket innovativ demonstrationsstudie. I studien kommer MR-SICS och MLLM att användas för att studera en ny form av drogscreeningdata som utvecklats vid MIT, så kallade L1000-data. Vi kommer sedan att dra nytta av en unik svensk biobank av hjärntumörceller som tagits fram av Nelanders forskargrupp i samarbete med flera grupper på UU, SU, Chalmers samt två läkemedelsföretag (AstraZeneca och MedImmune). Målet är att visa hur vår big data-metodik kan identifiera behandlingsalternativ genom att kombinera egna (’lokala’) mätningar med en (’global’) referensdatabas med 1,3 miljoner L1000-försök. 3. Slutligen kommer vi att tillhandahålla våra metoder som effektiva verktyg för forskare i fältet, dels som en webserver (som cancerforskare ska kunna använda), dels som högpreseterande mjukvara (som bioinformatiker ska kunna bädda in i egna lösningar för cancerstudier eller annan biologisk forskning).