Data science for disease signature and drug discovery
- Reference number
- SM23-0038
- Project leader
- Sysoev, Oleg
- Start and end dates
- 240101-250630
- Amount granted
- 1 030 239 SEK
- Administrative organization
- Linköping University
- Research area
- Computational Sciences and Applied Mathematics
Summary
AstraZeneca (AZ) have developed a software tool, Regulatory Flux Analysis (RFA), that predicts regulatory influence between two genes or proteins. The software predicts a regulatory network for all possible pathways between the two entities. The tool allows for quantitative mapping of gene expression and estimates the quantification of molecular regulation between entities using bulk data that represent aggregated expressions over many cell types. Single cell RNA have a potential to reveal molecular regulations at much higher resolution, which leads to both novel biological findings and improved drug discovery. Dr Oleg Sysoev has a solid experience of analysing such data in an academic setting. The main aim of this project is to extend RFA functionality to predict cell type specific molecular regulation and regulation between cell types. Due to complexity of the data, network tools will be combined with machine learning to a) infer molecular interactions within and between cell types, b) identify complex disease signatures involving genes from multiple cell types, c) identify chemicals affecting the disease based on the signatures d) construct computational models that re-purpose existing AZ drugs. The work will be performed in collaboration with the Neuroscience team at AZ who have access to suitable datasets. The project will lead to increased understanding of the disease biology, patents of the novel disease biomarkers and development of new precision drugs.
Popular science description
Läkemedelsutveckling är en lång och kostsam process och cirka 90 % av läkemedlen i kliniska prövningar misslyckas fortfarande. Omkring 30 % av misslyckanden i läkemedelsutvecklingen beror på att de är för toxiska eller har biverkningar, ungefär 50 % har dålig effektivitet. Många av dessa läkemedel misslyckas på grund av bristande förståelse av sjukdomens biologi. AstraZeneca är ett av de största läkemedelsutvecklingsföretagen i världen. För att utveckla läkemedel konstruerar företaget ett nätverk som förklarar biologiska interaktioner mellan olika biologiska enheter, såsom gener, proteiner osv. En nackdel med denna procedur är att detta nätverk är konstruerat från data som innehåller aggregerad information över många celler och kan för närvarande inte ta hänsyn till processer som sker mellan enskilda celler. Det första målet med detta projekt är att använda datamängder med mycket högre upplösning, så kallade encellsdata, för att ändra upplösningen i det befintliga nätverket. Eftersom encellsdata är stora och komplexa kommer vi behöva kombinera metoder från maskininlärning, datavetenskap och nätverksvetenskap för att konstruera den nya typen av nätverk. När vi har det nya nätverket kommer vi använda det för att förbättra andra steg i läkemedelsutvecklingen. Vi planerar att föreslå bättre sätt att svara på följande frågor: a) vilken typ av tester kan göras för att ta reda på om personen är sjuk b) vilka ingredienser vi ska blanda in i läkemedel för att behandla denna person, och c) om det finns några andra mediciner som ursprungligen användes för att behandla andra sjukdomar som vi också kan använda för att behandla denna person.