Go to content
SV På svenska

Proteoform Elucidation And Knowledge graph System - PEAKS

Reference number
ITM24-0219
Project leader
Johansson, Henrik
Start and end dates
260101-281231
Amount granted
9 999 977 SEK
Administrative organization
Karolinska Institutet
Research area
Life Science Technology

Summary

Proteins form molecular phenotype and are major drug targets, yet mass spectrometry (MS)-based proteomics studies often reduce their complexity to gene-level quantification. This overlooks proteoforms, variants from splice events and post-translational modifications, reducing hundreds of thousands of proteoforms to 20,000 genes and leaving their phenotypic impact largely unknown. With this proposal, we aim to shift to proteoform-centric analysis of quantitative MS data, leveraging the deep but underused peptide data generated by modern MS (Astral, timsTOF) by integrating machine learning and topological models for proteoform identification, validated by long-read RNA-seq. We propose a proteoform and peptide-centric knowledge graph, enriched by AI (LLMs), to aid functional interpretation. These approaches will identify key peptides for proteoform function analysis and enable new core facility services together with targeted MS (PRM). Parallel reaction monitoring on high-resolution MS instruments will ensure high sensitivity for detecting proteoform specific peptides Shifting from gene-centric to proteoform-centric analysis will refine biology and disease research, accelerating drug discovery and biomarker development. By uncovering disease-relevant proteoforms, this approach will drive proteoform-based precision medicine, leading to more targeted therapies, reducing healthcare costs, and maximizing the value of existing proteomics data.

Popular science description

Proteomik är ett snabbt växande fält inom biomedicinsk forskning som öppnar upp för genombrott i vår förståelse av biologi och sjukdomar. Detta projekt föreslår ett skifte från traditionella gen-centrerade metoder till ett fokus på proteoformer. Denna strategi fångar proteinernas verkliga funktionella komplexitet. Genfokuserade metoder ger ofta inte en fullständig bild av hur proteiner fungerar i hälsa och sjukdom. Proteoformer, distinkta molekylära varianter av proteiner, ger en mer exakt bild av biologiska processer. Genom att utveckla nya metoder för att studera proteoformer, syftar projektet till att: Förbättra förståelsen av molekylära fenotyper och sjukdomsmekanismer. Påskynda läkemedelsupptäckt och utveckling av biomarkörer för mer målinriktad behandling. Förbättra precisionsmedicinen genom att möjliggöra en bättre matchning mellan patient och behandling för optimal effekt. Minska sjukvårdskostnader genom tidigare och mer exakta diagnoser. För att förbättra nuvarande praxis kommer projektet att: Gå bortom genuttrycksdata och leverera detaljerade proteoformprofiler som bättre speglar sjukdomsaktivitet. Utveckla nya analytiska metoder för att avslöja tidigare dolda insikter i proteomikdata. Etablera robusta metoder för proteoformidentifiering för rutinmässig klinisk användning.Integrera AI-verktyg för effektiv analys av komplexa omics-data. Genom att främja proteoformanalys har projektet som mål att revolutionera diagnostiken, attrahera kliniska prövningar till Sverige och driva innovation inom personlig hälso- och sjukvård.