Till innehåll på sidan
Till KTH:s startsida

Inter and intra-tumor models of somatic evolution in cancer

Tid: To 2023-02-23 kl 14.00

Plats: Air & Fire, Scilifelab, Tomtebodavägen 23A, 171 65, Solna, Solna

Språk: Engelska

Ämnesområde: Tillämpad matematik och beräkningsmatematik

Respondent: Mohammadreza Mohaghegh Neyshabouri , Beräkningsvetenskap och beräkningsteknik (CST)

Opponent: Professor Ben Raphael, Princeton University, Princeton, NJ, USA

Handledare: Professor Jens Lagergren, Beräkningsvetenskap och beräkningsteknik (CST)

Exportera till kalender

QC 20230131

Abstract

Cancer är en sjukdom som orsakas av ackumulering av somatiska mutationer i en evolutionär process. Mutationer i så kallade drivgener ger cellerna särskilda selektiva fördelar och resulterar i cancerprogression. Identifiering av drivgenerna och deras inbördes samband är avgörande för ett brett spektrum av forskning och kliniska tillämpningar. Denna avhandling undersöker problemet med att modellera cancerutvecklingens dynamik med hjälp av probabilistiska progressmodeller. Sådana modeller syftar till att förklara mekanismen för ackumulering av mutationer i tumörcellerna och hur specifika mutationer kan utöva främjande eller hämmande effekter på varandra. Vi introducerar en uppsättning beräkningsmetoder för att analysera data från en kohort av tumörer och sluta sig till sambanden mellan drivargener, representerade av en grafisk struktur över dem.

I våra första två artiklar, efter den typiska miljön i cancerprogressionsmodellstudierna, använder vi en enkel representation för tumörerna där en enda genotypvektor modellerar varje tumör. Vi introducerar en linjär progressionsmodell i den första artikeln och en generaliserad trädstrukturerad modell i den andra. Med hjälp av nya dynamiska programmeringsprocedurer för att beräkna sannolikheterna utvecklar vi Markov Chain Monte Carlo (MCMC) slutledningsalgoritmer för våra modeller i dessa artiklar. Genom att använda dessa snabba och effektiva MCMC-algoritmer kan vi studera massiva datamängder som var omöjliga att undersöka med tidigare introducerade metoder.

I vårt tredje dokument introducerar vi ett ramverk för att ta hänsyn till en finare representation av tumörerna för att sluta sig till progressionsmodeller. Med de snabba förbättringarna i mängden och kvaliteten på tillgänglig data kan vi nu arbeta med ett stort antal tillförlitligt rekonstruerade tumörklonala träd. I vårt tredje dokument introducerar vi en metod som tar sådana klonala träd från kohorter av tumörer som sin input och identifierar sambanden mellan drivgenerna inom en enskild tumör eller över olika tumörer. Vi föreslår en MCMC-algoritm med guidade förslagsfördelningar, som avsevärt ökar algoritmens effektivitet när det gäller att utforska regioner med hög sannolikhet. De rika indata och den beräkningseffektiva algoritmen som introduceras i detta dokument ger lovande resultat på en uppsättning syntetiska och biologiska dataexperiment.

Cancer är en sjukdom som orsakas av ackumulering av somatiska mutationer i en evolutionär process. Mutationer i så kallade drivgener ger cellerna särskilda selektiva fördelar och resulterar i cancerprogression. Identifiering av drivgenerna och deras inbördes samband är avgörande för ett brett spektrum av forskning och kliniska tillämpningar. Denna avhandling undersöker problemet med att modellera cancerutvecklingens dynamik med hjälp av probabilistiska progressmodeller. Sådana modeller syftar till att förklara mekanismen för ackumulering av mutationer i tumörcellerna och hur specifika mutationer kan utöva främjande eller hämmande effekter på varandra. Vi introducerar en uppsättning beräkningsmetoder för att analysera data från en kohort av tumörer och sluta sig till sambanden mellan drivargener, representerade av en grafisk struktur över dem.

I våra första två artiklar, efter den typiska miljön i cancerprogressionsmodellstudierna, använder vi en enkel representation för tumörerna där en enda genotypvektor modellerar varje tumör. Vi introducerar en linjär progressionsmodell i den första artikeln och en generaliserad trädstrukturerad modell i den andra. Med hjälp av nya dynamiska programmeringsprocedurer för att beräkna sannolikheterna utvecklar vi Markov Chain Monte Carlo (MCMC) slutledningsalgoritmer för våra modeller i dessa artiklar. Genom att använda dessa snabba och effektiva MCMC-algoritmer kan vi studera massiva datamängder som var omöjliga att undersöka med tidigare introducerade metoder.

I vårt tredje dokument introducerar vi ett ramverk för att ta hänsyn till en finare representation av tumörerna för att sluta sig till progressionsmodeller. Med de snabba förbättringarna i mängden och kvaliteten på tillgänglig data kan vi nu arbeta med ett stort antal tillförlitligt rekonstruerade tumörklonala träd. I vårt tredje dokument introducerar vi en metod som tar sådana klonala träd från kohorter av tumörer som sin input och identifierar sambanden mellan drivgenerna inom en enskild tumör eller över olika tumörer. Vi föreslår en MCMC-algoritm med guidade förslagsfördelningar, som avsevärt ökar algoritmens effektivitet när det gäller att utforska regioner med hög sannolikhet. De rika indata och den beräkningseffektiva algoritmen som introduceras i detta dokument ger lovande resultat på en uppsättning syntetiska och biologiska dataexperiment.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-323393