Till innehåll på sidan
Till KTH:s startsida

Learning Representations for Tandem Mass Spectra

Self-Supervised Methods and Inductive Biases

Tid: Fr 2026-04-17 kl 13.15

Plats: Pascal, Gamma-6, Tomtebodavägen 23, Solna

Språk: Engelska

Ämnesområde: Bioteknologi

Licentiand: Alfred Nilsson , Genteknologi

Granskare: Professor Björn Wallner, Linköpings universitet

Huvudhandledare: Lukas Käll, Genteknologi, Science for Life Laboratory, SciLifeLab, SeRC - Swedish e-Science Research Centre

Exportera till kalender

QC 2026-03-27

Abstract

Masspektrometrin (MS) är central inom modern proteomik och möjliggör analysav proteiner och peptider baserat på deras massa. Tandem-masspektrometri (MS2)kodar fragmenteringsmönster för peptider och utgör grunden för sekvensidentifiering. Även om databassökning länge har dominerat denna process har djupinlärning öppnat nya möjligheter för direkt tolkning av spektra.

Denna avhandling undersöker hur neurala nätverk kan lära sig representationer av MS2-spektra. Två kompletterande forskningsinriktningar studeras.

Först utvärderas utvalda självövervakade förträningsstrategier genom kontrollerade experiment med encoders som förtränats på oetiketterade MS2-korpusar. Självdistillation ger globala inbäddningar som implicit kodar aspekter av peptiders kemiska egenskaper, och masked autoencoding ger måttliga förbättringar i de novo-precision. De resulterande förbättringarna når dock inte upp till prestandan hos dagens state-of-the-art-metoder för övervakad de novo-sekvensering.

Sedan introduceras Pairwise Attention, en transformerarkitektur som inkorporerar en domänanpassad induktiv bias genom att villkora Attention på parvisa masskillnader mellan toppar. Detta ger prestandaförbättringar på etablerade de novo-sekvenseringsbenchmarkar samt stark generalisering över dataset.

Sammantaget visar resultaten att självövervakad inlärning kan återvinna meningsfull struktur ur råa MS2-data, medan induktiva biaser för närvarande erbjuder de mest robusta förbättringarna för de novo-peptidsekvensering.

Link to DiVA