Till innehåll på sidan
Till KTH:s startsida

Deep learning approaches for denoising, artifact correction, and radiology report generation in CT and chest X-ray imaging

Tid: To 2025-06-05 kl 09.15

Plats: FD5, Roslagstullsbacken 21, Stockholm

Språk: Engelska

Ämnesområde: Fysik, Biologisk och biomedicinsk fysik

Respondent: Dennis Hein , Partikelfysik, astrofysik och medicinsk bildbehandling

Opponent: Associate Professor Quanzheng Li, Harvard Medical School, USA

Handledare: Professor Mats Danielsson, Partikelfysik, astrofysik och medicinsk bildbehandling; Docent Mats Persson, Partikelfysik, astrofysik och medicinsk bildbehandling

Exportera till kalender

QC 2025-05-09

Abstract

Medicinsk avbildning är en hörnsten i den moderna sjukvården och ger avgörande insikter för e!ektiv diagnos och behandlingsplanering. Bland de många bildbehandlingsmetoderna utmärker sig datortomografi (CT) och lungröntgen för sin utbredda kliniska användning, där årligen cirka 400 miljoner CT-undersökningar och 1,4 miljarder lungröntgenundersökningar utförs globalt. Nya framsteg inom detektorteknik har lett till utvecklingen av fotonuppräknande CT, vilket lovar förbättrad rumslig och energiresolution samt förbättrade möjligheter för lågdosavbildning. Emellertid utgör förhöjt bildbrus och ringartifakter—till följd av högre rumslig och energiresolution samt inkonsekvenser i detektorelement—betydande hinder, vilket försämrar bildkvaliteten och komplicerar den diagnostiska processen. Utöver CT-avbildning fortsätter volymen av lungröntgenundersökningar att öka, vilket sätter ytterligare press på redan överbelastade radiologiavdelningar. Dessutom leder avancerade och innovativa tekniker inom CT till en stadig ökning av antalet bilder som radiologerna måste tolka, vilket ytterligare förvärrar arbetsbelastningen. För att möta dessa utmaningar utnyttjar denna avhandling generativa metoder inom artificiell intelligens genom hela värdekedjan för medicinsk avbildning. För fotonuppräknande CT-avbildning behandlar avhandlingen inversa problem med hjälp av diffusions- och Poisson-flödesmodeller. Syn2Real syntetiserar realistiska ringartifakter för att e!ektivt generera träningsdata för djupinlärnings-baserad artefaktkorrigering. För brusreducering i bilder introducerar avhandlingen metoder som utnyttjar robustheten hos PFGM++ i både övervakade och icke-övervakade versioner av posterior sampling Poisson-flödes generativa modeller, vilket kulminerar i Poisson-flödes konsistensmodeller—en ny familj av djupa generativa modeller som kombinerar robustheten hos PFGM++ med effektiv enkelsagsprovtagning och flexibiliteten hos konsistensmodeller. Dessutom arbetar denna avhandling för att tackla den globala bristen på radiologer genom att förbättra medicinska vision-språkmodeller med hjälp av CheXalign: ett nytt ramverk som utnyttjar o!entligt tillgängliga dataset, innehållande parade lungröntgenbilder och radiologiska rapporter skrivna i en klinisk miljö, samt referensbaserade mått för att generera högkvalitativ preferensdata. Detta möjliggör i sin tur tillämpningen av direkta justeringsalgoritmer som ökar sannolikheten för goda rapporter samtidigt som sannolikheten för dåliga minskar, vilket förbättrar de övergripande resultaten. Delvis automatisering av genereringen av lungröntgenrapporter—där språkmodeller används för att utarbeta initiala rapporter—lovar stora möjligheter till e!ektivare arbetsflöden, minskad utbrändhet och att radiologerna kan avsätta mer tid för mer avancerade avbildningsstudier, såsom fotonuppräknande CT.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-363233