Till innehåll på sidan
Till KTH:s startsida

Deep Learning for Active Fire Detection Using Multi-Source Satellite Image Time Series

Tid: To 2023-06-15 kl 10.00

Plats: E53, Osquarsbacke 18, Campus, video conference [MISSING]

Språk: Engelska

Ämnesområde: Geodesi och geoinformatik, Geoinformatik

Licentiand: Yu Zhao , Geoinformatik

Granskare: Professor Cartalis Constantinos, National and Kapodistrian University of Athens

Huvudhandledare: Professor Yifang Ban, Geoinformatik; Dr Andrea Nascetti, Geoinformatik; Associate Professor Josephine Sullivan, Robotik, perception och lärande, RPL

Exportera till kalender

QC 20230526

Abstract

Under de senaste åren har klimatförändringar och mänsklig verksamhet orsakat allt fler skogsbränder. Jordobservationsdata med olika rumsliga och tidsmässiga upplösningar har visat sig ha stor potential när det gäller att upp- täcka och övervaka skogsbränder. Advanced Baseline Imager (ABI) på NO- AA:s geostationära vädersatelliter Geostationary Operational Environmental Satellites R Series (GOES-R) kan ta bilder var 15:e minut med en rumslig upplösning på 2 km och har använts för tidig upptäckt av bränder. Moderate Resolution Imaging Spectroradiometer (MODIS) och Visible Infrared Imaging Radiometer Suite (VIIRS) på solsynkrona satelliter har två gånger per dag och används ofta för att upptäcka aktiva bränder. VIIRS Active Fire product (VNP14IMG) har en geografisk upplösning på 375 m och MODIS Active Fire product (MCD14DL) har en geografisk upplösning på 1 km. Även om dessa produkter är mycket användbara har de befintliga lösningarna brister, bl.a. många falska larm på grund av molntäcke eller byggnader med tak med hög temperatur. Den multikriteriebaserade tröskelmetoden utnyttjar inte heller den rika tidsmässiga informationen för varje pixel vid olika tidpunkter och den rika rumsliga informationen mellan närliggande pixlar. Därför behövs avancerade bearbetningsalgoritmer för att tillförlitligt kunna upptäcka aktiva bränder. 

Huvudsyftet med den här avhandlingen är att utveckla metoder baserade på djupinlärning för förbättrad aktiv branddetektering med hjälp av jordob- servationsbilder med flera sensorer. Den höga tidsmässiga upplösningen hos ovannämnda satelliter gör att den tidsmässiga informationen är mer värdefull än den spatiala upplösningen. Därför är sekventiella djupinlärningsmodeller som Gated Recurrent Unit (GRU), Long-Short Term Memory (LSTM) och Transformer lovande kandidater för att utnyttja den tidsmässiga informatio- nen som är kodad i variationen av värmebandsvärdena. I den här avhand- lingen föreslås en GRU-baserad metod för tidig branddetektering med hjälp av GOES-R ABI-tidsserier som visar att skogsbränder upptäcks tidigare än VIIRS Active Fire Product från NASA. Dessutom föreslås en transforma- torbaserad metod som utnyttjar Suomi National Polar-orbiting Partnership (Suomi-NPP) VIIRS-tidsserier som visar bättre noggrannhet vid aktiv brand- detektering än VIIRS aktiva brandprodukt. 

Den GRU-baserade GOES-R-metoden för tidig upptäckt använder GOES- R ABI-tidsserier som består av den normaliserade skillnaden mellan MIR- bandet 7 (Mid Infra-Red) och 14 (Long-wave Infra-Red). Det långvågiga in- fraröda bandet 15 används som molnmask. Ett GRU-nätverk i fem lager fö- reslås för att bearbeta tidsserierna för varje pixel och klassificera de aktiva brandpixlarna vid varje tidssteg. För 36 undersökningsområden i Nord- och Sydamerika upptäcker den föreslagna metoden 26 skogsbränder tidigare än VIIRS-produkten för aktiva bränder. Dessutom mildrar metoden problemet med GOESR ABI-bildernas grova upplösning genom uppgradering, och resul- taten visar en mer tillförlitlig lokalisering av aktiva bränder i ett tidigt skede och undertrycker bruset jämfört med GOES-R:s produkt för aktiva bränder. 

För aktiv branddetektering med hjälp av VIIRS-tidsserier föreslås en transformatorbaserad lösning. VIIRS-tidsseriebilderna omvandlas till vektorer av pixeltidsserier som indata till den föreslagna transformatormodellen. Transformatorns uppmärksamhetsmekanism hjälper till att hitta relationen mellan pixlarna vid olika tidssteg. Genom att upptäcka variationen i pixel- värdena klassificerar den föreslagna modellen pixeln vid olika tidssteg som en aktiv brandpixel eller en icke-brandpixel. Den föreslagna metoden testas på 18 undersökningsområden i olika regioner och ger ett F1-värde på 0,804. Den överträffar VIIRS-produkterna för aktiva bränder från NASA som har en F1- poäng på 0,663. Transformatormodellen har också visat sig vara överlägsen för aktiv branddetektering jämfört med andra sekvensmodeller som GRU (0,647 F1-Score) och LSTM (0,756 F1-Score). Dessutom visar både F1-poäng och IoU-poäng för alla sekvensmodeller att sekventiella modeller presterar myc- ket bättre än spatiala ConvNet-modeller, till exempel UNet (0,609 F1-poäng) och Trans-U-Net (0,641 F1-poäng). 

Framtida forskning planeras för att utforska potentialen hos både optiska och SAR-satellitdata, t.ex. VIIRS, Sentinel-2, Landsat-8/9, Sentinel-1 C-band SAR och ALOS Phased Array L-band Synthetic Aperture Radar (PALSAR), för daglig kartläggning av skogsbränders utveckling. Avancerade modeller för djupinlärning, t.ex. Swin-Transformer och SwinUNETR, kommer också att undersökas för att förbättra utnyttjandet av flera sensorer. 

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-327380