Till innehåll på sidan
Till KTH:s startsida

Towards Unsupervised, Analysable and Scalable Node Embedding Models for Transaction Networks

Tid: On 2025-12-10 kl 09.00

Plats: / F3 (Flodis), Lindstedtsvägen 26

Videolänk: https://kth-se.zoom.us/j/64433421713

Språk: Engelska

Ämnesområde: Datalogi

Respondent: Ciwan Ceylan , Robotik, perception och lärande, RPL

Opponent: Associate Professor Davide Mottin, Aarhus University

Handledare: Professor Danica Kragic Jensfelt, Collaborative Autonomous Systems

Exportera till kalender

QC 20251118

Abstract

Förmågan att effektivt lära sig inbäddningar, det vill säga lågdimensionella vektorrepräsentationer av komplex data, har varit central för de senaste framstegen inom maskininlärning. Nätverksbaserade data modeller, som representerar entiteter (noder) och deras relationer (kanter), utgör ett kraftfullt verktyg för att studera olika typer av system, från sociala interaktioner och infrastruktur till molekylärbiologi. Både forskning och praktiska tillämpningar av dessa nätverk har haft stor nytta av framstegen inom inbäddningsinlärning, där särskilt nodinbäddningar har möjliggjort effektiv tillämpning av nodklassificering, nodklustring, avvikelsedetektering, graf-matchning och länkprediktion.

Dock har inte alla typer av nätverk gjort lika stora framsteg. I synnerhet är inbäddningsmodeller för transaktionsnätverk – som bildas genom digitala betalningar, överföringar och valutaväxlingar – fortfarande underutvecklade, trots deras höga potential i tillämpningar som exempelvis finansiell brottsbekämpning. Därför återstår flera metodologiska utmaningar vid inlärning av nodinbäddningar för transaktionsnätverk, eftersom centrala modaliteter måste fångas samtidigt som viktiga modellkrav uppfylls. Denna avhandling beaktar tre sådana krav: modeller måste vara oövervakade, på grund av bristen på uppmärkta datasets; analyserbara, för att säkerställa tolkbarhet då exakt kvantitativ utvärdering är svårtillgänglig; samt skalbara, för att kunna hantera den storlek och komplexitet som kännetecknar verkliga transaktionsnätverk.

Med dessa mål som vägledning introducerar avhandlingen nodinbäddningsmodeller utformade för att fånga tre centrala modaliteter i transaktionsnätverk: flöden mellan noder, kantsriktning och flerskaliga strukturer. Därigenom bidrar den med både metodologiska framsteg och analytiska insikter. Fyra huvudsakliga resultat är att:(i) det är möjligt att lära nodinbäddningar som representerar transaktionsflöden, något som tidigare inte har visats;(ii) noder som enbart tar emot transaktioner (så kallade ”sänkor”) försämrar inbäddningskvaliteten, men detta kan motverkas genom att kombinera riktad och oriktad informationspropagering;(iii) standardmetoder för meddelande-propagering kan leda till rangbrist, vilket skadar inbäddningskvaliteten, men detta kan lösas genom en ny teknik kallad meddelande-aggregering; samt(iv) inbäddningar kan göras tolkbara, där varje egenskap motsvarar en meningsfull aspekt av nätverket.

En återkommande praktisk utmaning inom forskningen om transaktionsnätverk – och en huvudorsak till dess begränsade framsteg – är bristen på tillgängliga datamängder, till följd av de säkerhets- och integritetskrav som omger finansiell data. Denna avhandling kringgår detta problem genom att fokusera på de underliggande metodologiska utmaningarna vid modellering av nodinbäddningar för transaktionsnätverk. Omfattande empiriska utvärderingar genomförs på både proxydatamängder – bestående av kommunikations- och sociala nätverk som delar samma centrala modaliteter som verkliga bankdata – samt på offentligt tillgängliga dataset för kryptovaluta och simulerade transaktionsnätverk, vilket möjliggör bredare validering av de föreslagna modellerna.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-373037