Towards Unsupervised, Analysable and Scalable Node Embedding Models for Transaction Networks
Tid: On 2025-12-10 kl 09.00
Plats: / F3 (Flodis), Lindstedtsvägen 26
Videolänk: https://kth-se.zoom.us/j/64433421713
Språk: Engelska
Ämnesområde: Datalogi
Respondent: Ciwan Ceylan , Robotik, perception och lärande, RPL
Opponent: Associate Professor Davide Mottin, Aarhus University
Handledare: Professor Danica Kragic Jensfelt, Collaborative Autonomous Systems
QC 20251118
Abstract
Förmågan att effektivt lära sig inbäddningar, det vill säga lågdimensionella vektorrepräsentationer av komplex data, har varit central för de senaste framstegen inom maskininlärning. Nätverksbaserade data modeller, som representerar entiteter (noder) och deras relationer (kanter), utgör ett kraftfullt verktyg för att studera olika typer av system, från sociala interaktioner och infrastruktur till molekylärbiologi. Både forskning och praktiska tillämpningar av dessa nätverk har haft stor nytta av framstegen inom inbäddningsinlärning, där särskilt nodinbäddningar har möjliggjort effektiv tillämpning av nodklassificering, nodklustring, avvikelsedetektering, graf-matchning och länkprediktion.
Dock har inte alla typer av nätverk gjort lika stora framsteg. I synnerhet är inbäddningsmodeller för transaktionsnätverk – som bildas genom digitala betalningar, överföringar och valutaväxlingar – fortfarande underutvecklade, trots deras höga potential i tillämpningar som exempelvis finansiell brottsbekämpning. Därför återstår flera metodologiska utmaningar vid inlärning av nodinbäddningar för transaktionsnätverk, eftersom centrala modaliteter måste fångas samtidigt som viktiga modellkrav uppfylls. Denna avhandling beaktar tre sådana krav: modeller måste vara oövervakade, på grund av bristen på uppmärkta datasets; analyserbara, för att säkerställa tolkbarhet då exakt kvantitativ utvärdering är svårtillgänglig; samt skalbara, för att kunna hantera den storlek och komplexitet som kännetecknar verkliga transaktionsnätverk.
Med dessa mål som vägledning introducerar avhandlingen nodinbäddningsmodeller utformade för att fånga tre centrala modaliteter i transaktionsnätverk: flöden mellan noder, kantsriktning och flerskaliga strukturer. Därigenom bidrar den med både metodologiska framsteg och analytiska insikter. Fyra huvudsakliga resultat är att:(i) det är möjligt att lära nodinbäddningar som representerar transaktionsflöden, något som tidigare inte har visats;(ii) noder som enbart tar emot transaktioner (så kallade ”sänkor”) försämrar inbäddningskvaliteten, men detta kan motverkas genom att kombinera riktad och oriktad informationspropagering;(iii) standardmetoder för meddelande-propagering kan leda till rangbrist, vilket skadar inbäddningskvaliteten, men detta kan lösas genom en ny teknik kallad meddelande-aggregering; samt(iv) inbäddningar kan göras tolkbara, där varje egenskap motsvarar en meningsfull aspekt av nätverket.
En återkommande praktisk utmaning inom forskningen om transaktionsnätverk – och en huvudorsak till dess begränsade framsteg – är bristen på tillgängliga datamängder, till följd av de säkerhets- och integritetskrav som omger finansiell data. Denna avhandling kringgår detta problem genom att fokusera på de underliggande metodologiska utmaningarna vid modellering av nodinbäddningar för transaktionsnätverk. Omfattande empiriska utvärderingar genomförs på både proxydatamängder – bestående av kommunikations- och sociala nätverk som delar samma centrala modaliteter som verkliga bankdata – samt på offentligt tillgängliga dataset för kryptovaluta och simulerade transaktionsnätverk, vilket möjliggör bredare validering av de föreslagna modellerna.