Till innehåll på sidan
Till KTH:s startsida

Mechanisms and Methods in the Pointwise Maximal Leakage Framework

Tid: Ti 2025-06-10 kl 10.00

Plats: D3, Lindstedtsvägen 5, Stockholm

Videolänk: https://kth-se.zoom.us/j/62617477105

Språk: Engelska

Ämnesområde: Elektro- och systemteknik

Licentiand: Leonhard Grosse , Teknisk informationsvetenskap

Granskare: Assistant Professor Yanina Shkel, EPFL, Swiss Federal Institute of Technology in Lausanne, Switzerland

Huvudhandledare: Professor Tobias J. Oechtering, Teknisk informationsvetenskap; Professor Mikael Skoglund, Teknisk informationsvetenskap; Doctor Sara Saeidian, Teknisk informationsvetenskap, INRIA

Exportera till kalender

QC 20250513

Abstract

Plattformiseringen av varor och tjänster har gjort insamling och bearbetning av data till en lukrativ verksamhet. I takt med denna insamling av konsumentmikrodata uppstår ett hot mot individers dataintegritet som inte kan underskattas. Mot bakgrund av detta hot har dataintegritet som en egenskap hos databehandlingssystem vuxit fram som en term för att beskriva risken att algoritmer avslöjar individers känsliga egenskaper för tredje part utan deras uttryckliga samtycke. Inom datavetenskap och angränsande områden har detta lett till forskningsinsatser för att utveckla matematiska ramverk som kan kvantifiera detta informationsläckage och erbjuda verktyg för att motverka oönskade avslöjanden. Sådana ramverk syftar till att möjliggöra garanterad dataintegritet för algoritmer och databehandlingssystem, det vill säga garantier som framträder som en matematisk egenskap hos en algoritm. Ett sådant ramverk är punktvist maximalt läckage (PML). PML är ett informationsteoretiskt mått på dataintegritet som kvantifierar det värsta fallet av informationsläckage av privat data till en angripare med godtycklig sidoinformation. En fördel med PML är dess operationella definition baserad på hotmodeller. Specifikt härleds PML genom att analysera hur effektivt en angripare kan härleda privata egenskaper från givna observationer eller databasstatistik. Detta sätt att definiera dataintegritet ger en matematiskt precis innebörd, då alla antaganden om angriparna görs explicita i hotmodellen. Vidare har det nyligen visats att integritetsgarantier enligt PML också erbjuder en stark tolkning av integritetsparametern i termer av minimumentropin hos dold och eventuellt avslöjad information. Denna avhandling tillhandahåller grundläggande metoder för integritetsanalys och mekanismdesign inom PML-ramverket. För det första etablerar vi fundamentala samband mellan integritetsmått som använder informationsdensitet för att mäta informationsläckage. Vi visar hur förhållandet mellan övre och nedre gränser för informationstäthet ger nya kopplingar mellan lokal informationsintegritet, asymmetrisk lokal informationsintegritet, PML och lokal differentiell dataintegritet. Vi tillämpar också dessa resultat för mekanismdesign för dataintegritet. För det andra undersöker vi avvägningen mellan dataintegritet och nytta för PML och tillhandahåller optimala mekanismer för en generell klass av konvexa nyttokriterier, givet att den datagenererande fördelningen av privat data är perfekt känd. Genom att använda verktyg från konvex analys och majoriseringsteori härleder vi slutna uttryck för optimala mekanismer under vissa parameterkonfigurationer. Vidare presenterar vi ett linjärt program för att beräkna optimala mekanismer i allmänhet. Eftersom perfekt kännedom om den datagenererande fördelningen sällan är möjlig i praktiken, föreslår vi ett ramverk för PML-integritetsanalys och -mekanismdesign baserat på empiriska skattningar av à-priorifördelningar. Vi introducerar begreppen lokal-läckagekapacitet och -läckagekänslighet, vilka underlättar både integritetsanalys och mekanismdesign under à-priorifördelningsosäkerhet. Vi visar att lokal läckagekapacitet fungerar som en Lipschitzkonstant för PML med avseende på ℓ1-avståndet mellan à-priorifördelningar. Med hjälp av stora avviksgränser härleder vi distributionsoberoende (ε, δ)-PML-garantier och presenterar en optimal binär mekanism. Dessutom visar vi att mekanismdesign under osäker à-priorifördelning kan reduceras till ett konvext optimeringsproblem med linjära begränsningar och tillämpar våra metoder för att analysera läckageegenskaper hos standardmekanismer såsom Laplace- och Gaussmekanismerna. Avslutningsvis undersöker vi sambandet mellan PML och starka databehandlingsolikheter (SDPI) för Rényi- och Hellingerdivergenser. Vi tillhandahåller villkor under vilka databehandlingsolikheten för Rényidivergenser uppfylls med likhet och analyserar kontraktionsegenskaper hos begränsade mängder av à-priorifördelningar via f-divergensolikheter. I synnerhet härleder vi en förbättrad version av Pinskers olikhet med hjälp av den gemensamma bildmengd tekniken, och utökar Binettes optimala omvända Pinskers olikhet till en tvärkanalsinställning, vilket möjliggör att förfina SDPI:er till specifika indatafördelningar. Vi använder dessa resultat för att kvantifiera förstärkningen av lokal differentiell dataintegritet för en kanal som uppfyller ett PML-villkor, men inte nödvändigtvis något villkor för lokal differentiell dataintegritet.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-363308