Till innehåll på sidan
Till KTH:s startsida Till KTH:s startsida

Quantifying Meaning

Tid: Ti 2023-01-17 kl 09.00

Plats: F3, Lindstedtsvägen 26 & 28, Stockholm

Videolänk: https://kth-se.zoom.us/j/66943302856

Språk: Engelska

Ämnesområde: Datalogi

Respondent: Amaru Cuba Gyllensten , Beräkningsvetenskap och beräkningsteknik (CST)

Opponent: Professor Hinrich Schütze, Centrum für Informations- und Sprachverarbeitung, Ludwig-Maximilians-Universität, München, Germany

Handledare: Adjunct Professor Anders Holst, Beräkningsvetenskap och beräkningsteknik (CST)

Exportera till kalender

QC 20221207

Abstract

Distributionella semantikmodeller är en klass av maskininlärningsmodeller med syfte att konstruera representationer som fångar semantik, i.e. mening, av objekt som bär mening på ett datadrivet sätt. Denna avhandling är särskilt inriktad på konstruktion av semantisk representation av ord, en strävan som har en lång historia inom datalingvistik och som sett dramatiska utvecklingar under de senaste åren.

Det primära forskningsmålet med denna avhandling är att utforska gränserna och tillämpningarna av distributionella semantikmodeller av ord, i.e. word embeddings. I synnerhet utforskar den relationen mellan modell- och embeddingsemantik, det vill säga hur modelldesign påverkar vad ord-embeddings innehåller, hur man resonerar om ord-embeddings, och hur egenskaperna hos modellen kan utnyttjas för att extrahera ny information från embeddings. Konkret introducerar vi topologiskt medvetna grannskapsfrågor som berikar den information som erhålls från grannskap extraherade från distributionella sematikmodeller, villkorade likhetsfrågor (och modeller som möjliggör dem), konceptutvinning från distributionella semantikmodeller, tillämpningar av embbeddningmodeller inom statsvetenskap, samt en grundlig utvärdering av en bred mängd av distributionella semantikmodeller.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-322262