KTH bidrar till nytt uttalslexikon som förbättrar uppläsning med talsyntes

Språkbanken Tal på KTH och Myndigheten för tillgängliga medier (MTM) har utvecklat Braxen, ett lexikon som innehåller information om hur ord och namn uttalas. Braxen är fritt tillgängligt och består av omkring 850 000 ord och namn, men utökas ständigt för att hållas aktuellt.
MTM har producerat uppläst text med text-till-talsyntes sedan 2006 och anpassar främst högskoleböcker och nyhetstexter. Dessa texter är ofta mer komplexa än till exempel skönlitteratur och innehåller många facktermer och utländska egennamn som en traditionell talsyntesröst ofta inte uttalar korrekt.
Därför arbetar MTM med egna uttalslexikon för att instruera talsyntesröster om hur ord och namn ska uttalas.
Värdefull för många olika aktörer
Braxen uppdateras regelbundet med nya nyhetsord som namn på idrottsstjärnor eller geografiska platser, samt facktermer från olika ämnesområden som medicin och juridik.
– Braxen är unik eftersom lexikonet innehåller många svåra ord och uttal, som facktermer och ord och namn på andra språk än svenska, och för att det hela tiden uppdateras. Braxen kan till exempel bidra till att en e-bok blir mer tillgänglig när uttalen används för att instruera en talsyntesröst om hur ett svårt ord ska uttalas, säger Christina Tånnander på MTM , som arbetat med lexikonet sedan 2006.
Lexikonet ger företag, forskare och individer rätt att använda, bearbeta och dela det under Apache 2.0/ CC BY 4.0-licens . Braxen består av cirka 700 000 allmänna ord och 150 000 namn, och innehåller information om bland annat uttal och ordklass.
– Braxen är en värdefull resurs både för aktörer som förlag, tidningar och universitet i deras arbete med att skapa bättre tillgänglig text med hjälp av talsyntes och för svensk talforskning och talteknologisk forskning, säger Jens Edlund, föreståndare för Språkbanken Tal på KTH.
Hur använder man Braxen?
Braxen kan användas för att instruera en talsyntesröst om uttalet för specifika ord. Hur detta görs beror på vilket talsyntessystem man använder. Vissa system stödjer användarlexikon där uttalsinformation hämtas automatiskt, och många system hanterar standardformatet Speech Synthesis Markup Language där uttalsinformation infogas direkt i texten.
Samtidigt utgör Braxen en mer allmän resurs för talforskning. Med sitt stora antal validerade uttal kan den bidra till många typer av undersökningar och språkteknologisk utveckling där en uttalsangivelse kan vara lika viktigt eller viktigare än stavningen.
Exempel på användare som kan ha nytta av Braxen är:
- Aktörer som skapar texter med talsyntes, som förlag, tidningar, universitet och högskolor.
- Individer som själva kan konfigurera sina talsyntesröster så att de använder uttalsinformation från Braxen för en förbättrad lyssningsupplevelse.
- Talforskare inom t.ex. logopedi, fonetik, dialektforskning.
- Talteknologisk forskning och utveckling inom (t.ex. talad människa-dator-interaktion, tillgänglighet, utbildning, underhållning, och vård/hälsa.
Läs mer om Braxen och ladda ner lexikonet här