Lexical and Acoustic Modelling of Swedish Prosody
Författare
Summary, in Swedish
Popular Abstract in Swedish
Prosodi och intonation är viktiga delar i det mänskliga talet. I system för text-till-talomvandling och automatisk taligenkänning måste prosodiska modeller inkluderas för att uppnå acceptabla resultat. Denna avhandling bidrar till modelleringen av svensk prosodi ur lexikalt och akustiskt perspektiv.
Tre aspekter av lexikal modellering av prosodi studeras. Vi skisserar en modell av prosodibehandlingen för 'icke-standard'-ord, samt genomför en analys av ordbetoning i svenska. I en större studie byggs ett CART-baserat system för förutsägelse av uttal från ortografi. Genom förutsägelse bokstav-för-bokstav förutsägs allofoner korrekt till 98.87% och hela ord korrekt till 72.26%. För prosodi uppnås de bästa resultaten genom förutsägelser från hela ordmönster: huvudbetoningens position är korrekt i 88.6% och ordaccenten i 87.7% av fallen.
I den akustiska delen presenteras först två översikter: en om tidigare arbeten inom talteknologiinriktad modellering av svenskans intonation, samt en om intonationsmodeller i allmänhet, med tonvikt på stiliseringsmodeller. Vårt eget bidrag utgörs av utvecklandet av ett system som genererar grundtonskurvor utifrån prosodiska transkriptioner.
Den sista studien handlar om automatisk identifiering och klassificering av dialekttyp, ordaccentkategori och prominensnivå i svenskan. Material från nästan 100 olika dialekter och 250 talare används. Genom parametrisering av grundtonskurvor, bl a genom stiliseringsmodeller, byggs modeller för förutsägelse av ovan nämnda kategorier. De bästa resultaten är 79.3% för ordaccent, 62.2% för prominensnivå, samt 59.1% för dialekttyp. För enskilda orter, kan ordaccentkategori klassificeras korrekt i upp till över 90% av fallen.
Prosodi och intonation är viktiga delar i det mänskliga talet. I system för text-till-talomvandling och automatisk taligenkänning måste prosodiska modeller inkluderas för att uppnå acceptabla resultat. Denna avhandling bidrar till modelleringen av svensk prosodi ur lexikalt och akustiskt perspektiv.
Tre aspekter av lexikal modellering av prosodi studeras. Vi skisserar en modell av prosodibehandlingen för 'icke-standard'-ord, samt genomför en analys av ordbetoning i svenska. I en större studie byggs ett CART-baserat system för förutsägelse av uttal från ortografi. Genom förutsägelse bokstav-för-bokstav förutsägs allofoner korrekt till 98.87% och hela ord korrekt till 72.26%. För prosodi uppnås de bästa resultaten genom förutsägelser från hela ordmönster: huvudbetoningens position är korrekt i 88.6% och ordaccenten i 87.7% av fallen.
I den akustiska delen presenteras först två översikter: en om tidigare arbeten inom talteknologiinriktad modellering av svenskans intonation, samt en om intonationsmodeller i allmänhet, med tonvikt på stiliseringsmodeller. Vårt eget bidrag utgörs av utvecklandet av ett system som genererar grundtonskurvor utifrån prosodiska transkriptioner.
Den sista studien handlar om automatisk identifiering och klassificering av dialekttyp, ordaccentkategori och prominensnivå i svenskan. Material från nästan 100 olika dialekter och 250 talare används. Genom parametrisering av grundtonskurvor, bl a genom stiliseringsmodeller, byggs modeller för förutsägelse av ovan nämnda kategorier. De bästa resultaten är 79.3% för ordaccent, 62.2% för prominensnivå, samt 59.1% för dialekttyp. För enskilda orter, kan ordaccentkategori klassificeras korrekt i upp till över 90% av fallen.
Avdelning/ar
Publiceringsår
2003
Språk
Engelska
Publikation/Tidskrift/Serie
Travaux de l'Institut de Linguistique de Lund
Volym
45
Dokumenttyp
Doktorsavhandling
Ämne
- General Language Studies and Linguistics
Nyckelord
- phonology
- Phonetics
- stress
- dialects
- Swedish
- word accents
- letter-to-sound
- text-to-speech
- modelling
- intonation
- prosody
- speech technology
- Fonetik
- fonologi
- Scandinavian languages and literature
- Nordiska språk (språk och litteratur)
Status
Published
Handledare
- [unknown] [unknown]
ISBN/ISSN/Övrigt
- ISSN: 0347-2558
- ISBN: 91-974116-8-X
Försvarsdatum
28 maj 2003
Försvarstid
10:15
Försvarsplats
Kulturanatomen, sal 201, Biskopsgatan 7
Opponent
- David House (Docent)