AUC Philologica (Acta Universitatis Carolinae Philologica) je akademický časopis publikující jak lingvistické, tak literárně historické a teoretické studie. Nedílnou součástí časopisu jsou i recenze odborných knih a zprávy z akademického prostředí.
Časopis je indexován v databázích CEEOL, DOAJ, EBSCO a ERIH PLUS.
AUC PHILOLOGICA, Vol 2014 No 1 (2014)
General and Speaker-Specific Properties of F0 Contours in Short Utterances
Jan Volín, Tomáš Bořil
zveřejněno: 28. 12. 2014
Abstract
This study compares three major quantitative methods of contour analysis with the aim to establish their merit for intonation research. Utterances of 24 speakers (7–9 syllables long) taken from short dialogues were used to see whether general prosodic patterning determined by the intonational grammar of the language and the individual production habits of the speakers can be captured by computational means. The three methods exploited were: k-means clustering (KMC), polynomial regression analysis (PRA), and functional principal component analysis (FPCA). The numerical outputs of the methods are confronted with human perception of the contour in both auditory and visual domains. The results suggest that the observed contour properties are reflected by all three methods reasonably well: phonetically interpretable outcomes can be achieved by each of them. As to speakers’ individual features, KMC seems to be least vulnerable to spurious effects. Obecné a individuální vlastnosti kontur F0 v krátkých promluvách Studie porovnává tři zásadní metody kvantitativní analýzy křivek nebo konturových průběhů. Cílem je zjistit jejich užitečnost pro výzkum intonace. Materiálem byly promluvy 24 mluvčích extrahované z krátkých dialogů. Tyto promluvy byly obsahově shodné, sedm až devět slabik dlouhé, a každý mluvčí vyprodukoval dané sdělení dvakrát: jednou v singuláru, podruhé v plurálu. Obě verze byly při nahrávání odděleny řadou jiných dialogů, jedna tedy není mechanicky vyslovenou kopií druhé. Analýzy zjišťovaly, zda jsou vybrané metody schopny zachytit prozodické vzorce dané intonační gramatikou češtiny a zároveň prozradit něco o individuálních produkčních preferencích mluvčího. Zkoumanými metodami bylo: shlukování pomocí k-průměrů, nelineární regresní analýza a funkční analýza hlavních komponent. Numerický výstup metod byl porovnán s lidskou percepcí v auditivní i vizuální doméně. Výsledky ukázaly, že každá ze tří metod funguje poměrně dobře: výstupy jsou srozumitelné a lingvisticky interpretovatelné. Zdá se, že co do náhodných prvků je nejodolnější shlukování pomocí k-průměrů. Možnosti jednotlivých metod je však nutno dále prověřovat za různých podmínek a v kontextu různých hypotéz.
klíčová slova: melody of speech; cluster analysis; speaker identity; recognition; fundamental frequency
230 x 157 mm
vychází: 3 x ročně
cena tištěného čísla: 150 Kč
ISSN: 0567-8269
E-ISSN: 2464-6830