AUC PHILOLOGICA
AUC PHILOLOGICA

AUC Philologica (Acta Universitatis Carolinae Philologica) is an academic journal published by Charles University. It publishes scholarly articles in a large number of disciplines (English, German, Greek and Latin, Oriental, Romance and Slavonic studies, as well as in phonetics and translation studies), both on linguistic and on literary and cultural topics. Apart from articles it publishes reviews of new academic books or special issues of academic journals.

The journal is indexed in CEEOL, DOAJ, EBSCO, and ERIH PLUS.

AUC PHILOLOGICA, Vol 2014 No 1 (2014)

General and Speaker-Specific Properties of F0 Contours in Short Utterances

Jan Volín, Tomáš Bořil

published online: 28. 12. 2014

abstract

This study compares three major quantitative methods of contour analysis with the aim to establish their merit for intonation research. Utterances of 24 speakers (7–9 syllables long) taken from short dialogues were used to see whether general prosodic patterning determined by the intonational grammar of the language and the individual production habits of the speakers can be captured by computational means. The three methods exploited were: k-means clustering (KMC), polynomial regression analysis (PRA), and functional principal component analysis (FPCA). The numerical outputs of the methods are confronted with human perception of the contour in both auditory and visual domains. The results suggest that the observed contour properties are reflected by all three methods reasonably well: phonetically interpretable outcomes can be achieved by each of them. As to speakers’ individual features, KMC seems to be least vulnerable to spurious effects. Obecné a individuální vlastnosti kontur F0 v krátkých promluvách Studie porovnává tři zásadní metody kvantitativní analýzy křivek nebo konturových průběhů. Cílem je zjistit jejich užitečnost pro výzkum intonace. Materiálem byly promluvy 24 mluvčích extrahované z krátkých dialogů. Tyto promluvy byly obsahově shodné, sedm až devět slabik dlouhé, a každý mluvčí vyprodukoval dané sdělení dvakrát: jednou v singuláru, podruhé v plurálu. Obě verze byly při nahrávání odděleny řadou jiných dialogů, jedna tedy není mechanicky vyslovenou kopií druhé. Analýzy zjišťovaly, zda jsou vybrané metody schopny zachytit prozodické vzorce dané intonační gramatikou češtiny a zároveň prozradit něco o individuálních produkčních preferencích mluvčího. Zkoumanými metodami bylo: shlukování pomocí k-průměrů, nelineární regresní analýza a funkční analýza hlavních komponent. Numerický výstup metod byl porovnán s lidskou percepcí v auditivní i vizuální doméně. Výsledky ukázaly, že každá ze tří metod funguje poměrně dobře: výstupy jsou srozumitelné a lingvisticky interpretovatelné. Zdá se, že co do náhodných prvků je nejodolnější shlukování pomocí k-průměrů. Možnosti jednotlivých metod je však nutno dále prověřovat za různých podmínek a v kontextu různých hypotéz.

keywords: melody of speech; cluster analysis; speaker identity; recognition; fundamental frequency

230 x 157 mm
periodicity: 3 x per year
print price: 150 czk
ISSN: 0567-8269
E-ISSN: 2464-6830

Download