Přejít k obsahu

Publikační činnost

Přehled publikační činnosti je uveden ve výročních zprávách na úřední desce FAV.

Níže je k dispozici on-line výpis z databáze publikační činnosti v jednotlivých letech (Pozn. vzhledem k většímu počtu publikačních výsledků může trvat zobrazení výpisu déle).



Anomaly-based annotation error detection in speech-synthesis corpora

Citace:
MATOUŠEK, J., TIHELKA, D. Anomaly-based annotation error detection in speech-synthesis corpora. COMPUTER SPEECH AND LANGUAGE, 2017, roč. 46, č. November, s. 1-35. ISSN: 0885-2308
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Anomaly-based annotation error detection in speech-synthesis corpora
Rok vydání: 2017
Autoři: Doc. Ing. Jindřich Matoušek Ph.D. , Ing. Daniel Tihelka Ph.D.
Abstrakt CZ: V článku je zkoumán problém automatické detekce anotačních chyb v řečových korpusech čtené řeči namluvených jedním řečníkem pro účely syntézy řeči. Byl adoptován přístup využívající detekci anomálií, ve kterém správně anotovaná slova jsou považována za normální příklady, na nichž se metody detekce trénují. Chybně anotovaná slova jsou brána jako příklady anomálií, které nevykazují normální charakteristiky natrénovaných detekčních modelů. Výsledky s F1 skóre blízko 89 % ukazují, že detekce anomálií může pomoci při detekci anotačních chyb v korpusech čtené řeči určených pro syntézu řeči. Ukazujeme, že automaticky redukované množiny příznaků dosahují statisticky podobné výsledky jako ručně připravené množiny příznaků. Ukazuje se, že rozumná úspěšnost detekce může být dosažena s využitím významně méně příkladů během vývojové fáze detektoru. Dále navrhujeme koncept "volicího detektoru" - kombinaci anomálních detektorů, ve které každý "jednotlivý" detektor "volí", zda je testovací slovo anotováno správně nebo chybně. Konečné rozhodnutí se pak získá sečtením hlasů. Naše výsledky ukazují, že volicí detektor má potenciál překonat každý z jednotlivých anomálních detektorů. Dále přístup detekce anomálií porovnáváme s klasifikačním přístupem (který, na rozdíl od prvního přístupu, musí pro trénink využívat i anomální příklady) a ukazujeme, že oba přístupy vedou ke statisticky podobným výsledkům, když se během vývoje detektoru/klasifikátoru použijí všechny anomální příklady. Pokud se však použije jen menší část anomálních příkladů, navržený přístup detekce anomálií jasně překonává klasifikační přístup. Finální poslechový test potvrdil účinnost navržené detekce anotačních chyb pomocí detekce anomálií pro zlepšování kvality syntetické řeči.
Abstrakt EN: We investigate the problem of automatic detection of annotation errors in single-speaker read-speech corpora used for speech synthesis. For the purpose of annotation error detection, we adopt an anomaly detection framework in which correctly annotated words are considered as normal examples on which the detection methods are trained. Misannotated words are then taken as anomalous examples which do not conform to normal patterns of the trained detection models. The results with F1 score being almost 89% show that anomaly detection could help detecting annotation errors in read-speech corpora for speech synthesis. We show that the automatically reduced feature sets achieve statistically similar results as the hand-crafted feature sets. We show that a reasonably good detection performance could be reached with using significantly fewer examples during the detector development phase. We also propose a concept of a voting detector ? a combination of anomaly detectors in which each ?single? detector ?votes? on whether or not a testing word is annotated correctly, and the final decision is then made by aggregating the votes. Our results show that the voting detector has a potential to overcome each of the single anomaly detectors. Furthermore, we compare the proposed anomaly detection framework to a classification-based approach (which, unlike anomaly detection, needs to use anomalous examples during training) and we show that both approaches lead to statistically comparable results when all available anomalous examples are utilized during detector/classifier development. However, when a smaller number of anomalous examples are used, the proposed anomaly detection framework clearly outperforms the classification-based approach. A final listening test showed the effectiveness of the proposed anomaly-based annotation error detection for improving the quality of synthetic speech.
Klíčová slova

Zpět

Patička