Před pár týdny jsme vám dali vědět, že sbíráme české věty pro projekt Common Voice. Od té doby jsme nasbírali několik tisíc vět a můžeme se proto posunout dále – ke sběru nahrávek. Vyzkoušeli jsme si to už na slovenském PyConu, kde jsme pár stovek nahrávek nasbírali. Všechno, až na pár drobných chyb, fungovalo, na voice.mozilla.cz jsme tak umístili klon oficiálního webu Common Voice. Na naší české verzi tak můžete začít nahrávat věty, které jsme posbírali. Stačí vám k tomu mikrofon a podporovaný prohlížeč.
Nestojíme jen o čisté nahrávky, ruchy v pozadí jsou žádoucí. Právě mírně zarušený zvuk totiž bude výsledný engine zpracovávat, když totiž něco ovládáte hlasem, neděláte to ve studiu s profi mikrofonem a akustickou pěnou na zdech.
Sběr u nás poběží až do doby, dokud Mozilla neumožní na oficiálním webu sbírat nahrávky pro další jazyky. Jakmile tento moment nastane, všechny věty i nahrávky Mozille předáme a sběr bude pokračovat u ní. Díky tomu, že jsme se sběrem začali už teď, budeme jedním z prvních jazyků, které se na oficiálním webu objeví.
Rád bych poděkoval všem, kteří nám přispěli svojí starou slohovkou nebo jinými texty. Díky vám můžeme tvořit otevřený český hlasový dataset.
Kkt1 napsal(a)
Michal Vašíček napsal(a)
Kkt1 napsal(a)
Michal Vašíček napsal(a)