Rubriky: Mozilla

Český Common Voice postupuje dál, začali jsme sbírat nahrávky

Před pár týdny jsme vám dali vědět, že sbíráme české věty pro projekt Common Voice. Od té doby jsme nasbírali několik tisíc vět a můžeme se proto posunout dále – ke sběru nahrávek. Vyzkoušeli jsme si to už na slovenském PyConu, kde jsme pár stovek nahrávek nasbírali. Všechno, až na pár drobných chyb, fungovalo, na voice.mozilla.cz jsme tak umístili klon oficiálního webu Common Voice. Na naší české verzi tak můžete začít nahrávat věty, které jsme posbírali. Stačí vám k tomu mikrofon a podporovaný prohlížeč.

Nestojíme jen o čisté nahrávky, ruchy v pozadí jsou žádoucí. Právě mírně zarušený zvuk totiž bude výsledný engine zpracovávat, když totiž něco ovládáte hlasem, neděláte to ve studiu s profi mikrofonem a akustickou pěnou na zdech.

Sběr u nás poběží až do doby, dokud Mozilla neumožní na oficiálním webu sbírat nahrávky pro další jazyky. Jakmile tento moment nastane, všechny věty i nahrávky Mozille předáme a sběr bude pokračovat u ní. Díky tomu, že jsme se sběrem začali už teď, budeme jedním z prvních jazyků, které se na oficiálním webu objeví.

Rád bych poděkoval všem, kteří nám přispěli svojí starou slohovkou nebo jinými texty. Díky vám můžeme tvořit otevřený český hlasový dataset.

4 komentářů k článku “Český Common Voice postupuje dál, začali jsme sbírat nahrávky”

  1. Kkt1 napsal(a)

    Nemohli by jste uvest tu spravnou kombinaci pro prohlizec kde to bude fungovat?

    1. Michal Vašíček napsal(a)

      Fungovat by měl web ve Firefoxu 29 a novějším a v Chromu 49 a novějším. Pokud nefunguje, můžu poprosit o podrobnosti?

  2. Kkt1 napsal(a)

    Safari v iOS nefunguje.

    1. Michal Vašíček napsal(a)

      To je pravda. Safari v iOS totiž nepodporuje JS API MediaRecorder. Mozilla ale vydala aplikaci Common Voice (https://itunes.apple.com/us/app/project-common-voice-by-mozilla/id1240588326?mt=8), která problém řeší. Brzo by pak měl začít fungovat i samotný web.