Mnohem lépe pochopit, co je a jak to funguje, širokým tahem systému syntetický hlas Chtěl bych se zmínit o jasném příkladu, s nímž jsme se jistě všichni někdy setkali, konkrétně mluvím o videích přítomných na YouTube a dalších internetových službách, kde vypravěč mluví prostřednictvím počítačem generovaný hlas. Snad nejznámější a nejpoužívanější software pro čtení je šílený I když dnes je pravdou, že se tyto systémy hodně vyvinuly, máme důkaz Cortana o Siri.
Dnes nejnovější a sofistikovaný program syntézy řeči, který nabízí Google, software známý pod názvem Waynet a který vytvořili inženýři patřící k oddělení DeepMind, společnost s umělou inteligencí, kterou společnost Google získala v roce 2014. WayNet je a software pro syntézu řeči založený na komplexních algoritmech umělé inteligence který funguje jako komplexní nervový systém.
WaveNet, revoluční hlasový syntetizátor, který vás překvapí
Mezi novinkami, které WayNet představuje, je třeba poznamenat, že ačkoli dosud byla hlavní používanou metodou TTS, převod textu na řeč, kde byly různé zaznamenané fragmenty řeči kombinovány za účelem sestavování slov a vět nebo označovány jako Parametrické TTSMetoda, která odesílá text do kodéru řeči, jehož výsledky jsou ještě méně přirozené než předchozí, nyní zjistíme, že WayNet namísto pouhého kombinování a přehrávání zvuku, integruje komplexní systém umělé inteligence, který je schopen se učit a přizpůsobovat se kontextu.
Tento nový systém je schopen fungovat 16.000 XNUMX vzorků za sekundu umožňuje vám dokonce generovat vlastní zvukové sekvence bez lidského zásahu. Na druhou stranu stojí za zmínku, že inženýři odpovědní za jeho vývoj zavedli systém schopný uchýlit se ke statistikám, aby předpověděl, co bude muset říci později, a tak zajistit, že systém nabídne výsledky mnohem rychleji a plynuleji. Pokud vás WayNet zajímá, řekněte vám, že na jeho webových stránkách můžete poslechněte si různé ukázky v angličtině a mandarínské čínštině.
Více informací: DeepMind