• USD 41.6
  • EUR 43.9
  • GBP 52.7
Спецпроєкти

У Google розробили просунутий синтезатор мови нового покоління

Реклама на dsnews.ua
Система перетворення тексту в природно лунаючу мову Tacotron 2 справляється з цим завданням ефективніше за своїх попередників Tacotron і WaveNet

Попередні системи генерації мови мали ряд істотних недоліків. WaveNet, приміром, видавала дуже різкі звуки, пише "ДС" з посиланням на TechCrunch.

Tacotron краще справлявся з інтонаціями, але не міг видавати повноцінний "мовний продукт".

Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограмму, в якій розподіляються ритм і наголоси, а слова генеруються в аналогу WaveNet. Крім того, додана система збору даних для навчання нейромережі.

Аудіозапис дійсно схожа на мова живого людина. Темп мовлення звучить досить переконливо, а основні запинки відбуваються на словах з незвичайним вимовою. Правда, частина слухачів в коментарях стверджує, що деякі слова система вимовляє "ламано".

Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії.

Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яка фраза буде виголошена піднесено, а яка - грубо.

    Реклама на dsnews.ua