Всем известна проблема чистоты и ритмичности произношения текстов, озвучиваемых компьютерным синтезатором речи. Похоже, разработчикам версии технологии TTS (Text-to-Speech), разработанной в недрах AT&T Labs, удалось продвинуться значительно дальше других: представленный компанией синтезатор речи Natural Voices успешно конвертирует текст в аудио сообщения с весьма качественным (насколько можно судить по моей практике) североамериканским, английским, латиноамериканским испанским, немецким и французским акцентом; разными мужскими и женскими голосами.
Впервые разработкой своей версии TTS в AT&T Labs занялись еще в 1998 году, с тех пор продолжается ее развитие. В наше время распространение подобных технологий может быть востребовано во многих сферах бытия, от зачитывания SMS - современных телеграмм, до обучающих систем и особого вида телеконференций, где качественное произнесение может оказаться важнее живого голоса респондента. Кстати, попутно в AT&T разрабатывается технология Visual TTS, где синтезированная речь синхронизируется с анимированным лицом.
|