Создано описание русского языка в Festival и несколько вариантов голосов, все необходимые данные можно скачать с сайта проекта https://developer.berlios.de/projects/festlang . Записана речевая база для кластерного синтеза. Её можно использовать для создания программ распознавания и синтеза. Также создана база для программы распознавания CMU sphinx, данные и акустические модели для распознавания можно скачать с http://voxforge.org
На основе базы созданы несколько голосов - дифонный, кластерный и на технологии HMM.
Образецы синтеза:
Голоса распространяются свободно под лиценцией BSD (такой же, как и сам синтезатор Festival)
Мы использовали фонетическое описание и модель редукции, разработанную речевой группой МГУ http://www.philol.msu.ru/~otipl/SpeechGroup/
Использовался словарь Зализняка для расстановки ударений, а также программное обеспечение русской морфологии с http://aot.ru.
Для создания корпуса используются тексты с замечательной библиотеки Мошкова http://lib.ru.
Мы записали профессионального диктора с помощью Дмитрия Урюпина и проекта http://audiotheater.indeep.ru/
Пользователи Debian могут просто установить пакет:
http://packages.debian.org/ru/sid/festvox-ru
также, как и пользователи Ubuntu:
http://packages.ubuntu.com/karmic/festvox-ru
Версию для Windows можно скачать здесь
http://prdownload.berlios.de/festlang/festival-win-1.96b.7z
Насколько мне известно, пакеты также доступны для AltLinux и opensuse.
Скачайте голос msu_ru_nsh_clunits-0.5.tar.bz2. Последние голоса работают только с самыми последниями версиями Festival. Нужно скачать speech-tools-1.96 и festival-1.96, распаковать в один каталог и собрать их с помощью
./configure && make
затем нужно распаковать содержимое архива в папку festival/lib/voices/russian/msu_ru_nsh_clunits. Также необходимо установить необходимые английские голоса и словари. Для дифонного голоса нужно было применять патч, теперь патч не нужен. После этого можно запустить festival и ввести команду
(voice_msu_ru_nsh_clunits)
и затем попробовать произнести текст с помощью команды
(SayText “Привет”)
Учтите, что текст должен иметь кодировку UTF-8.
Если возникает ошибка, это означает, что используется festival версии 1.95. С 1.95 голос работать не будет, установите festival 1.96, как написано ранее.
Сейчас качество голоса не самое лучшее, хотя записанный звуковой материал вроде бы неплохой. В ближайшее время я собираюсь заняться качеством синтеза в Festival. Хотелось бы хорошо разобраться с морфологией и ударением, построить дерево предсказания основного тона. Хотелось бы также взяться за поддержку UTF8 в festival.
Буду рад любым предложениям и замечаниям. Пишите nshmyrev@yandex.ru.
Кроме того, есть список задач, которые было бы полезно сделать.
Спасибо всем, кто помогал мне в этом нелёгком деле - AltLinux, Александру Костинскому, Ольге Фёдоровне Кривновой и другим участникам речевой группы МГУ. Спасибо Дмитрию Урюпину за возможность записи речевой базы. Александру Карлову за его замечательный голос. Спасибо Руслану Федярову за конвертацию словаря. Спасибо разработчикам Festival за их замечательный продукт. Спасибо Ольге Яковлевой за версию festival для NVDA.