Журнал Компьютерра - 30 от 21 августа 2007 года :: Компьютерра
Страница:
134 из 161
Ситуация тогда выглядела очень мрачно: свободных систем texttospeech, поддерживающих русский язык, в природе не существовало, приемлемых свободных OCR-движков не было вообще, не только для русского языка. В этом году «образной» тематике на конференции было уделено довольно много времени, и картинка стала несколько более веселой.
Николай Шмырев рассказал о поддержке русского языка в системах синтеза речи Festival и распознавания CMU Sphinx, появившейся в этих проектах лишь недавно. Одна из наиболее трудоемких задач на этом фронте – создание баз данных речи (озвученных текстов), которые затем анализируются статистическими методами и преобразуются в акустические модели.
Подобные базы обладают и независимой ценностью (например, для исследователей языка) – но, к сожалению, свободной информации такого рода пока не очень много: существующие свободные системы распознавания обычно используют уже готовые модели, "звуковые исходники" которых закрыты. Впрочем, озвучка текста не требует особой квалификации и специальных знаний, так что здесь поговорка "с миру по нитке" вполне применима как руководство к действию. Реализацией этого подхода занимается проект VoxForge.org: всем желающим предлагается озвучить произвольный текст и загрузить его в систему в виде файла (или, например, наговорить по телефону). Получающиеся в результате этой деятельности базы будут выпускаться под GPL и использоваться в различных свободных программах.
|< Пред. 132 133 134 135 136 След. >|