Журнал Компьютерра - 30 от 21 августа 2007 года   ::   Компьютерра

Страница: 135 из 161



Еще одна разработка, о которой шла речь на конференции, – свободный синтезатор eSpeak, также недавно заговоривший по-русскии имеющий определенные преимущества перед (в основном, исследовательским) проектом Festival. Впрочем, его качество звука пока отстает от последнего, и здесь предстоит провести немалую работу.

Наконец, не обошлось и без обсуждения систем распознавания текстов (OCR).

Нельзя сказать, чтобы свободными OCR никто не занимался – напротив, список таких проектов довольно внушителен – но, к сожалению, почти все они были заброшены своими создателями на самых ранних стадиях разработки и так и не добрались до практической применимости. Павел Семин, представлявший на конференции свою библиотеку libocr, связывает это с высокой «наукоемкостью» задачи – получение приемлемого результата требует вложения кучи сил и времени. Сам Павел занимается разработкой libocr для своей диссертации – и хочется верить, что после защиты этот проект не постигнет участь многих других, что возможно, только если он станет точкой приложения усилий специалистов по OCR со всего мира (в одиночку такая задача не решается). Впрочем, следует отметить, что в данный момент Google серьезно заинтересовался свободными OCR-системами (проекты Tesseract и Ocropus), что может привести если не к прорыву на этом фронте, то, по крайней мере, к значительному прогрессу. Правда, про поддержку русского языка и кириллицы в них пока ничего не известно – но участие в Ocropus как минимум одного российского разработчика (Илья Межиров) вселяет некоторый оптимизм.

|< Пред. 133 134 135 136 137 След. >|

Java книги

Контакты: [email protected]