Секреты сканирования на ПК   ::   Леонтьев Б. К.

Страница: 85 из 176

Кроме этого помните, что, не следует создавать слишком много лигатур, так как это может отрицательно сказатьсяна качестве распознавания.

В процессе обучения необходимо учитывать следующие ограничения:

• Изображения некоторых символов не различаются системой распознавания и сопоставляются с каким-то одним символом. К примеру, прямой ('), левый (') и правый (') апострофы хранятся в эталоне как изображение прямого апострофа. Таким образом, в результате распознавания в тексте никогда не появится правый или левый апостроф, хотя при обучении вы указывали именно эти символы.

• Для некоторых изображений решение относительно того, какому символу в распознанном тексте его сопоставить, принимается на основе общего анализа распознанного текста. Так, например, решение относительно того, является ли символ, обозначаемый «кружком», буквой "о" или цифрой ноль, OCR-система принимает в зависимости от того, находятся ли рядом другие цифры или буквы.

Редактирование эталона

Прежде чем запускать распознавание с только что созданным эталоном, рекомендуется просмотреть эталон и, если потребуется, скорректировать. Этим вы сведете к минимуму ошибки распознавания, которые могут возникнуть из-за неправильно обученного эталона.

Эталон должен содержать только целые символы или лигатуры. Символы, обрезанные с краев, и символы с неправильными подписями следует удалить из эталона.

Как скорректировать эталон

Из меню Сервис выберите команду Редактор эталонов.

|< Пред. 83 84 85 86 87 След. >|

Java книги

Контакты: [email protected]