Портфолио Карта сайта Глоссарий
Вакансии



Вышла альфа-версия пакета Google OCRopus

НовостиПрограммное обеспечение

Текст: Владимир Парамонов

Компания Google выпустила альфа-версию программного пакета OCRopus, предназначенного для оптического распознавания символов.

Проект OCRopus был открыт весной нынешнего года. Предполагается, что в рамках инициативы OCRopus будет создана мощная многофункциональная система, которую можно будет использовать для распознавания обычных и исторических документов, рукописного текста и так далее. Комплекс OCRopus смогут применять различные научные организации, археологи, историки, а также рядовые владельцы ПК.

Представленная на днях версия OCRopus 0.1.0 построена на движке НР Tesseract. В пакете реализованы функции сегментации текста и графики, а также система конфигурирования на базе языка Lua. Распространяется программа для оптического распознавания символов Google в соответствии с лицензией Apache License 2.0.

Между тем, сотрудники ArsTechnica, уже протестировавшие альфа-версию OCRopus, отмечают, что программа не всегда хорошо справляется со своей задачей. Система распознавания часто интерпретирует символ «e» как букву «c», а символ «o» путает с нолем. Кроме того, большое влияние на качество конечного результата оказывает тип и размер шрифта отсканированного оригинала.

Впрочем, пока работы над пакетом OCRopus не завершены, и финальная модификация продукта, вероятно, будет лишена большинства недостатков. Кстати, бета-версию OCRopus компания Google планирует выпустить ближе к концу первого квартала будущего года.

03.11.2007

Добавить комментарий

ФИО: 
E-mail: 
Тема: 
Комментарий: 
Код подтверждения:
Copyright © 2005—2007 "Satellitov.net" & Crash
Материалы для раздела "Новости" предоставлены Компьюлентой
Тендерит.РУ - Hodus Bureau; TOSHIBA Portege G920; фото дизайн интерьера хрущевки; Коттеджные поселки:завидово,коттеджный поселок дача