Счетчик посещений

mod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_counter
mod_vvisit_counterСегодня245
mod_vvisit_counterВчера2600
mod_vvisit_counterЭта неделя7753
mod_vvisit_counterПрошлая неделя7785
mod_vvisit_counterЭтом месяце21996
mod_vvisit_counterПрошлый месяц35949
mod_vvisit_counterВсего730525

Ваш IP: 38.107.179.227
 , 
Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка Печать E-mail
Рейтинг пользователей: / 0
ХудшийЛучший 
Автор: Administrator   
08.10.2010 08:52

После трех лет разработки выпущен релиз системы оптического распознавания текста Tesseract 3.0. Одним из самых важных улучшений в новой версии стала поддержка распознавания документов на русском и украинском языках.

Изначально система была создана в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google.

Основные улучшения Tesseract 3.0:

  • Проведена подготовка кода к использованию в многопоточных программах;
  • Добавлен модуль анализа структуры документа;
  • Добавлена поддержка вывода результатов в формате HOCR;
  • В качестве основного средства для ввода/вывода, обработки и анализа изображений теперь используется библиотека Leptonica. Пока использование Leptonica опционально, но в будущих выпусках станет обязательным;
  • Переписаны таблицы сопоставления неоднозначно распознаваемых элементов;
  • Добавлен TessdataManager для совмещения нескольких файлов с данными в один файл;
  • Проведена чистка неиспользуемого кода и прекращена поддержка сборки в VC++6;
  • Добавлены дополнительные языки в систему распознавания.

Источник

 

 

Добавить комментарий


Защитный код
Обновить