WikiSort.ru - Компьютерные программы

ПОИСК ПО САЙТУ | о проекте
Tesseract
Тип оптическое распознавание символов
Разработчики Hewlett-Packard, Google
Написана на C++
Интерфейс командная строка
Операционная система Linux, Mac OS X и др. UNIX-подобные, Windows
Первый выпуск середина 1980-х
Последняя версия 4.0.0 (29 октября 2018[1])
Лицензия Apache 2.0
Сайт github.com/tesseract-ocr…
 Tesseract на Викискладе

Tesseract (с англ.«тессеракт») — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0[2] для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0[3][4]) осуществляется с помощью дополнительных модулей.

История

Ядро программы Tesseract было разработано в Бристольской лаборатории Hewlett Packard и в Hewlett Packard Co, Greeley штат Колорадо в 1985—1994 годах. В 1996 были проведены значительные изменения и подготовлен порт для Windows. Затем, с 1998 года — частичная миграция с Си на Си++. Значительная часть кода изначально написана на Си, но проводились доработки для совместимости с Си++ компиляторами.[2]

В настоящее время Tesseract 3.0 собирается под Linux с GCC 2.95 и старше и под Windows с Visual C++ 2008 Express и старше (поддержка Visual C++ 6 была удалена в версии 3.0[3]).

На данный момент последней версией является Tesseract 4.0, основанная на LSTM[5].

Графические интерфейсы для Tesseract

Для Linux
Для Windows

Сайты на базе движка Tesseract

Зависимости

Интересные факты

Программа Tesseract используется менеджером загрузок Tucan Manager для распознавания текстов в тестах CAPTCHA.

Примечания

  1. Releases - tesseract-ocr/tesseract (англ.). Проверено 12 января 2019.
  2. 1 2 Vincent, Luc Announcing Tesseract OCR (August 2006). Проверено 26 июня 2008. Архивировано 18 марта 2012 года.
  3. 1 2 Tesseract 3.00 Released.
  4. Tesseract Download Page. Архивировано 18 марта 2012 года.
  5. TESSERACT(1) Manual Page (англ.). Проверено 12 января 2019.

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии