WikiSort.ru - Компьютерные программы

Tesseract
Тип	оптическое распознавание символов
Разработчики	Hewlett-Packard, Google
Написана на	C++
Интерфейс	командная строка
Операционная система	Linux, Mac OS X и др. UNIX-подобные, Windows
Первый выпуск	середина 1980-х
Последняя версия	4.0.0 (29 октября 2018[1])
Лицензия	Apache 2.0
Сайт	github.com/tesseract-ocr…
	Tesseract на Викискладе

ПОИСК ПО САЙТУ | о проекте

Tesseract (с англ. — «тессеракт») — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0^[2] для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0^[3]^[4]) осуществляется с помощью дополнительных модулей.

История

Ядро программы Tesseract было разработано в Бристольской лаборатории Hewlett Packard и в Hewlett Packard Co, Greeley штат Колорадо в 1985—1994 годах. В 1996 были проведены значительные изменения и подготовлен порт для Windows. Затем, с 1998 года — частичная миграция с Си на Си++. Значительная часть кода изначально написана на Си, но проводились доработки для совместимости с Си++ компиляторами.^[2]

В настоящее время Tesseract 3.0 собирается под Linux с GCC 2.95 и старше и под Windows с Visual C++ 2008 Express и старше (поддержка Visual C++ 6 была удалена в версии 3.0^[3]).

На данный момент последней версией является Tesseract 4.0, основанная на LSTM^[5].

Графические интерфейсы для Tesseract

Для Linux

Для Windows

gImageReader

Сайты на базе движка Tesseract

Зависимости

Leptonica

Интересные факты

Программа Tesseract используется менеджером загрузок Tucan Manager для распознавания текстов в тестах CAPTCHA.

Примечания

↑ Releases - tesseract-ocr/tesseract (англ.). Проверено 12 января 2019.
1 2 Vincent, Luc Announcing Tesseract OCR (неопр.) (August 2006). Проверено 26 июня 2008. Архивировано 18 марта 2012 года.
1 2 Tesseract 3.00 Released (неопр.).
↑ Tesseract Download Page (неопр.). Архивировано 18 марта 2012 года.
↑ TESSERACT(1) Manual Page (англ.). Проверено 12 января 2019.

Ссылки

Это заготовка статьи о программном обеспечении. Вы можете помочь проекту, дополнив её.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .

Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2026
WikiSort.ru - проект по пересортировке и дополнению контента Википедии

[1] Releases - tesseract-ocr/tesseract (англ.). Проверено 12 января 2019.

[Google30Aug06-2] 1 2 Vincent, Luc Announcing Tesseract OCR (неопр.) (August 2006). Проверено 26 июня 2008. Архивировано 18 марта 2012 года.

[Google1Oct10-3] 1 2 Tesseract 3.00 Released (неопр.).

[TesseractDownloadPage-4] Tesseract Download Page (неопр.). Архивировано 18 марта 2012 года.

[5] TESSERACT(1) Manual Page (англ.). Проверено 12 января 2019.