Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1045


RooX представляет RooX UIDM CIAM — первый специализированный российский продукт для аутентификации клиентов и развития клиентского ID, RooX, 20:41, 05.02.2026, Россия555
RooX UIDM CIAM ориентирован на веб-сервисы, которым требуется удобные сценарии регистрации и входа клиентов, а также поддержка многофакторной аутентификации. Продукт от российского разработчика позволит любому бизнесу собрать собственный клиентский ID, встроенный в продуктовый сервис и соответствующий корпоративному дизайну.


БФТ-Холдинг завершил проект «Единый регистр населения Омской области», БФТ-Холдинг, 20:44, 05.02.2026, Россия547
В Омской области начал работу «Единый регистр населения Омской области» – информационный ресурс, который консолидирует данные о жителях региона из различных ведомств и используется при оказании государственных и муниципальных услуг.


Проценты — год бережёт: «Выберу.ру» подготовил рейтинг лучших вкладов на 1 год за январь 2026 года, Финансовый маркетплейс "Выберу.ру", 20:40, 05.02.2026, Россия550
«Выберу.ру» составил рейтинг с оставшимися наиболее выгодными депозитами при размещении денег на длинный срок — 1 год и свыше. Топ-подборка позволит вкладчикам в начале февраля найти максимально доходные варианты, чтобы зафиксировать двухзначные проценты и заработанной прибылью опередить инфляцию-2026.


ITKey получила сертификат ФСТЭК на облачную платформу KeyStack, ITKey, 18:10, 05.02.2026, Россия89
ITKey, ведущий российский разработчик и поставщик решений для построения облачной инфраструктуры, объявляет о получении сертификата ФСТЭК России на платформу виртуализации KeyStack.


На CSTB.PRO.MEDIA 2026 эксперты обсудят контентную политику онлайн-кинотеатров, CSTB, 20:42, 05.02.2026, Россия548
Какие новинки готовят онлайн-кинотеатры, сколько зарубежного контента будет в этом году. На CSTB.PRO.MEDIA 2026 эксперты обсудят контентную политику онлайн-кинотеатров.


Контроль товарных остатков с помощью 1С, RedLab, 20:46, 05.02.2026, Россия584
ИТ-компания RedLab приняла участие в реализации проекта по обеспечению стабильного и прозрачного обмена данными между 1С и интернет-магазином.


Аскона запустила программу «Рекомендовано Асконой» для отелей, Askona, 20:36, 05.02.2026, Россия68
Группа компаний «Аскона», эксперт в области товаров для здорового сна и уютного дома, в рамках программы Askona by Hotel в конце ноября 2025 года начала вручение дипломов «Рекомендовано Асконой».


Индид и UserGate представили совместное решение для безопасного удаленного доступа, Индид, 20:46, 05.02.2026, Россия548
Компания «Индид», разработчик комплекса продуктов в области защиты айдентити, и UserGate, российский разработчик решений по информационной безопасности, объявляют об успешном тестировании на совместимость межсетевого экрана следующего поколения UserGate NGFW и облачной системы многофакторной аутентификации (MFA).


«Кит-системс» расширил портфель решений для резервного копирования и восстановления данных, Кит-системс, 20:46, 05.02.2026, Россия549
Системный интегратор «Кит-системс» получил партнерскую авторизацию компании «Киберпротект».


ЭТП «Торги223» подтвердила статус официального оператора электронных торгов в Пермском крае, АО "ЦРЭТ" (оператор ЭТП "Торги223"), 20:45, 05.02.2026, Россия544
ЭТП «Торги223» (АО «ЦРЭТ») по итогам ежегодного отбора включена в перечень официальных операторов электронных площадок, допущенных к работе в Региональной информационной системе «Закупки Пермского края».


«Континент TLS-Сервер» от «Кода Безопасности» получил сертификат ФСБ, Код Безопасности, 20:35, 05.02.2026, Россия67
Программное решение «Континент TLS-Сервер» версии 2 от компании «Код Безопасности» получило официальный сертификат ФСБ России, подтверждающий его соответствие высоким требованиям к средствам криптографической защиты информации.


«Телфин» подвел итоги 2025 года: спрос на омниканальные решения связи растет на 40% в год, Телфин, 22:11, 04.02.2026, Россия149
Провайдер коммуникационных сервисов «Телфин» увеличил продажи комплексных решений связи на 40%. Спрос на омниканальные сервисы в корпоративном сегменте продолжает расти уже второй год подряд.


Versta.io обозначил тренды цифровизации, которые изменят логистику в России к 2030 году, Versta, 20:40, 05.02.2026, Россия563
Цифровой логистический оператор versta.io обозначил ключевые технологические тренды, определяющие развитие отрасли грузоперевозок на ближайшие 4-5 лет.


«1С-Рарус» — в топ-3 рейтинга TAdviser по цифровизации HoReCa, 1С-Рарус, 22:31, 04.02.2026, Россия187
«1С-Рарус» занимает лидирующие позиции в рейтинге TAdviser по цифровизации HoReCa. Компания предлагает индустрии гостеприимства и питания специализированные решения на платформе 1С, способствуя оптимизации процессов в условиях высокой конкуренции и регуляторных вызовов.


На CSTB.PRO.MEDIA 2026 обсудят тенденции платного ТВ и международную дистрибуцию российского контента, CSTB, 20:39, 05.02.2026, Россия157
Нужен ли блогерский контент на ТВ, у каких жанров российского кино наибольший потенциал дистрибуции. Об этом расскажут эксперты медиаотрасли на форуме CSTB.PRO.MEDIA 2026.


  © 2003-2026 inthepress.ru