Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1084


DатаРу представила новый сервер для задач развития искусственного интеллекта, ДатаРу, 16:12, 20.06.2026, Россия212
Российский вендор технологических решений и сервисов DатаРу выпустил на рынок новый сервер «ДатаРу XE9785», ориентированный на выполнение ресурсоемких задач в области искусственного интеллекта.


От разговоров об ИИ к практическому применению: как прошёл первый поток курса VAP: Применение ИИ в ITSM и ESM, Cleverics, 16:11, 20.06.2026, Россия232
В Cleverics подвели итоги первого потока курса по применению искусственного интеллекта в сервис-менеджменте. Ключевая задача программы заключалась не в обучении программированию, а в том, чтобы дать специалистам практический инструментарий для внедрения ИИ и ответить на главный вопрос бизнеса: «с чего начать и будет ли от этого толк».


МегаФон ускорит интернет на «Пикнике Афиши», МегаФон, 16:10, 20.06.2026, Россия209
Оператор обеспечит высокоскоростным мобильным интернетом десятки тысяч гостей фестиваля «Пикник Афиши», который пройдёт 20 июня в музее-заповеднике «Коломенское».


В МГППУ прошла кросс‑вузовская экспертиза в рамках реализации программы развития «Приоритет – 2030», Московский государственный психолого-педагогический университет, 15:37, 20.06.2026, Россия161
Стратегическая цель Университета направлена на достижение лидерства в области психолого-педагогического образования


Производительность труда и здоровье: от пилота к масштабированию!, Нобилис ООО, 16:07, 20.06.2026, Россия227
Ивановская область может стать инновационным регионом в автоматизации диспансеризации!


«ГИГАНТ — Компьютерные системы» о том, почему Drama RAT опасен не только для банковских счетов, ГИГАНТ, 15:57, 20.06.2026, Россия207
Эксперт «ГИГАНТ — Компьютерные системы» объяснил, как Drama RAT получает контроль над смартфоном, почему его сложно обнаружить статическим анализом и чем заражение личного телефона может угрожать компании


«1С-Рарус» в Нижнем Новгороде подтвердил статус «Центр сопровождения 1С», 1С-Рарус, 15:56, 20.06.2026, Россия216
По результатам аудита нижегородский офис «1С‑Рарус» подтвердил статус «Центр сопровождения программ и информационных продуктов фирмы „1С“». Клиенты «1С-Рарус» получают рекомендованный фирмой «1С» уровень сервиса: регулярные обновления, консультации и поддержку по программам «1С:Предприятие» и сервисам 1С:ИТС.


ЯрПАПА шагает по стране 2026, АНО "Содружество семей", 15:56, 20.06.2026, Россия204
Автономная некоммерческая организация «Содружество семей» совместно с Региональным отделением Всероссийского общественного движения «ОТЦЫ РОССИИ» Ярославской области объявляют о начале приема заявок на участие во Всероссийском конкурсе семейных видеороликов «ЯрПАПА шагает по стране-2026».


Платформа Optimacros представлена на карте CNews Analytics «Импортозамещение в банках 2026», ООО "Оптимакрос", 15:51, 20.06.2026, Россия212
Агентство CNews Analytics выпустило обновленную инфографику «Импортозамещение в банках 2026» и включило CPM/IBP-платформу Optimacros в раздел «Управление ликвидностью, казначейством и бюджетирование».


«Выберу.ру»: накопительный счёт МТС Банка — лидер рейтинга в июне 2026 года, Финансовый маркетплейс "Выберу.ру", 15:51, 20.06.2026, Россия201
МТС Банк возглавил рейтинг крупнейших банков страны по итогам исследования «Выберу.ру» «Лучшие накопительные счета в июне 2026 года».


Space расширяет региональное присутствие: в Самаре открылся новый офис компании, ДАКОМ М, 15:50, 20.06.2026, Россия205
«ДАКОМ М» (бренд Space), российский разработчик программного обеспечения и R&D-центр, открыл новый офис в Самаре.


ТЦ «Муравей» приглашает на дегустацию летних новинок от кофе-бара «Кофелайк», тц муравей, 15:49, 20.06.2026, Россия65
Торговый центр «Муравей» продолжает радовать посетителей яркими событиями и гастрономическими открытиями!


GreenData подключила ИИ-ассистентов к корпоративным системам через MCP, GreenData, 15:47, 20.06.2026, Россия68
GreenData расширила возможности конструктора корпоративных ИИ-ассистентов GreenBox. Конструктор GreenBox теперь позволяет работать с Jira, GitLab и другими внешними сервисами, а также запускать процессы и создавать объекты непосредственно в low-code платформе.


Minervasoft назвала пять ошибок в работе с корпоративными знаниями при внедрении ИИ-ассистентов, Minervasoft, 15:47, 20.06.2026, Россия75
Более 80% компаний среди крупного и среднего бизнеса допускают критичные ошибки в работе с корпоративными знаниями. Это приводит к увеличению нагрузки на сотрудников и становится стоп-фактором при внедрении ИИ-ассистентов, следует из результатов проведенных Minervasoft аудитов.


«Первый Бит» развернул защищенную BI-аналитику в закрытом контуре машиностроительной компании «Диполь», Первый Бит, 15:46, 20.06.2026, Россия68
Время подготовки отчетности сократилось с 1-2 дней до 10-15 минут, а бизнес-пользователи стали на 60% чаще выводить нужные отчеты самостоятельно.


  © 2003-2026 inthepress.ru