Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1036


UDV DATAPK Industrial Kit 3.0 получил сертификат соответствия ФСТЭК России по 4 уровню доверия, UDV Group, 17:02, 15.01.2026, Россия156
UDV Group информирует о получении сертификата ФСТЭК России по 4 уровню доверия на свое флагманское решение для кибербезопасности любых АСУ ТП — UDV DATAPK Industrial Kit 3.0.


Эксперимент по цифровой маркировке проведён на производстве компании «Акульчев» в Татарстане, Первый Бит, 17:02, 15.01.2026, Россия165
Эксперты подвели итоги охвата предприятий системой промышленной маркировки. На сегодняшний день более 85% промышленных предприятий уже внедрили в работу систему маркировки либо находятся в процессе ее адаптации под новые государственные стандарты.


Индид представила Indeed PAM 3.3, Индид, 17:01, 15.01.2026, Россия157
Компания «Индид» представила новую версию Indeed Privileged Access Manager (Indeed PAM) 3.3 — системы для управления доступом привилегированных пользователей. Ключевые обновления продукта призваны повысить безопасность доступа к веб-ресурсам, упростить управление сессиями и обеспечить гибкость при контроле доступа.


Мовавика назвала дату главного всплеска новогоднего монтажа: пользователи даже летом делают праздничные ролики, но пик приходится на 20 декабря, Мовавика, 17:00, 15.01.2026, Россия160
Российская компания «Мовавика» изучила, как часто пользователи оформляют ролики с зимней и новогодней атрибутикой. Аналитики опирались на данные по нескольким сотням тысяч видео, созданных за последний год.


«НЭК.ТЕХ» приобрёл Цифровой Испытательный Полигон ЦИТМ «Экспонента», ООО "НЭК ТЕХ", 16:57, 15.01.2026, Россия160
Научно-технический центр ООО «НЭК ТЕХ» (входит в Группу «НЭК») приобрёл программно-аппаратный комплекс полунатурного моделирования и тестирования устройств релейной защиты и автоматики у ООО Центр инженерных технологий и моделирования «ЭКСПОНЕНТА».


LG ПРЕДСТАВЛЯЕТ ТЕЛЕВИЗОР WALLPAPER: САМЫЙ ТОНКИЙ В МИРЕ, ПО-НАСТОЯЩЕМУ БЕСПРОВОДНОЙ ТЕЛЕВИЗОР LG OLED, LG Electronics, 16:56, 15.01.2026, Россия166
LG ПРЕДСТАВЛЯЕТ ТЕЛЕВИЗОР WALLPAPER: САМЫЙ ТОНКИЙ В МИРЕ, ПО-НАСТОЯЩЕМУ БЕСПРОВОДНОЙ ТЕЛЕВИЗОР LG OLED


КОМПАНИЯ LG ELECTRONICS РАСШИРЯЕТ СЕРИЮ ЛАЙФСТАЙЛ ТЕЛЕВИЗОРОВ, ПРЕДСТАВИВ НОВУЮ МОДЕЛЬ GALLERY, ВДОХНОВЛЕННУЮ ИСКУССТВОМ, LG Electronics, 16:56, 15.01.2026, Россия164
Компания LG Electronics (LG) представит на выставке CES 2026 дополнение к своему портфолио лайфстайл экранов - телевизор


«1С-Рарус» автоматизировал документооборот и оценку поставщиков на Ижевском радиозаводе, 1С-Рарус, 16:55, 15.01.2026, Россия157
Группа «Ижевский радиозавод» завершила проект по автоматизации документооборота и оценки поставщиков с «1С:Корпорация», охватив 10 юридических лиц и 1500 рабочих мест. Внедрение снизило ИТ-расходы на 5%, трудоемкость анализа — на 15%, а поиск корреспонденции — на 20%.


Совместимая с Linux платформа Directum RX получила сертификат ФСТЭК, Directum, 16:54, 15.01.2026, Россия161
Компания Directum в очередной раз подтвердила, что её экосистема соответствует строгим требованиям в области информационной безопасности.


«DатаРу Технологии» обновила флагманские линейки систем резервного копирования, ДатаРу, 16:54, 15.01.2026, Россия159
Российский производитель серверного и сетевого оборудования «DатаРу Технологии» обновил и расширил свои ключевые продуктовые линейки систем резервного копирования, добавив в них модели «ДатаРу ДД9910(Ф)» и ленточную систему «ДатаРу ТС4300».


ActiveCloud помог АО «Пушкиногорский маслосырзавод» перейти на новый почтовый сервис, ActiveCloud, 16:53, 15.01.2026, Россия66
ActiveCloud, ведущий поставщик облачных решений, ИТ-инфраструктуры и хостинга для клиентов России и Беларуси, помог АО «Пушкиногорский маслосырзавод» организовать бесперебойную работу корпоративной почты.


За «кредиткой» — с 18 лет: «Выберу.ру» составил рейтинг карт для молодёжи за декабрь 2025 года, Финансовый маркетплейс "Выберу.ру", 16:53, 15.01.2026, Россия65
К зимним студенческим каникулам «Выберу.ру» подготовил рейтинг банков с наиболее выгодными для молодых заёмщиков кредитными картами благодаря кешбэку и максимальному льготному периоду, когда можно не платить проценты. Топ-подборка поможет молодым людям найти подходящий вариант «кредитки» для покупок и путешествий.


«Силовые машины» повышают эффективность бэк-офиса с помощью Task Mining от Proceset, Инфомаксимум, Силовые машины, 16:52, 15.01.2026, Россия65
«Силовые машины» завершили проект по оцифровке и анализу операций в Центре единого сервиса и обнаружили потенциал оптимизации до 60%. В качестве решения использовалась система активной бизнес-аналитики Proceset российского вендора Инфомаксимум.


UDV Group: Disaster Recovery — инженерный подход к непрерывности бизнеса, UDV Group, 21:56, 12.01.2026, Россия393
Федор Маслов, эксперт компании UDV Group, рассказал, что современные подходы к Disaster Recovery строятся вокруг приоритизации бизнес-процессов, точного расчета RTO и RPO, регулярной валидации резервных копий и реалистичного тестирования сценариев сбоев. Такой подход позволяет выстраивать отказоустойчивую инфраструктуру без избыточных затрат, обеспечивая баланс между требованиями бизнеса, регуляторов и возможностями ИТ-архитектуры.


О поисках наставника в литературном творчестве говорили на шестом онлайн-квартирнике проекта «Языковая арт-резиденция. Музыка слова», АНО «Ресурсный центр в сфере национальных отношений», 21:55, 12.01.2026, Россия325
Участники онлайн-квартирника вместе с приглашёнными спикерами обсудили вопросы наставничества в литературном творчестве и поделились практическими советами по первым шагам в литературе на родных языках народов России.


  © 2003-2026 inthepress.ru