Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1055


RODINA Hotels повысила уровень обученности сотрудников до 73% с помощью iSpring LMS, iSpring, 21:46, 12.03.2026, Россия422
Компания RODINA Hotels внедрила платформу корпоративного обучения iSpring LMS для развития более 2 тыс. сотрудников по всей России. Это позволило сделать обучение централизованным и повысить уровень обученности.


Innostage и UDV Group на КВО 2026: экспертиза в инфраструктурных проектах для защиты АСУ ТП, Innostage, 21:46, 12.03.2026, Россия417
Компания Innostage, первый кибериспытанный интегратор России в области цифровой безопасности, и UDV Group, российский разработчик решений для эффективного и безопасного использования современных технологий, подвели итоги участия в XIV ежегодной конференции «Информационная безопасность АСУ ТП КВО».


Индид расширила возможности облачного сервиса Indeed MFA, Индид, 21:46, 12.03.2026, Россия422
Компания «Индид», российский разработчик комплекса решений в области защиты айдентити, представила обновление облачного сервиса многофакторной аутентификации Indeed MFA. Среди ключевых изменений — гибкое управление правилами предварительной аутентификации, расширенная поддержка RADIUS-атрибутов, улучшенный контроль синхронизации каталога пользователей и возможность назначения приоритетного токена.


MIG представляет S6 Gen. 2: промышленный смартфон с ресурсом 5+ лет для автоматизации мобильного персонала, Mobile Inform Group, 21:46, 12.03.2026, Россия419
Компания Mobile Inform Group, российский разработчик и производитель защищенных мобильных устройств, объявляет о выходе MIG S6 Gen. 2 – промышленного смартфона нового поколения.


Новые защищенные промышленные планшеты Chainway P100 на ОС Android 14 доступны российскому потребителю, ОКТРОН, 21:09, 12.03.2026, Россия428
ОКТРОН объявляет о старте продаж инновационного планшетного компьютера от Chanway на ОС Android 14 с экраном 10.95", расширенной памятью, восьмиядерным процессором до 2.6 ГГц, технологией 5G и функциональностью искусственного интеллекта для улучшенного декодирования штрихкодов, распознавания речи и изображений


«Гравитон» запускает серийное производство уникальных отечественных сетевых карт NIC-GSFP-M201 с интерфейсом M.2, Гравитон, 21:08, 12.03.2026, Россия421
Компания «Гравитон», российский разработчик и производитель вычислительной техники, объявляет о завершении разработки и старте серийного выпуска новых сетевых карт NIC-GSFP-M201. Решение официально внесено в реестр Минпромторга России и уже доступно для заказа.


«ДиалогНаука» выполнила тест на проникновение для КБ «Москоммерцбанк» (АО), АО ДиалогНаука, 21:08, 12.03.2026, Россия420
Компания «ДиалогНаука», системный интегратор в области информационной безопасности, провела аудит информационной безопасности инфраструктуры КБ «Москоммерцбанк» (АО). Был проведен тест на проникновение, позволяющий определить степень защищённости автоматизированных систем банка от внешних и внутренних атак со стороны потенциальных злоумышленников.


Партнерство VolgaBlob и Singleton Security поможет бизнесу выявить проблемы с мониторингом угроз, VolgaBlob, 22:20, 11.03.2026, Россия509
Компания VolgaBlob, разработчик платформы для анализа и обработки данных Smart Monitor, заключила партнерское соглашение с агентством белых хакеров Singleton Security.


RooX представляет RooX UIDM Enterprise — корпоративное решение для комплексной автоматизации управления доступами, RooX, 22:19, 11.03.2026, Россия509
Компания RooX объявила о выпуске RooX UIDM Enterprise — российской системы управления доступом сотрудников и подрядчиков для крупных организаций и сложных корпоративных сред.


«Рейтинг Рунета» и «Рунетлекс» разъяснили нюансы применения нового закона «о запрете иностранных слов» в рекламе и публичной информации, Рейтинг Рунета, 22:19, 11.03.2026, Россия503
Штрафы за незаконное использование иностранных слов могут достигать полумиллиона рублей.


ФГБУ «НМИЦ гематологии» переходит на защищённую платформу унифицированных коммуникаций CommuniGate Pro, CommuniGate Pro, 22:19, 11.03.2026, Россия502
Национальный медицинский исследовательский центр гематологии (ФГБУ «НМИЦ гематологии» Минздрава России) завершил внедрение российской коммуникационной платформы CommuniGate Pro.


BSS на CCWF-2026: речевая аналитика в Т2, трансформация клиентского сервиса в «Честном знаке» и укрепление связи с клиентами в АТБ, BSS, 22:19, 11.03.2026, Россия525
Приходите на наши выступления и посетите стенд BSS в рамках Customer Contacts World Forum, чтобы больше узнать о новых кейсах внедрения и лучших практиках применения речевых технологий в клиентском сервисе.


Платформа Proceset от Инфомаксимум признана лидером рынка процессной аналитики России, Инфомаксимум, 22:18, 11.03.2026, Россия182
Аналитический центр TAdviser совместно с технологической консалтинговой компанией Axenix представили исследование зрелости российского рынка Process Mining (аналитики бизнес-процессов) и Task Mining (аналитики бизнес-операций).


Безопасность на опасном импорте: как построить систему ИБ вопреки здравому смыслу, ИВК, 22:14, 11.03.2026, Россия177
11 марта 2026 г., Москва


Искусственный интеллект на службе промышленности: «МеталлПластПриорити» запускает тестирование ИИ-платформы «Ural-3.0», УралЭнергоРесурс, 22:13, 11.03.2026, Россия225
Искусственный интеллект на службе промышленности: «МеталлПластПриорити» запускает тестирование ИИ-платформы «Ural-3.0»


  © 2003-2026 inthepress.ru