Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1008


Анализ российского рынка питьевой и минеральной воды: итоги 2024 г., прогноз до 2028 г., Исследовательская компания NeoAnalytics, 12:41, 13.07.2025, Россия131
В мае 2025 года исследовательская компания NeoAnalytics завершила проведение маркетингового исследования российского рынка питьевой и минеральной воды.


«1С-Рарус» автоматизировал производственный учет ГК «Полиметалл» на базе 1С:ERP, 1С-Рарус, 11:52, 13.07.2025, Россия139
«1С-Рарус» совместно с АО «Полиметалл» реализовали проект внедрения «1С:ERP». Новая система позволяет вести централизованный мониторинг 65 производственных показателей. На базе «1С:ERP» автоматизировано 510 рабочих мест. Стандартизация учета и отчетности способствует росту эффективности управления для всех предприятий группы «Полиметалл».


Axenix помогла АГРОЭКО разработать стратегию цифровой трансформации, Axenix, 11:51, 13.07.2025, Россия139
АГРОЭКО при поддержке Axenix завершила масштабный проект по созданию комплексной цифровой стратегии. Проект охватил все направления бизнеса. Реализация стратегии поможет АГРОЭКО ускорить рост и укрепить свои позиции среди лидеров российского АПК.


«Аэродиск» и «Группа Астра» подтверждают совместимость СХД с Astra Linux, Аэродиск, 11:51, 13.07.2025, Россия146
Результаты тестирования расширяют возможности использования российских СХД в защищенных инфраструктурах, соответствующих требованиям регуляторов. Обе компании продолжат развивать сотрудничество для создания комплексных отечественных решений в области хранения и обработки данных.


Linx Cloud запускает облако на OpenStack в опытно-промышленную эксплуатацию, Linx, 11:51, 13.07.2025, Россия146
Компания Linx Cloud объявляет о запуске облачной платформы на базе OpenStack в опытно-промышленную эксплуатацию. Этот шаг позволит облачному провайдеру предлагать заказчикам надежную импортонезависимую ИТ-инфраструктуру


Траектория Технологий разработала Систему управления инцидентами для ЦОДа GreenBushDC, Траектория Технологий, 11:46, 13.07.2025, Россия58
Компания «Траектория Технологий» разработала и развернула программный комплекс IMS для работы с инцидентами, возникающими при предоставлении клиентам услуг размещения оборудования.


Искусственный интеллект в детских руках: курсы от CODDY, CODDY, 11:45, 13.07.2025, Россия57
Нейросети и искусственный интеллект уже прочно вошли в нашу жизнь. Мы видим их в смартфонах, которые распознают лица, в приложениях, которые переводят текст, в играх, где компьютер играет как живой соперник.


Финансовый диагноз по ИНН: в России запустили бесплатный сервис для самодиагностики бизнеса, ГК "Юнайт", 23:30, 12.07.2025, Россия149
ГК «Юнайт» запустила бесплатные цифровые сервисы для оценки потенциала капитализации российских компаний. Новые онлайн-инструменты позволят бизнесу самостоятельно оценить возможности улучшения финансовых показателей за счет нематериальных активов.


«Код Безопасности» и «Цифровые решения» оснастили ЦОД Ростеха высокопроизводительным межсетевым экраном нового поколения, Код Безопасности, 23:27, 12.07.2025, Россия173
В центре обработки данных (ЦОД) Госкорпорации Ростех установлена новая высокопроизводительная отечественная ферма межсетевых экранов класса NGFW. Она направлена на защиту автоматизированных систем и позволяет ограничить доступ к сетевым сегментам или отдельным хостам на основе задаваемых администратором правил.


ГК SKY GROUP вошла в топ-300 самых надёжных застройщиков России, ГК «SKY GRОUP», 23:24, 12.07.2025, Россия207
Новосибирская Группа компаний SKY GROUP укрепила свои позиции в Едином реестре застройщиков (ЕРЗ.РФ), поднявшись на 38 пунктов и войдя в топ-300 крупнейших девелоперских компаний страны.


Карьерная платформа Changellenge сменила поставщика КЭДО на HRlink, Рейтинг Рунета, 23:21, 12.07.2025, Россия235
Разработчик карьерной платформы Changellenge перешел на систему кадрового ЭДО HRlink, выбрав сервис за стабильную техническую поддержку, удобную интеграцию с «1С» и инструменты для работы с распределенными командами.


SIMETRA разработала транспортную модель Ульяновска, Simetra, 17:26, 12.07.2025, Россия152
Группа компаний SIMETRA выполнила проект в области транспортного планирования и разработала транспортную модель города Ульяновска. Цифровая модель обеспечит эффективность при принятии решений, связанных с инфраструктурными проектами, а также необходимую гибкость при управлении дорожным движением в городе.


«1С:ERP Управление птицеводческим предприятием» подтвердило статус «1С:Совместимо», 1С-Рарус, 17:19, 12.07.2025, Россия118
Пройденная ресертификация «Совместимо! Система программ 1С:Предприятие» гарантирует пользователям качество разработки «1С:ERP Управление птицеводческим предприятием» редакции 2.5. Система совместима с другими решениями на платформе «1С:Предприятие».


Количество переведенных выигрышей от букмекеров на Кошелек ЦУПИС и цифровую карту выросло вдвое, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 17:11, 12.07.2025, Россия126
В I полугодии 2025 года пользователи ЕДИНОГО ЦУПИС совершили порядка 7,5 млн транзакций по выводу выигрышей от букмекерских контор на Кошелек ЦУПИС и цифровую карту. Это в 2 раза больше аналогичного показателя 2024 года.


«Телфин» расширяет функциональность сервиса «Оценка звонков», Телфин, 17:11, 12.07.2025, Россия195
Провайдер коммуникационных сервисов «Телфин» расширяет функциональные возможности решения «Оценка звонков» для повышения эффективности анализа телефонных разговоров по каждому сотруднику и роста уровня сервиса в компании.


  © 2003-2025 inthepress.ru