Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1022


AstraZeneca внедрит российскую платформу управления данными TData, Axenix, 17:58, 30.10.2025, Россия190
Международная биофармацевтическая компания AstraZeneca выбрала российского разработчика TData для одного из ключевых проектов в рамках цифровой трансформации — внедрения российского продукта для управления большими данными.


«Выберу.ру»: за кредитом — в «Ренессанс Банк» — к лидеру рейтинга в октябре 2025 года, Финансовый маркетплейс "Выберу.ру", 17:58, 30.10.2025, Россия212
В результате проведённого финансовым маркетплейсам «Выберу.ру» исследования «Лучшие кредиты наличными» в октябре 2025 года «Ренессанс Банк» стал лидером рейтинга среди крупнейших кредиторов.


Бастион вошел в тройку крупнейших поставщиков ИБ-услуг по версии CNews, Бастион, 17:48, 30.10.2025, Россия183
Компания по информационной безопасности «Бастион» впервые вошла в рейтинг CNews «Крупнейшие поставщики ИБ-услуг» и заняла второе место. Выручка компании от поставки ИБ-услуг за 2024 год составила 5,8 млрд рублей.


«Кит-системс» защитил первую в стране единую медицинскую информационно-аналитическую систему федерального уровня, Кит-системс, 17:47, 30.10.2025, Россия191
Системный интегратор «Кит-системс» построил систему защиты от киберугроз и расследования ИБ-инцидентов единой среды взаимодействия «Национального медицинского исследовательского центра нейрохирургии имени академика Н.Н. Бурденко» (НИИ им. Н. Н. Бурденко) Минздрава России с федеральными информационными системами.


Продукт Nexign для монетизации клиентского опыта при перегрузках радиосети включен в реестр отечественного ПО, Nexign, 17:22, 30.10.2025, Россия203
Nexign сообщает о включении своего продукта Nexign RCAF (RAN Congestion Awareness Function) в Единый реестр российского программного обеспечения.


Versta.io разработал единый сервис изменений в заказах после их оформления, Versta.io, 17:21, 30.10.2025, Россия203
Цифровой логистический оператор versta.io внедрил сервис, позволяющий вносить изменения параметров заказа на перевозку после его оформления.


Проект DCLogic позволит масштабировать автоматизацию семи рудников Арктического региона, DCLogic, 17:21, 30.10.2025, Россия224
Системный интегратор с вендорским подходом DCLogic завершил разработку технического проекта и задания для внедрения системы диспетчеризации на основе подземного рудника, принадлежащего крупной российской горнорудной компании.


Minervasoft: спрос на проекты менеджмента знаний вырос в 2 раза в 2025 году, Minervasoft, 17:21, 30.10.2025, Россия221
Российский бизнес наращивает инвестиции в системное управление знаниями, смещая фокус с простого внедрения ИТ-инструментов на комплексную работу с процессами и корпоративной культурой.


Новая версия «1С-Рарус: Система управления лояльностью» в 10 раз быстрее рассчитывает бонусы, 1С-Рарус, 17:20, 30.10.2025, Россия241
Команда «1С-Рарус» выпустила новую версию «1С-Рарус: Система управления лояльностью» — платформы для автоматизации программ лояльности. В редакции 2.0 обновили интерфейс, увеличили производительность и добавили no-code настройку правил и сценариев программ лояльности.


Fplus расширил управление серверами через BIOS, Fplus, 17:18, 30.10.2025, Россия142
Производитель электроники Fplus выпустил обновление микропрограммы BIOS, которое значительно расширяет возможности управления серверами, контроля над их производительностью, энергоэффективностью и отказоустойчивостью.


RooX UIDM модернизирована в платформу: единый подход к управлению доступом, RooX, 05:17, 29.10.2025, Россия245
Компания RooX объявляет о новом этапе развития своей системы управления доступом RooX UIDM. Из продукта она модернизирована в платформу, которая объединяет ключевые направления — IAM, IDM и MFA — в единой архитектуре.


По ставке 3% — на домик в деревне. «Выберу.ру» составил рейтинг сельских ипотек в октябре 2025 года, Финансовый маркетплейс "Выберу.ру", 06:02, 29.10.2025, Россия272
С начала октября банки возобновили приём заявок по сельской ипотеке, а «Выберу.ру» подготовил рейтинг банков с наиболее выгодными заёмщикам ипотечными программами для приобретения недвижимости на сельских территориях. Топ-подборка поможет людям найти подходящее решение, чтобы воплотить мечту о «домике в деревне».


Команда по информационной безопасности ЕДИНОГО ЦУПИС вошла в топ-10 по итогам CyberCamp 2025, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 06:01, 29.10.2025, Россия275
С 20 по 25 октября прошел главный онлайн-кэмп по практической кибербезопасности CyberCamp. По итогам киберучений команда ЕДИНОГО ЦУПИС вошла в топ-10 сильнейших корпоративных команд.


В 2025 году количество платежей через ЕДИНЫЙ ЦУПИС выросло на 16% в сутки, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 06:00, 29.10.2025, Россия266
В 2025 году количество платежей через ЕДИНЫЙ ЦУПИС выросло на 16% по сравнению с предыдущим годом и превысило 2,5 млн в сутки. Максимальный пик платежной активности пришелся на февраль текущего года и составил 3,3 млн транзакций в сутки.


Операционная система «АльтерОС» совместима с геоинформационной системой «Панорама», АЛМИ Партнер, 06:00, 29.10.2025, Россия263
Компании «АЛМИ Партнер» и Конструкторское бюро «Панорама» подтвердили корректную совместную работу операционной системы «АльтерОС» и геоинформационной системы «Панорама х64». По результатам тестовых испытаний стороны подписали сертификат, официально закрепляющий интеграцию продуктов. Это позволяет пользователям применять продукты компаний в единой ИТ-инфраструктуре без дополнительных проверок.


  © 2003-2025 inthepress.ru