Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1073


Сергей Семикин («ГИГАНТ - Компьютерные системы»): «Не бывает магии: работает не «сам ИИ», а правильная архитектура, качественные данные и четко ограниченный сценарий», ГИГАНТ, 23:28, 30.05.2026, Россия231
В «ГИГАНТ — Компьютерные системы» уже используют ИИ-агентов, но без попыток превратить ИИ в универсальную таблетку от всех проблем.


«Гравитон» принял участие в конференции «Эффективное производство 4.0», «Гравитон», 23:14, 30.05.2026, Россия223
Компания «Гравитон», ведущий российский разработчик вычислительной техники, приняла участие в практической промышленной конференции «Эффективное производство 4.0», которая прошла в рамках международной выставки «Металлообработка-2026».


Гран-при конкурса «BPM-проект года’2026» получил проект «Первого Бита», Первый Бит, 23:14, 30.05.2026, Россия223
Победителем конкурса «BPM-проект года’2026» признан проект компании «Первый Бит» по сквозной автоматизации заказов на производственном предприятии ООО «ЕРС-КОМПЛЕКТ». Торжественная церемония с оглашением результатов прошла 26 мая в Москве.


«Первый Бит» вошел в топ-15 поставщиков решений для анализа данных в России, Первый Бит, 23:14, 30.05.2026, Россия225
Компания «Первый Бит» вошла в топ 15 рейтинга «Крупнейшие поставщики решений для анализа данных в России 2025», подготовленного аналитическим агентством CNews Analytics в рамках обзора «Большие данные и аналитика 2026».


Aladdin LiveOffice совместим с платформой Termidesk VDI 6.1.1, "Группа Астра", 23:13, 30.05.2026, Россия215
Компании "Аладдин" и "Увеон – облачные технологии" (входит в "Группу Астра") объявляют о совместимости специализированного средства для безопасной дистанционной работы Aladdin LiveOffice с платформой для управления инфраструктурой виртуальных рабочих мест Termidesk VDI 6.1.1.


«1С-Рарус» за 1,5 месяца внедрил ERP-систему на новом заводе бытовой химии «Альмикс», 1С-Рарус, 23:12, 30.05.2026, Россия216
«1С-Рарус» внедрил «1С:ERP Управление предприятием» на новом предприятии бытовой химии «Альмикс». Автоматизированы производство, закупки, контроль качества и продажи. Система интегрирована с маркетплейсами и «Честным знаком». Компания получила платформу для работы по современным стандартам и масштабирования бизнеса


Первый БИТ стал генеральным партнером компании «ЭлНетМед», ЭлНетМед, 23:11, 30.05.2026, Россия222
Российский интегратор бизнес-решений для здравоохранения «Первый БИТ» стал генеральным партнером компании «ЭлНетМед», разработчика интеграционной платформы N3.Health и крупнейшего оператора по передаче данных в ЕГИСЗ от частной медицины.


Компания iSpring зафиксировала рост ключевых финансовых показателей по итогам 2025 года, iSpring, 23:11, 30.05.2026, Россия72
iSpring, разработчик решений для корпоративного онлайн-обучения подвел финансовые итоги 2025 года. Компания продемонстрировала устойчивую положительную динамику ключевых бизнес-показателей.


СИГМА — лауреат рейтинга Global CIO «Топ-100 ИТ-лидеров», ООО «СИГМА», 23:10, 30.05.2026, Россия81
Константин Сипачев, директор департамента решений АСТУ СИГМЫ, вошел в число профессионалов, чей стратегический вклад в развитие российской ИТ-отрасли помогает выявлять лучшие практики, обмениваться знаниями и создавать отраслевые стандарты, что в условиях импортозамещения особенно важно.


Красноярский край обошел Москву и весь юг России по любви к ретро-эстетике в видео, Мовавика, 23:10, 30.05.2026, Россия64
Жители Красноярского края используют ретро-фильтры на 22,5% чаще среднего по стране и на 70% чаще южан. Исследование видеоредактора «Мовавика Видео» также показало: петербуржцы обходят москвичей по частоте винтажных эффектов на 20%.


«Группа Астра» проверила на ЦИПР уровень доверия облакам, "Группа Астра", 23:10, 30.05.2026, Россия194
Недоверия к облакам уже нет, бизнес и провайдеры формируют новые правила игры. А «Группа Астра» представив собственное облако на российском процессоре Baikal-S, в котором безопасность заложена на уровне железа, активно строит новую реальность на этом рынке.


Почти половина роутеров не прошла тест на скорость, МегаФон, 23:08, 30.05.2026, Россия187
Эксперты лаборатории МегаФона проанализировали работу более 50 новых моделей 3G/4G-роутеров популярных брендов, которые производители направляют на тестирование до выхода в продажу.


«Энергосбыт Волга» объявляет старт летней акции «Удачные каникулы», ООО "Энергосбыт Волга", 23:05, 30.05.2026, Россия82
«Энергосбыт Волга» приглашает клиентов начать лето с акции «Удачные каникулы» и шанс получить 3 000 рублей на лицевой счёт на оплату электроэнергии и услуг ЖКХ. Будет разыграно 30 призов!


10 лет партнерства PAB с производителем редкоземельных металлов!, Pearl Axis Bearings (PAB), 23:05, 30.05.2026, Россия66
Компания Pearl Axis Bearings (PAB) и крупнейший китайский производитель редкоземельных металлов China Northern Rare Earth (CNREG) отметили 10 лет блестящего партнерства.


МегаФон и УльтимаТек объединяют экспертизу для развития рынка Private LTE в России, МегаФон, 23:03, 30.05.2026, Россия75
Компании подписали соглашение в области цифровизации промышленных предприятий на базе частных мобильных сетей. Совместные решения позволят предприятиям получать готовые цифровые платформы — от инфраструктуры связи до аналитических модулей — в рамках единого сервисного решения.


  © 2003-2026 inthepress.ru