Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1032


Nexign: рынок ПО для телекома будет развиваться за счет модернизации BSS и инструментов искусственного интеллекта, Nexign, 21:14, 24.12.2025, Россия59
В Nexign оценили развитие рынка программного обеспечения для телеком-отрасли в 2025 году и дали прогнозы на 2026-й.


Исследование Axenix: у взаимоотношений банков и маркетплейсов есть два сценария, Axenix, 21:37, 24.12.2025, Россия160
Консалтинговая компания Axenix провела исследование конвергенции маркетплейсов и банков на российском и мировом рынках. Результаты исследования показывают, как влияет на рынок сближение и взаимопроникновение секторов финансов и электронной коммерции


CorpSoft24 подвел итоги года на рынке информационной безопасности, CorpSoft24, 21:37, 24.12.2025, Россия158
В 2025 году российский рынок информационной безопасности (ИБ) стремительно развивался в ответ на требования цифровизации, регуляторные изменения и усиление угроз со стороны киберпреступности.


ФСБ продлила сертификат на средство защиты «Континент-АП» от «Кода Безопасности», Код Безопасности, 21:29, 24.12.2025, Россия150
Специалисты ФСБ России провели успешные испытания «Континент-АП» Версия 4 (сборки 4.1.689.0 и 4.1.725.0) на соответствие требованиям к средствам криптографической защиты информации (СКЗИ).


Адаптивное решение для перехода на ISO 20022 успешно внедрено в российском банке, ЕГАР Сервис, 21:28, 24.12.2025, Россия150
Компания EGAR успешно завершила первый проект по внедрению и интеграции конвертера Swift-сообщений «СМАРТКОНВЕРТ» в инфраструктуру российского банка. Проект реализован в ответ на глобальные изменения Swift по обязательному переходу участников финансового рынка на стандарт ISO 20022. Внедрение конвертера позволит Заказчику обеспечить плавную миграцию платежных потоков без остановки операционной деятельности.


«Оптимакрос» — в числе крупнейших вендоров в сфере строительства по версии TAdviser, Оптимакрос, 21:27, 24.12.2025, Россия143
ГК «Оптимакрос» заняла 4 место в рейтинге ИТ-разработчиков 2024 года, чьи программные продукты используются в строительной отрасли. В итоговый список аналитики TAdviser включили компании с наибольшей выручкой от реализации ИТ-проектов на базе собственных решений.


«Эвалар» и VARSEAS заключили соглашение о стратегическом сотрудничестве, VARSEAS, 21:25, 24.12.2025, Россия85
ЗАО «Эвалар» и ООО «АС РС» (VARSEAS) заключили соглашение о стратегическом партнерстве, направленном на развитие инновационных решений в сфере продукции для здоровья и укрепление позиций сторон на российском и международном рынках. Подписание документов о сотрудничестве состоялось накануне на предприятии компании «Эвалар» в Бийске.


Настенные шкафы Filum WALL BOX – надежное и эргономичное решение для сетевой инфраструктуры, ГК X-Com, 21:23, 24.12.2025, Россия81
Filum объявляет о запуске линейки настенных шкафов WALL BOX.


SpaceVM вошла в список лидеров среди российских платформ виртуализации 2025 от «Компьютерры», ДАКОМ М, 20:57, 23.12.2025, Россия162
Платформа серверной виртуализации SpaceVM компании «ДАКОМ М» вошла в тройку лидеров ежегодного Рейтинга российских платформ виртуализации 2025, который подготовил аналитический отдел издания «Компьютерра».


РЕД СОФТ и АЭРОДИСК подтвердили совместимость СХД ENGINE AQ с РЕД ОС, Аэродиск, 20:57, 23.12.2025, Россия129
Проведенные тесты подтверждают стабильную и эффективную работу совместного решения, что позволяет предлагать клиентам комплексные отечественные ИТ-продукты, соответствующие требованиям импортозамещения и информационной безопасности.


Axenix и IT Vectura формируют стратегический альянс для создания новой практики цифровой трансформации логистики, Axenix, 20:56, 23.12.2025, Россия139
Консалтинговая технологическая компания Axenix и разработчик платформенных решений IT Vectura подписали соглашение о стратегическом партнерстве.


UDV Group: Контроль версий проектов ПЛК в АСУ ТП, UDV Group, 20:56, 23.12.2025, Россия227
Работу станков, линий и технологических комплексов определяют проекты ПЛК, и любое несанкционированное изменение в их коде может привести не только к аварии и простоям, но и к угрозе безопасности людей.


Банк Уралсиб оценил итоги применения системы активной бизнес-аналитики Proceset, Инфомаксимум, Банк Уралсиб, 20:37, 23.12.2025, Россия52
Банк Уралсиб оценил результаты применения системы активной бизнес-аналитики Proceset, которая помогла повысить эффективность работы сотрудников с новым программным продуктом.


АО «ЦРЭТ» модернизировал ИТ-инфраструктуру ЭТП «Торги223» и обеспечил переход на облачную платформу, АО «Центр развития электронных торгов», 20:54, 23.12.2025, Россия139
АО «Центр развития электронных торгов» (оператор ЭТП «Торги223») объявляет о завершении проекта по переносу инфраструктуры на облачную платформу Yandex Cloud.


Завершено строительство завода по производству автоклавного газобетона в Зеленограде, ГК ФСК, 20:53, 23.12.2025, Россия139
Завод по производству автоклавного газобетона (входит в периметр ГК ФСК), расположенный на территории промышленно-строительного комплекса в Зеленограде, получил разрешение на ввод в эксплуатацию. Комплекс возводит ГК ФСК в рамках масштабного инвестиционного проекта (МаИП). По программе стимулирования создания мест приложения труда завод обеспечит более 100 высокотехнологичных рабочих мест.


  © 2003-2025 inthepress.ru