Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 1017


Аскона вошла в число компаний, чьи задачи по устойчивому развитию решат участники кейс-чемпионата MIR, Группа компаний Аскона, 17:00, 10.09.2025, Россия144
ГК “Аскона” предоставила к решению свой кейс на VI Всероссийском кейс-чемпионате MIR, посвященном вопросам устойчивого развития и корпоративной социальной ответственности. Участники чемпионата будут решать реальные задачи бизнеса, в том числе кейс от крупнейшего производителя товаров для сна в России.


Новая версия ALD Pro 3.0 – больше производительности и защиты для крупных инфраструктур с миллионами пользователей, "Группа Астра", 16:40, 10.09.2025, Россия127
«Группа Астра» вывела на рынок сразу две новинки: релиз ALD Pro 3.0 для масштабных ИТ-ландшафтов и бесплатную редакцию этого же продукта ALD Pro Free для небольших команд.


Компания LUIS+ получила сертификаты соответствия СОУЭ «Антитеррор», LUIS+, 16:35, 10.09.2025, Россия130
Оборудование торговой марки LPA компании LUIS+ прошло сертификацию соответствия требованиям СОУЭ «Антитеррор» по ГОСТ Р 71934-2025.


Сеть под контролем, даже в облаке: UDV NTA подтвердил совместимость с K2 Cloud, UDV Group, 16:35, 10.09.2025, Россия133
K2 Cloud и UDV Group подтвердили совместимость системы анализа сетевого трафика UDV NTA с облачной инфраструктурой K2 Cloud.


«DатаРу Технологии» усилила линейку серверов «ДатаРу ПИ» для ускоренного внедрения AI/ML и виртуализации рабочих мест, ДатаРу, 16:34, 10.09.2025, Россия138
Компания «DатаРу Технологии» обновила линейку серверов «ДатаРу ПИ». Ключевым изменением стало внедрение новых процессорных решений, что позволило существенно повысить производительность, масштабируемость и эффективность инфраструктуры.


CorpSoft24 модернизировал систему «Цифровое снабжение», CorpSoft24, 15:37, 10.09.2025, Россия133
Оператор цифровой экосистемы для бизнеса CorpSoft24 выводит на рынок усовершенствованную версию своей системы управления корпоративными закупками и снабжением на базе 1С – «Цифровое снабжение», предназначенной для автоматизации полного цикла закупок.


БФТ-Холдинг выпустил обновленную версию АИС «МФЦ-Капелла», БФТ-Холдинг, 15:00, 10.09.2025, Россия130
БФТ-Холдинг обновил систему для автоматизации процессов оказания госуслуг в МФЦ – АИС «МФЦ-Капелла». Решение получило больше возможностей взаимодействия со смежными федеральными информационными системами, новые инструменты оповещения заявителей, а также ряд других функциональных улучшений.


Ставкам — скорость падения: «Выберу.ру» составил рейтинг кредитов на авто с пробегом за август 2025 года, Финансовый маркетплейс "Выберу.ру", 14:59, 10.09.2025, Россия131
К началу осени «Выберу.ру подготовил рейтинг банков с наиболее выгодными потребителям условиями автокредитов на подержанные машины в условиях, когда ставки кредитования незначительно снижаются следом за «ключом» ЦБ.


СИБУР и COMITAS повысят автоматизацию логистики с вовлечением синтетических материалов, COMITAS, 14:58, 10.09.2025, Россия98
На полях ВЭФ во Владивостоке СИБУР и COMITAS подписали соглашение о взаимодействии, направленное на развитие отечественных систем автоматизации и роботизации в складской и производственной логистике с использованием решений из синтетических материалов.


Школьники со всей России могут испытать себя в космическом хакатоне «Привет, Спутник!», ООО "ГЕОСКАН", 14:57, 10.09.2025, Россия60
Компания «Геоскан» продлевает регистрацию на всероссийский школьный хакатон «Привет, Спутник!» до 15 сентября 2025 года. Проект объединяет онлайн-квест и очный финал в Москве, где команды участников будут работать с оборудованием и специализированным ПО, собирать наземную станцию и восстанавливать связь со спутником в условиях смоделированной внештатной ситуации.


ООО «ИскраТех» и Группа «Борлас» (ГК Softline) объявляют о стратегическом партнерстве для укрепления технологического суверенитета российских промышленных предприятий, Группа "Борлас", 14:57, 10.09.2025, Россия66
В рамках реализации государственной программы импортозамещения и обеспечения технологического суверенитета компания ООО «ИскраТех», российский интегратор инженерных решений, заключила стратегическое партнерское соглашение с Группой «Борлас» (ГК Softline), мастер-дистрибьютором CAE Fidesys.


«Торги223» вошла в десятку крупнейших ЭТП России, АО "Центр развития электронных торгов" - оператор ЭТП "Торги223", 14:52, 10.09.2025, Россия57
«Торги223» вошла в десятку крупнейших ЭТП России


«Искусственное обвинение»: история ребенка и инвалида отца-одиночки, обвиняемого в преступлении, ФЬЮЧА, 14:49, 10.09.2025, Россия56
19 октября в Москве в отношении Ложкина Романа Викторовича, инвалида 3 группы с детства и отца-одиночки возбуждено уголовное дело по статье "мошенничество".


Hisense представила новые решения для дома на выставке IFA 2025 в Берлине, Hisense, 14:44, 10.09.2025, Россия113
Компания Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, продемонстрировала на IFA 2025 комплекс умных технологических решений.


Компьютеры АО «ИВК» включены в Реестры промышленной продукции и электронной продукции Минпромторга Российской Федерации, ИВК, 14:42, 10.09.2025, Россия60
9 сентября 2025 г., Москва


  © 2003-2025 inthepress.ru