Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 950


LG ОТМЕЧЕНА МНОГОЧИСЛЕННЫМИ НАГРАДАМИ CES 2025 INNOVATION AWARDS, LG Electronics, 04:21, 17.11.2024, Россия80
Компания умных решений для жизни удостоена высокой оценки в различных категориях, получив в том числе три награды Best Innovation Awards


Школьники из России и Беларуси стали победителями международной олимпиады по креативному программированию наряду с участниками из 12 стран, ROBBO, 04:21, 17.11.2024, Россия79
Компания «РОББО», российский производитель образовательной робототехники, организатор Scratch-Олимпиады, подвела итоги 8-й Международной Scratch-Олимпиады по креативному программированию. Финал 2024 года прошел в онлайн формате с 28 сентября по 4 октября. Итоговый протокол опубликован 14 ноября на creativeprogramming.org.


HRlink внедрил кадровый ЭДО в HR-процессы «Юниливер Русь», HRlink, 04:20, 17.11.2024, Россия79
HRlink, разработчик сервиса кадрового ЭДО, автоматизировал кадровые процессы одного из лидеров российского FMCG-рынка компании «Юниливер Русь». Внедрение платформы позволило повысить эффективность работы HR-департамента – доля подписанных документов в среднем теперь составляет 97%.


«Аэродиск» выпускает opensource-версию системы управления vAIR, Аэродиск, 04:20, 17.11.2024, Россия79
Компания «Аэродиск», российский разработчик и производитель решений в области хранения данных и виртуализации, выпустил OpenSource-версию системы управления виртуализацией ИТ-инфраструктуры — Open vAIR.


«Газинформсервис» на AQ PRO: укрепление лидерства в сфере кибербезопасности, Газинформсервис, 04:15, 17.11.2024, Россия44
«Газинформсервис» принял участие в ежегодной конференции компании «Аквариус» «AQ PRO Время решений». В рамках мероприятия, где эксперты и представители ИТ-индустрии обсуждали актуальные технологические вызовы в сфере отечественной электроники и программного обеспечения, «Газинформсервис» представил ряд докладов, посвящённых решениям для повышения информационной безопасности.


Jatoba и TrueConf Enterprise: безопасная видеосвязь для критически важных инфраструктур, Газинформсервис, 04:14, 17.11.2024, Россия50
Разработка отечественной компании «Газинформсервис» — защищённая система управления базами данных (СУБД) Jatoba — интегрирована с программной платформой видеоконференцсвязи (ВКС) TrueConf Enterprise.


Как заказчику подготовиться к внедрению 1С:ERP на производственном предприятии, ООО "Цифровизация производства", 04:13, 17.11.2024, Россия61
Планируете внедрение ERP, но не знаете с чего начать? Начали настраивать 1С:ERP самостоятельно, но что-то пошло не так? Не удовлетворены результатом внедрения другого интегратора? Тогда регистрируйтесь на наш вебинар «Как заказчику подготовиться к внедрению 1С:ERP на производственном предприятии» 21 ноября в 11:00 ЗАРЕГИСТРИРОВАТЬСЯ – (ССЫЛКА)


Ставропольский край улучшает показатели по медицинским инцидентам с помощью аналитической платформы «N3.Аналитика», Нетрика, 04:12, 17.11.2024, Россия41
Платформа управления данными «N3.Аналитика», разработанная специалистами компании «Нетрика Медицина», позволяет органам управления здравоохранением Ставропольского края планомерно улучшать доступность и качество медицинской помощи


Pragmatic Tools и MONT заключили соглашение о стратегическом партнерстве в области импортозамещения, MONT, 04:12, 17.11.2024, Россия48
Компания Pragmatic Tools, разработчик программных продуктов для цифровой трансформации ИТ-инфраструктуры, и группа компаний MONT, один из крупнейших дистрибьюторов программного обеспечения в России, договорились о сотрудничестве


IT-компания PMP Tech признана «Лучшим предприятием отрасли» 2023 года, PMP Tech, 04:09, 17.11.2024, Россия62
ООО «ПМП ТЕХ» объявляет о своей номинации и признании «Лучшим предприятием отрасли 2023» в ежегодной премии, организованной Центром аналитических исследований. Эта награда стала итогом всесторонней аналитики и оценки компании, проведенной на основании данных, полученных от федеральных статистических органов и налоговой службы РФ.


«Лента» интегрировала GMonit для поддержки работоспособности SAP-систем, GMonit, 04:09, 17.11.2024, Россия62
В связи с переходом на insource поддержку SAP-систем ритейлер внедрил observability платформу GMonit, которая позволила улучшить осведомленность о текущем состоянии вендорских решений, обеспечить их стабильность и эффективность работы.


VolgaBlob — новый стратегический партнер Nubes, Nubes, 04:08, 17.11.2024, Россия40
Облачный провайдер Nubes и компания VolgaBlob подписали соглашение о стратегическом сотрудничестве. Тем самым они обеспечили возможность развернуть платформу Smart Monitor для своих клиентов.


Возможности системы Optimining обсудили на All-over-IP 2024, Систематика, 04:07, 17.11.2024, Россия43
Команда разработчиков российской системы для мониторинга и анализа бизнес-процессов Optimining рассказала о возможностях продукта участникам Форума All-over-IP & Digital Transformation 2024.


«Рейтинг Рунета»: Налог в 3% с рекламы в интернете – достаточно мягкий вариант для рекламодателей, Рейтинг Рунета, 03:58, 17.11.2024, Россия43
Эксперты «Рейтинга Рунета» считают приемлемым налог на рекламу в интернете в размере 3%. Эту цифру озвучил в качестве обсуждаемой заместитель председателя комитета Госдумы по информационной политике Антон Горелкин в своем телеграм-аккаунте.


«Рейтинг Рунета» запустил телеграм-бот подбора digital-подрядчиков, Рейтинг Рунета, 03:58, 17.11.2024, Россия47
«Рейтинг Рунета» разработал бот, упрощающий поиск подрядчика. Теперь заказчики могут найти разработчика сайта или PR-агентство за пару минут, ответив на несколько простых вопросов. С момента возникновения идеи до реализации прошло 10 месяцев. Стоимость разработки составила 1,3 млн рублей.


  © 2003-2024 inthepress.ru