Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 982


Готовим кадры будущего для сельского хозяйства: Всероссийский конкурс для педагогов, Свердловский РФ Россельхозбанк, 19:27, 30.03.2025, Россия466
Готовим кадры будущего для сельского хозяйства: Всероссийский конкурс для педагогов


«Аэродиск» обеспечил совместимость своих СХД с OpenStack, Аэродиск, 19:27, 30.03.2025, Россия478
Российская компания «Аэродиск», разработчик и производитель решений в области хранения данных (СХД) и виртуализации, объявила о выпуске драйвера, обеспечивающего полную совместимость своих СХД с платформой OpenStack, что значительно упрощает управление ресурсами и повышает гибкость использования СХД в различных средах.


«Аэродиск» обеспечил совместимость своих СХД с OpenStack, Аэродиск, 19:27, 30.03.2025, Россия467
Российская компания «Аэродиск», разработчик и производитель решений в области хранения данных (СХД) и виртуализации, объявила о выпуске драйвера, обеспечивающего полную совместимость своих СХД с платформой OpenStack, что значительно упрощает управление ресурсами и повышает гибкость использования СХД в различных средах.


Hybrid разработал инструмент Smart List для эффективного таргетинга через автоматический подбор площадок для показа, Hybrid, 19:26, 30.03.2025, Россия471
AdTech-экосистема Hybrid, которая специализируется на высокотехнологичных разработках в области интернет-рекламы, разработала инструмент для анализа интересов пользователей на основе посещаемых ими сайтов и приложений с использованием алгоритмов машинного обучения — Smart List.


Navicon запустил новое направление AI-консалтинга, Navicon, 19:26, 30.03.2025, Россия477
Системный интегратор и разработчик Navicon объявляет о запуске нового направления – AI-консалтинга. Теперь российские компании из различных отраслей смогут эффективно решать бизнес-задачи при помощи технологий искусственного интеллекта и развивать культуру работы с умными алгоритмами.


Главный плюс — скидка к ставкам. «Выберу.ру» составил рейтинг лучших ипотек на «вторичку» в марте 2025 года, Финансовый маркетплейс «Выберу.ру», 19:15, 30.03.2025, Россия494
«Выберу.ру» подготовил рейтинг банков с наиболее выгодными ипотечными программами для приобретения квартир на вторичном рынке недвижимости за счёт скидок к ставкам.


Delko: увеличение числа доставок коммерческой техники на 3% в 2024 году, Delko, 18:12, 28.03.2025, Россия638
В 2024 году количество доставок коммерческой техники компанией Delko увеличилось на 3% по сравнению с 2023 годом. Лидирующими марками среди перегоняемых машин остаются магистральные тягачи известных китайских брендов — Sitrak, HOWO, Foton. Также в пятерке лидеров находятся марки SHACMAN и Scania.


Оптимизация затрат на ТО: новая программа «Сервисный сертификат» для владельцев грузовиков FORLAND, FORLAND, 18:06, 28.03.2025, Россия679
В феврале АО «МБ РУС», эксклюзивный дистрибьютор коммерческих автомобилей FORLAND в России, запустило новую услугу — программу сервисных сертификатов «Комфорт», которая поможет владельцам техники FORLAND более эффективно управлять расходами на техническое обслуживание грузовиков


Сотрудники Росгвардии задержали дебошира в магазине, Управление Росгвардии по Орловской области, 18:00, 28.03.2025, Россия419
​Сотрудники Росгвардии задержали гражданина, устроившего дебош в сетевом магазине Заводского района областного центра.


В 2024 году в Тамбовской области досрочно вышли на пенсию 334 многодетные мамы, ОСФР по Тамбовской области, 18:02, 28.03.2025, Россия70
Многодетные мамы имеют право досрочно выйти на пенсию. Для этого у них должен быть страховой стаж не менее 15 лет, а размер индивидуального пенсионного коэффициента (ИПК) составлять не менее 30.


«1С-Рарус» и АО «Агентство сельхозкорма» за 1,5 месяца внедрили 1С:ERP, 1С-Рарус, 17:14, 28.03.2025, Россия101
«1С-Рарус» завершил перевод в «1С:ERP» оперативного учета АО «Агентство сельхозкорма». На сельхозпредприятии автоматизированы закупки и продажи, усовершенствованы складские и логистические процессы. Внедрение выполнено за 1,5 месяца, при этом удалось сэкономить бюджет проекта на 23%.


HRlink стал самым популярным сервисом КЭДО в Росси, HRlink, 17:13, 28.03.2025, Россия97
Команда «РБК Исследования рынков» подвела итоги исследования российского рынка кадрового ЭДО в 2025 году и опубликовала рейтинг поставщиков. Сервис HRlink второй раз подряд занял лидирующую позицию в списке.


«DатаРу Технологии» добавила в линейку беспроводного оборудования решения с поддержкой технологий ИИ, ДатаРу, 17:12, 28.03.2025, Россия96
Компания «DатаРу Технологии» обновила линейку беспроводного оборудования, добавив в нее решения с использованием искусственного интеллекта (ИИ).


Конструкторское бюро цифровых технологий обеспечило поставку программного продукта АИС «Цифра» консалтинговому агентству Московской области, ооо "КБЦТ", 17:12, 28.03.2025, Россия84
Конструкторское бюро цифровых технологий (КБЦТ) успешно завершило поставку лицензий на собственный программный продукт АИС «Цифра» региональной консалтинговой компании. Внедрение данной системы направлено на оптимизацию и автоматизацию бизнес-процессов в сфере цифровых технологий, обработки больших данных и искусственного интеллекта.


Автоматизация контроля качества и больше удобства в обновленной Речевой аналитике от BSS, BSS, 17:10, 28.03.2025, Россия89
В обновленной версии Речевой аналитики BSS появился автоматический расчёт планов и прогнозов нагрузки на контролёров качества. Также автоматизирован новый тип задач «Аудит контролёров», добавлены расширенные отчеты, показывающие выполнение плана работ и количество переработок в детализации по контролёрам отдела качества контакт-центра.


  © 2003-2025 inthepress.ru