 |
«Платформа ОФД» представила технологию умной потоковой обработки данных из чеков
На основе накопленного опыта работы с агрегированными обезличенными данными – компания разработала собственное ноу-хау - технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.
Процесс обработки происходит в режиме реального времени, позволяя в «потоке» фискальных документов скоростью более 1 000 транзакций в секунду - классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.
О применении технологии рассказал в ходе пресс-конференции «5 лет системе ОФД и онлайн-касс в России» Алексей Баров, генеральный директор «Платформы ОФД», крупнейшего оператора фискальных данных страны.
«Часто в чеках встречается короткое наименование товара и его характеристик, либо в названии допущены ошибки или опечатки. Это связано с ограничениями по объему символов в строках фискальных документах, которые выдаются покупателю. Другая причина – пресловутый человеческий фактор.
Благодаря технологиям Machine Learning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр.
Сегодня такая потоковая обработка охватывает до 21 миллиона товаров (SKU) из 3,5 тыс. категорий, с 6 уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться «умнее». Мы планируем развивать это направление еще интенсивнее», - отметил Алексей Баров.
База для работы с короткими текстами «Платформы ОФД» на данный момент включает 5 млрд уникальных записей товаров, 150 млн написаний товаров в день. На потоке определяется более 3 млн брендов. При этом данные для классификации агрегируются как из чеков, так и из свободного доступа (отраслевые классификаторы/ каталоги с сайтов ретейлеров/ данные маркировки).
Ноу-хау помогло выявить, какова доля чеков с сокращениями и ошибками. По оценкам «Платформы ОФД», грамматические ошибки, опечатки и сокращения ежедневно допускаются в 60-65% всех чеков из продуктовой розничной торговли. При этом еще два года назад этот показатель был на уровне 80-85%. Меньше всего неточностей в фискальных документах организаций и предпринимателей сектора медицинских услуг – порядка 20-25%. IT-компания «Платформа ОФД» ежедневно обрабатывает 48 - 50 млн кассовых чеков в день. В системе компании уже 55 млрд фискальных документов.
Контактное лицо: Ekaterina
Компания: «Платформа ОФД»
Добавлен: 01:06, 12.09.2021
Количество просмотров: 703
Страна: Россия
Hisense объявила, что в третий раз выступит в качестве официального спонсора Чемпионата мира по футболу FIFA™, Hisense, 13:15, 11.09.2025, Россия177 |  |
На международной выставке IFA 2025 компания Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, объявила, что вновь станет официальным спонсором Чемпионата мира по футболу FIFA™, укрепляя давнее сотрудничество с FIFA, начатое в 2018 году. |
CorpSoft24 модернизировал систему «Цифровое снабжение», CorpSoft24, 15:37, 10.09.2025, Россия276 |  |
Оператор цифровой экосистемы для бизнеса CorpSoft24 выводит на рынок усовершенствованную версию своей системы управления корпоративными закупками и снабжением на базе 1С – «Цифровое снабжение», предназначенной для автоматизации полного цикла закупок. |
БФТ-Холдинг выпустил обновленную версию АИС «МФЦ-Капелла», БФТ-Холдинг, 15:00, 10.09.2025, Россия273 |  |
БФТ-Холдинг обновил систему для автоматизации процессов оказания госуслуг в МФЦ – АИС «МФЦ-Капелла». Решение получило больше возможностей взаимодействия со смежными федеральными информационными системами, новые инструменты оповещения заявителей, а также ряд других функциональных улучшений. |
Школьники со всей России могут испытать себя в космическом хакатоне «Привет, Спутник!», ООО "ГЕОСКАН", 14:57, 10.09.2025, Россия113 |
Компания «Геоскан» продлевает регистрацию на всероссийский школьный хакатон «Привет, Спутник!» до 15 сентября 2025 года. Проект объединяет онлайн-квест и очный финал в Москве, где команды участников будут работать с оборудованием и специализированным ПО, собирать наземную станцию и восстанавливать связь со спутником в условиях смоделированной внештатной ситуации. |
|
 |