 |
BSS существенно улучшила качество технологии RAG в GPT-поиске в Базе знаний InKnowledge
В новой версии RAG внесены существенные доработки, направленные на повышение производительности и качества ИИ-поиска. Компания теперь использует другую модель векторизации, которая имеет больший размер контекстного окна, что позволяет собирать больше информации и увеличить точность поиска. Ранее компания BSS внедрила GPT-поиск с RAG в Базе знаний InKnowledge от компании L2U. Это позволяет строить ответы на основе документов, находящихся в доверенном хранилище Базы знаний. Также технология умеет различать права доступа каждого пользователя, что обеспечивает дополнительную информационную безопасность при работе с RAG. Следующее важное изменение касается обработки PDF-документов. Теперь RAG-поиск умеет анализировать информацию из таблиц, размещенных в PDF-файлах, что ранее было недоступно. В предыдущей версии RAG на вопросы по таблице система находила релевантную информацию в других текстовых источниках. Также новая версия адаптирована под особенности внешних нейросетей и LLM-моделей (например, Яндекс GPT). Теперь весь распознанный текст переводится в формат Markdown, который более точно распознается сторонними сервисами при работе с таблицами в PDF. Улучшено качество разбивки файлов на чанки (кусочки информации), на которые делится база знаний для дальнейшей передачи в промт. Это было достигнуто за счет более корректного распознавания структуры файлов и расстановки границ в нужных согласно контексту местах (стык параграфов, заголовки таблиц, подзаголовки разделов и т.д.) при дроблении текстовых материалов. «При создании новой версии RAG мы сосредоточились на работе с PDF-файлами, поскольку это популярный формат документов, но вызывающий сложности при обработке материалов с помощью метода RAG. Мы научились корректно доставать информацию из таблиц в PDF-документах, а также передавать её внешним LLM-моделям за счет увеличения длины чанков. Качество поиска повысилось, а доля ошибочных ответов снизилась до 6% или более в 4 раза относительно значения показателя старой версии. Благодаря обновлению можно ещё быстрее получать содержательные ответы в Базе Знаний», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа
Компания: BSS
Добавлен: 02:58, 27.09.2024
Количество просмотров: 288
Страна: Россия
80-лет Великой Победы: праздничный эфир телеканала «78», телеканал "78" (Петербург), 17:28, 06.05.2025, Россия319 |
9 мая петербуржцы увидят трансляцию Парада Победы на Дворцовой площади, прямые включения с маршрута «Бессмертного полка», проезд ретро-техники по Невскому проспекту, а также премьеры авторских документальных фильмов, созданных ведущими телеканала «78». Вечером в специальном проекте «Песни Победы» знаменитые композиции исполнят артисты петербургской сцены и военные оркестры. |
Спрос на командировки в Европу вырос на 20%, Цифровая платформа для организации командировок и управления расходами Ракета, 17:26, 06.05.2025, Россия321 |
В апреле 2025 года российские деловые туристы на 20% чаще ездили в бизнес-путешествия в Европу. Такие данные приводят эксперты цифровой платформы для организации командировок и управления расходами Ракета, сравнивая показатели с апрелем прошлого года. |
Желдорреммаш внедряет терминалы сбора данных, https://ao-zdrm.ru/, 17:25, 06.05.2025, Россия326 |
В рамках программы цифровой трансформации и модернизации логистических процессов АО «Желдорреммаш» реализует проект внедрения терминалов сбора данных (ТСД) на заводских складах. |
|
 |