Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 210
Страна: Россия


Представители частной медицины обсудили ключевые аспекты цифровизации отрасли на XXII Форуме частных медицинских организаций регионов России в Санкт-Петербурге, ЭлНетМед, 22:06, 03.06.2026, Россия191
27-28 мая 2026 года в Санкт‑Петербурге состоялся XXII Форум частных медицинских организаций регионов России, организованный Ассоциацией независимых экспертов «Частное здравоохранение» совместно с компанией «ЭлНетМед», разработчиком интеграционной платформы N3.Health.


SpaceVM позволяет развернуть отказоустойчивый кластер виртуализации за 15 минут, ДАКОМ М, 22:05, 03.06.2026, Россия192
Платформа виртуализации SpaceVM позволяет создать полноценный отказоустойчивый кластер за 15 минут. За это время администратор может подключить серверы, организовать общее хранилище данных и подготовить инфраструктуру к запуску виртуальных машин.


Axenix: крупный бизнес в России меняет подход к ERP, Axenix, 22:05, 03.06.2026, Россия192
Крупный бизнес больше не рассматривает замену зарубежных ERP-систем как формальную ИТ-задачу. Компании реального сектора связывают такие проекты с устойчивостью операционной модели, управляемостью данных и снижением зависимости от зарубежной ИТ-инфраструктуры.


МегаФон разработал голосового помощника для госучреждений Якутии, МегаФон, 22:05, 03.06.2026, Россия194
МегаФон и Правительство Республики Саха (Якутия) договорились о пилотном проекте внедрения голосового робота на якутском языке для ряда государственных учреждений.


МегаФон разработал голосового помощника для госучреждений Якутии, МегаФон, 22:05, 03.06.2026, Россия198
МегаФон и Правительство Республики Саха (Якутия) договорились о пилотном проекте внедрения голосового робота на якутском языке для ряда государственных учреждений. Стороны также намерены реализовать ряд проектов в сфере связи, информационной безопасности и цифровизации государственных услуг.


В России создан образовательный курс по внедрению MES, Инка, 22:05, 03.06.2026, Россия194
Компания «ИНКА 4.0» запустила образовательный курс для обучения работе с модулем «ИНКА.Модель производства» и шаблонным набором базовых автоматизированных рабочих мест (ШАРМов).


Коммерческим директором платформы «Моя смена» назначен Алексей Агибалов, Verme, 22:05, 03.06.2026, Россия195
Алексей Агибалов назначен коммерческим директором платформы «Моя смена» (входит в ГК Verme). В новой роли он будет отвечать за формирование и реализацию коммерческой стратегии, развитие продаж и ключевых партнерств, а также масштабирование бизнеса и выход на новые рынки.


БФТ-Холдинг внедрил платформу КЭДО в МГТУ им. Н.Э. Баумана, HRlink, 22:04, 03.06.2026, Россия192
БФТ-Холдинг совместно с технологическим партнёром – компанией HRlink – реализовал проект по внедрению системы кадрового электронного документооборота (КЭДО) в Московском государственном техническом университете им. Н.Э. Баумана.


МегаФон и Мурманская область договорились о развитии связи в Арктике, МегаФон, 22:04, 03.06.2026, Россия198
МегаФон и правительство Мурманской области объявили о технологическом партнерстве. В числе приоритетных направлений сотрудничества — расширение покрытия на федеральных и региональных транспортных маршрутах, а также внедрение цифровых решений для повышения безопасности и эффективности управления в регионе.


«Цифровой управленец» в ритейле: от отчётов к действиям на полях ПМЭФ, Платформа ОФД, 22:02, 03.06.2026, Россия191
2 июня в Санкт-Петербурге, в рамках III Международного форума «ИИ – будущее сегодня», прошла сессия «Цифровой управленец в ритейле: большие данные и ИИ-аналитика меняют рынок». Эксперты разобрали, почему при 85% внедрений ИИ в ритейле реальную пользу получают не все.


Продукт «1С:CRM» Центра разработки «1С-Рарус» получил сертификат «Совместимо!», 1С-Рарус, 21:59, 03.06.2026, Россия189
Статус «Совместимо! Система программ 1С:Предприятие» присвоен специализированному решению «1С-Рарус» для управления взаимоотношениями с клиентами: «1С:CRM» редакции 3.1. Подтверждено соответствие качества решения стандартам фирмы «1С».


«Боцман» 3.3.0: ещё больше возможностей для ИИ-нагрузок и промышленной эксплуатации, "Группа Астра", 21:55, 03.06.2026, Россия193
Релиз расширяет возможности по оркестрации ресурсоёмких нагрузок, усиливает безопасность и удобство эксплуатации в закрытых контурах.


ГИГАНТ - Компьютерные системы: антифрод вырос на 53%, но атак с ИИ стало в разы больше, ГИГАНТ, 21:54, 03.06.2026, Россия191
Алексей Колодка, директор по работе с государственными заказчиками компании «ГИГАНТ - Компьютерные системы» рассказал о том, что блокировка за 7,8 часа — не прорыв, а плановый показатель, рост антифрода на 53,7% требует учёта сезонности и атак с ИИ, а 12,2 млрд рублей на 8% ключевых организаций достаточно для защиты граждан.


«Телфин» и Yandex представят возможности аналитики клиентских коммуникаций на базе ИИ, Телфин, 21:54, 03.06.2026, Россия78
Провайдер коммуникационных сервисов «Телфин» совместно с партнером Yandex Cloud организуют вебинар, посвященный вопросам автоматизации клиентских коммуникаций, контроля качества и аналитики обращений на основе ИИ.


VisionLabs внедрила систему распознавания возгораний, оружия и драк в офисах МТС, MWS AI, 21:53, 03.06.2026, Россия96
МТС и разработчик технологий компьютерного зрения VisionLabs внедрили в офисах и на других объектах МТС Luna Scanner — комплексную систему распознавания угроз, разработанную на базе инфраструктуры MWS Cloud.


  © 2003-2026 inthepress.ru