Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 171
Страна: Россия


Компания TCL получила многочисленные награды на выставке CES 2026 за инновации в области телевизоров, мобильных устройств и умного дома, TCL, 15:11, 17.01.2026, Россия136
9 января на выставке CES 2026 в Лас-Вегасе TCL получил ряд престижных наград на церемонии «Лучшие мировые бренды 2025-2026», прошедшей в рамках CES 2026, а также сразу несколько наград «Лучшее на CES 2026» от международных СМИ и дополнительные награды от профессиональных институтов и организаций.


Эксперт Станислав Ежов из «Группы Астра» рассказал, как решить проблему ошибок ИИ, "Группа Астра", 15:03, 17.01.2026, Россия133
Искусственный интеллект пока не приносит ожидаемого роста производительности труда. Значительная часть рабочего дня уходит на исправление ошибок ИИ, перепроверку и переделку результатов работы алгоритмов. ИИ-эксперт Станислав Ежов рассказал, как решить проблему ошибок нейросети.


«1С:Бухгалтерия хлебобулочного и кондитерского предприятия» прошла сертификацию «Совместимо», 1С-Рарус, 15:03, 17.01.2026, Россия138
Бухгалтерская программа для хлебозаводов, пекарен и кондитерских, разработанная «1С-Рарус», прошла ресертификацию фирмы «1С». Подтверждены стабильность работы и корректное взаимодействие отраслевого решения с системой программ «1С:Предприятие».


Российская компания представила LOGOS-k - новый язык программирования, ДСТ Глобал, 15:02, 17.01.2026, Россия153
6 января 2026 года российская компания DST Global и исследовательский проект A-Универсум представили LOGOS-k — специализированный язык программирования.


Новые возможности и промышленные решения в RuBackup 2.8, "Группа Астра", 15:01, 17.01.2026, Россия138
Основные усилия в этом релизе направлены на улучшение пользовательского опыта и решение прикладных задач, с которыми сталкиваются ИТ-команды при росте и поддержке инфраструктур резервного копирования.


Axenix локализует MES-систему для производителя кофе Monarch, Axenix, 15:01, 17.01.2026, Россия139
Консалтинговая технологическая компания Axenix завершила первый этап локализации MES для производителя кофе Monarch.


VolgaBlob: рынок SOC в 2025 году вырос на треть, VolgaBlob, 15:00, 17.01.2026, Россия139
По оценке компании VolgaBlob, российский рынок центров мониторинга и реагирования на инциденты информационной безопасности (SOC) стал одним из самых динамично развивающихся сегментов ИБ-индустрии.


БФТ-Холдинг приобрел долю компании ООО «Полиматика Рус» – ведущего игрока на российском рынке аналитики данных, БФТ-Холдинг, 15:00, 17.01.2026, Россия140
БФТ-Холдинг, разработчик программных продуктов и заказных решений, сообщает о приобретении 49% доли ООО «Полиматика Рус», разработчика флагманской платформы для аналитики данных Polymatica, у Группы компаний FabricaONE.AI


UDV DATAPK Industrial Kit 3.0 получил сертификат соответствия ФСТЭК России по 4 уровню доверия, UDV Group, 17:02, 15.01.2026, Россия264
UDV Group информирует о получении сертификата ФСТЭК России по 4 уровню доверия на свое флагманское решение для кибербезопасности любых АСУ ТП — UDV DATAPK Industrial Kit 3.0.


Эксперимент по цифровой маркировке проведён на производстве компании «Акульчев» в Татарстане, Первый Бит, 17:02, 15.01.2026, Россия274
Эксперты подвели итоги охвата предприятий системой промышленной маркировки. На сегодняшний день более 85% промышленных предприятий уже внедрили в работу систему маркировки либо находятся в процессе ее адаптации под новые государственные стандарты.


Индид представила Indeed PAM 3.3, Индид, 17:01, 15.01.2026, Россия266
Компания «Индид» представила новую версию Indeed Privileged Access Manager (Indeed PAM) 3.3 — системы для управления доступом привилегированных пользователей. Ключевые обновления продукта призваны повысить безопасность доступа к веб-ресурсам, упростить управление сессиями и обеспечить гибкость при контроле доступа.


Мовавика назвала дату главного всплеска новогоднего монтажа: пользователи даже летом делают праздничные ролики, но пик приходится на 20 декабря, Мовавика, 17:00, 15.01.2026, Россия267
Российская компания «Мовавика» изучила, как часто пользователи оформляют ролики с зимней и новогодней атрибутикой. Аналитики опирались на данные по нескольким сотням тысяч видео, созданных за последний год.


«НЭК.ТЕХ» приобрёл Цифровой Испытательный Полигон ЦИТМ «Экспонента», ООО "НЭК ТЕХ", 16:57, 15.01.2026, Россия271
Научно-технический центр ООО «НЭК ТЕХ» (входит в Группу «НЭК») приобрёл программно-аппаратный комплекс полунатурного моделирования и тестирования устройств релейной защиты и автоматики у ООО Центр инженерных технологий и моделирования «ЭКСПОНЕНТА».


LG ПРЕДСТАВЛЯЕТ ТЕЛЕВИЗОР WALLPAPER: САМЫЙ ТОНКИЙ В МИРЕ, ПО-НАСТОЯЩЕМУ БЕСПРОВОДНОЙ ТЕЛЕВИЗОР LG OLED, LG Electronics, 16:56, 15.01.2026, Россия273
LG ПРЕДСТАВЛЯЕТ ТЕЛЕВИЗОР WALLPAPER: САМЫЙ ТОНКИЙ В МИРЕ, ПО-НАСТОЯЩЕМУ БЕСПРОВОДНОЙ ТЕЛЕВИЗОР LG OLED


КОМПАНИЯ LG ELECTRONICS РАСШИРЯЕТ СЕРИЮ ЛАЙФСТАЙЛ ТЕЛЕВИЗОРОВ, ПРЕДСТАВИВ НОВУЮ МОДЕЛЬ GALLERY, ВДОХНОВЛЕННУЮ ИСКУССТВОМ, LG Electronics, 16:56, 15.01.2026, Россия375
Компания LG Electronics (LG) представит на выставке CES 2026 дополнение к своему портфолио лайфстайл экранов - телевизор


  © 2003-2026 inthepress.ru