Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 140
Страна: Россия


Сетевое оборудование SYMANITRON для систем безопасности доступно клиентам «АРМО-Системы», АРМО-Системы, 22:13, 07.07.2025, Россия34
«АРМО-Системы» объявила о партнерстве с ГК «Симанитрон»


БФТ-Холдинг и «ОБИТ» заключили партнёрское соглашение, БФТ-Холдинг, 22:12, 07.07.2025, Россия21
Оператор ИТ-решений «ОБИТ» и БФТ-Холдинг объявили о заключении партнёрского соглашения для совместного развития проектов в области SRM- и EAM-решений в корпоративном и отраслевом сегментах.


Jinn Server 1.3.7 от «Кода Безопасности» получил сертификаты ФСБ России и поступает в продажу, Код Безопасности, 22:11, 07.07.2025, Россия21
Программно-аппаратный комплекс электронной подписи Jinn Server. Версия 1.3 (сборка 1.3.7.218) успешно прошел инспекционный контроль ФСБ РФ. Теперь продукт «Кода Безопасности» доступен для заказа.


Афиша мероприятий на июль в ТРЦ «Нора», ТРЦ Нора, 22:08, 07.07.2025, Россия33
Торгово-развлекательный центр «Нора» готов встретить июль ярким и насыщенным календарём мероприятий для всей семьи! Этот месяц в «Норе» станет месяцем незабываемых впечатлений, радостных открытий и весёлых развлечений для всех посетителей


Wone IT завершила проект цифровой трансформации Ленстройтреста на базе ELMA365, WONE IT, 22:07, 07.07.2025, Россия23
Wone IT сообщает о завершении проекта по автоматизации управления строительством для компании «Ленстройтрест» с помощью платформы ELMA365. Внедрение позволило существенно сократить сроки согласований и повысить прозрачность ключевых процессов.


Hybrid Platform снова стала №1 среди DSP по версии AdIndex, Hybrid, 11:45, 05.07.2025, Россия265
Компания Hybrid, специализирующаяся на высокотехнологичных разработках в области интернет-рекламы, снова заняла первое место в рейтинге AdIndex Technology Index 2025 в категории DSP-платформ. Это уже второй год подряд, когда Hybrid признаётся лидером в сегменте программатик-закупки.


CorpSoft24: Изменения в 152-ФЗ вызовут рост облачного рынка России, CorpSoft24, 11:45, 05.07.2025, Россия275
Изменения в Федеральном законе №152-ФЗ «О персональных данных», вступившие в силу 1 июля 2025 года, поспособствуют усилению безопасности переданной операторам личной информации граждан и приведут к росту российского облачного рынка, прогнозируют эксперты компании CorpSoft24.


Корпоративное обучение в 2025 году: скорость, адаптация и разумное использование ИИ, iSpring, 11:45, 05.07.2025, Россия304
Во втором квартале 2025 года компания iSpring провела опрос о тенденциях в корпоративном обучении среди представителей 132 российских компаний. Результаты исследования выявили ключевые вызовы и ожидания в этой сфере.


Эксперт «Швабе» поделился опытом выстраивания экосистем интеллектуальных платформ, Холдинг «Швабе», 11:44, 05.07.2025, Россия262
Представитель холдинга «Швабе» Госкорпорации Ростех на полях XVI Международного IT-Форума с участием стран БРИКС и ШОС в Ханты-Мансийске поделился опытом применения экосистемного подхода при внедрении масштабных интеллектуальных платформ.


LG OLED EVO M5 — ПО-НАСТОЯЩЕМУ БЕСПРОВОДНОЙ OLED ТЕЛЕВИЗОР С ОТЛИЧНЫМ КАЧЕСТВОМ ИЗОБРАЖЕНИЯ УРОВНЯ МОДЕЛИ G5, LG Electronics, 11:44, 05.07.2025, Россия292
Компания LG Electronics (LG) представляет серию беспроводных OLED телевизоров LG OLED evo M5, которая сочетает в себе передовую технологию LG True Wireless1 с качеством изображения LG OLED модели G52


RedLab на ПМЭФ-2025: о вызовах, решениях и технологических трендах, RedLab, 11:42, 05.07.2025, Россия284
18-21 июня прошел XXVIII Петербургский международный экономический форум. Мероприятие посетили свыше 24 000 участников из 144 государств.


Linx Cloud вошел в топ-10 провайдеров в рейтинге IaaS Enterprise, Linx, 22:30, 03.07.2025, Россия368
Linx Cloud занял 7-е место в рейтинге провайдеров IaaS Enterprise 2025, составленным Market.CNews. В прошлом году компания была на 18-м месте. Таким образом, Linx Cloud за год поднялся в рейтинге на 11 пунктов.


Цифровая крепость: Бастион провел ребрендинг, Бастион, 16:49, 03.07.2025, Россия260
Компания по информационной безопасности «Бастион» провела ребрендинг. В обновленную айдентику вошли логотип и фирменный стиль, отражающие ключевые ценности бренда: надежность, экспертность и высокотехнологичность. Новый визуальный код подчеркивает глубину и точность экспертизы, приобретенной за годы существования компании.


Российский производитель решений по автоматизации телефонии «Агат-РТ» переводит свои ключевые продукты на операционную систему Astra Linux Embedded, "Группа Астра", 16:24, 03.07.2025, Россия258
Использование защищенной отечественной ОС расширяет возможности применения оборудования в государственных учреждениях, силовых структурах, финансовых, коммерческих и других организациях с высокими требованиями к защите данных.


Сергей Мозжеров назначен директором по продукту In.Plan, Axenix, 16:07, 03.07.2025, Россия110
Консалтинговая компания Axenix объявила о назначении Сергея Мозжерова директором по продукту (CPO) платформы интегрированного бизнес-планирования In.Plan. Ранее он занимал позицию технического директора.


  © 2003-2025 inthepress.ru