Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 182
Страна: Россия


Nexign и «1С» подтвердили совместимость СУБД Nexign Nord и платформы «1С:Предприятие», Nexign, 22:20, 02.03.2026, Россия254
Специальная версия Nexign Nord для 1С полностью совместима с платформой «1С:Предприятие». Работа двух решений позволит повысить производительность бизнеса и снизить совокупную стоимость владения.


RooX UIDM интегрирован с NextCloud: единый вход без отказа от LDAP-инфраструктуры, RooX, 22:20, 02.03.2026, Россия249
Компания RooX объявила о реализации интеграции платформы управления доступом RooX UIDM с опенсорс-системой совместной работы NextCloud.


Navicon и Адвантум стали партнерами, Navicon, 22:20, 02.03.2026, Россия243
Системный интегратор и разработчик Navicon заключил партнерское соглашение с Адвантум, разработчиком ИТ-решений для управления транспортной логистикой.


Observability в 1С:ITILIUM: как веб-портал ITSM/ESM-системы помогает снижать MTTR и принимать обоснованные ИТ-решения, Деснол, 22:18, 02.03.2026, Россия260
Деснол добавил свойство наблюдаемости (observability) в портал для потребителей услуг 1C:ITILIUM


Модуль «Списки» от BSS: готовое решение для соответствия новым требованиям ЦБ, BSS, 22:18, 02.03.2026, Россия256
Технология BSS позволяет банкам автоматически проверять контрагентов юрлиц и на 100% соответствовать рекомендациям ЦБ №15-МР. Решение уже внедрено в ряде финансово-кредитных организаций.


Централизованный контроль доступа для контейнеров: «Боцман» и Blitz Identity Provider успешно протестированы, "Группа Астра", 22:17, 02.03.2026, Россия248
Подтвержденная совместимость ускоряет внедрение контейнерной платформы, сокращает сроки пилотных проектов и предоставляет заказчикам предсказуемый, стабильный программный стек для промышленной эксплуатации.


Новый уровень безопасности контейнеров: «Платформа Боцман» и «АТ Консалтинг» анонсировали интеграцию для автоматического управления секретами, "Группа Астра", 22:12, 02.03.2026, Россия250
Совместное решение трансформирует подход к безопасности в DevSecOps-циклах, делая защиту данных неотъемлемой частью инфраструктуры, а не ручной задачей для разработчиков.


Удобство сборки и эксплуатации электрощитов с новыми аксессуарами для автоматических выключателей BA-201 марки Dekraft, АРМО-СИСТЕМЫ, 22:07, 02.03.2026, Россия283
Компания Systeme Electric расширила ассортимент модульного оборудования марки Dekraft, добавив в нее дополнительные контакты, расцепители и другие аксессуары для автоматических выключателей семейства BA-201 с отключающей способностью 10 кА


Лидер российской виртуализации выходит на рынок Беларуси с решениями корпоративного уровня, ДАКОМ М, 21:40, 27.02.2026, Россия392
Компания «ДАКОМ М» (бренд Space) заключила партнёрское соглашение с белорусским VAD-дистрибьютором Linkway. В рамках сотрудничества в портфель Linkway вошли решения экосистемы Space для виртуализации.


«Группа Астра» внедряет Astra Linux в Петербургском государственном университете путей сообщения императора Александра I, "Группа Астра", 21:56, 27.02.2026, Россия366
«Группа Астра» реализует масштабный проект по миграции ИТ-инфраструктуры Петербургского государственного университета путей сообщения Императора Александра I с зарубежного решения Microsoft Windows на отечественную операционную систему Astra Linux.


«1С-Рарус» подтвердил статус Центра разработки фирмы «1С», 1С-Рарус, 21:51, 27.02.2026, Россия367
«1С-Рарус» успешно прошел аудит и подтвердил статус Центра разработки фирмы «1С». Полученный сертификат подтверждает экспертизу компании в создании надежных тиражных решений на платформе «1С:Предприятие 8».


ГИГАНТ: как рост цен на оперативную память и NAND влияет на экономику рынка ЦОД, ГИГАНТ, 21:51, 27.02.2026, Россия434
Комментирует Дмитрий Пустовалов, директор департамента обеспечения и развития компании «ГИГАНТ Компьютерные системы»


UDV Group: телеком становится главной мишенью для кибератак, UDV Group, 21:50, 27.02.2026, Россия416
По данным RED Security, 2025-й стал для хакеров «годом телекоммуникаций». Именно российская отрасль связи перехватила «лидерство» у промышленного сектора по количеству попыток кибератак на IT-инфраструктуру компаний — 40% от общего числа нападений против 9% годом ранее.


Nexign представила новую версию СУБД Nexign Nord 6 с расширенной функциональностью и поддержкой PostgreSQL 18, Nexign, 21:39, 27.02.2026, Россия405
Компания Nexign («Нэксайн») выпустила новую версию СУБД Nexign Nord 6. Ключевым нововведением стала полноценная поддержка PostgreSQL 18


Hybrid: российский диджитал-рынок в 2026 году входит в фазу консолидации и умеренного роста, Hybrid, 21:39, 27.02.2026, Россия387
AdTech-экосистема Hybrid, которая специализируется на высокотехнологичных разработках в области интернет-рекламы, назвала главные тренды, которые повлияют на развитие российского диджитал-рынка в 2026 году


  © 2003-2026 inthepress.ru