Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 215
Страна: Россия


DатаРу представила новый сервер для задач развития искусственного интеллекта, ДатаРу, 16:12, 20.06.2026, Россия507
Российский вендор технологических решений и сервисов DатаРу выпустил на рынок новый сервер «ДатаРу XE9785», ориентированный на выполнение ресурсоемких задач в области искусственного интеллекта.


От разговоров об ИИ к практическому применению: как прошёл первый поток курса VAP: Применение ИИ в ITSM и ESM, Cleverics, 16:11, 20.06.2026, Россия558
В Cleverics подвели итоги первого потока курса по применению искусственного интеллекта в сервис-менеджменте. Ключевая задача программы заключалась не в обучении программированию, а в том, чтобы дать специалистам практический инструментарий для внедрения ИИ и ответить на главный вопрос бизнеса: «с чего начать и будет ли от этого толк».


МегаФон ускорит интернет на «Пикнике Афиши», МегаФон, 16:10, 20.06.2026, Россия507
Оператор обеспечит высокоскоростным мобильным интернетом десятки тысяч гостей фестиваля «Пикник Афиши», который пройдёт 20 июня в музее-заповеднике «Коломенское».


В МГППУ прошла кросс‑вузовская экспертиза в рамках реализации программы развития «Приоритет – 2030», Московский государственный психолого-педагогический университет, 15:37, 20.06.2026, Россия346
Стратегическая цель Университета направлена на достижение лидерства в области психолого-педагогического образования


Производительность труда и здоровье: от пилота к масштабированию!, Нобилис ООО, 16:07, 20.06.2026, Россия563
Ивановская область может стать инновационным регионом в автоматизации диспансеризации!


«ГИГАНТ — Компьютерные системы» о том, почему Drama RAT опасен не только для банковских счетов, ГИГАНТ, 15:57, 20.06.2026, Россия501
Эксперт «ГИГАНТ — Компьютерные системы» объяснил, как Drama RAT получает контроль над смартфоном, почему его сложно обнаружить статическим анализом и чем заражение личного телефона может угрожать компании


«1С-Рарус» в Нижнем Новгороде подтвердил статус «Центр сопровождения 1С», 1С-Рарус, 15:56, 20.06.2026, Россия513
По результатам аудита нижегородский офис «1С‑Рарус» подтвердил статус «Центр сопровождения программ и информационных продуктов фирмы „1С“». Клиенты «1С-Рарус» получают рекомендованный фирмой «1С» уровень сервиса: регулярные обновления, консультации и поддержку по программам «1С:Предприятие» и сервисам 1С:ИТС.


ЯрПАПА шагает по стране 2026, АНО "Содружество семей", 15:56, 20.06.2026, Россия495
Автономная некоммерческая организация «Содружество семей» совместно с Региональным отделением Всероссийского общественного движения «ОТЦЫ РОССИИ» Ярославской области объявляют о начале приема заявок на участие во Всероссийском конкурсе семейных видеороликов «ЯрПАПА шагает по стране-2026».


Платформа Optimacros представлена на карте CNews Analytics «Импортозамещение в банках 2026», ООО "Оптимакрос", 15:51, 20.06.2026, Россия517
Агентство CNews Analytics выпустило обновленную инфографику «Импортозамещение в банках 2026» и включило CPM/IBP-платформу Optimacros в раздел «Управление ликвидностью, казначейством и бюджетирование».


«Выберу.ру»: накопительный счёт МТС Банка — лидер рейтинга в июне 2026 года, Финансовый маркетплейс "Выберу.ру", 15:51, 20.06.2026, Россия551
МТС Банк возглавил рейтинг крупнейших банков страны по итогам исследования «Выберу.ру» «Лучшие накопительные счета в июне 2026 года».


Space расширяет региональное присутствие: в Самаре открылся новый офис компании, ДАКОМ М, 15:50, 20.06.2026, Россия531
«ДАКОМ М» (бренд Space), российский разработчик программного обеспечения и R&D-центр, открыл новый офис в Самаре.


ТЦ «Муравей» приглашает на дегустацию летних новинок от кофе-бара «Кофелайк», тц муравей, 15:49, 20.06.2026, Россия96
Торговый центр «Муравей» продолжает радовать посетителей яркими событиями и гастрономическими открытиями!


GreenData подключила ИИ-ассистентов к корпоративным системам через MCP, GreenData, 15:47, 20.06.2026, Россия114
GreenData расширила возможности конструктора корпоративных ИИ-ассистентов GreenBox. Конструктор GreenBox теперь позволяет работать с Jira, GitLab и другими внешними сервисами, а также запускать процессы и создавать объекты непосредственно в low-code платформе.


Minervasoft назвала пять ошибок в работе с корпоративными знаниями при внедрении ИИ-ассистентов, Minervasoft, 15:47, 20.06.2026, Россия141
Более 80% компаний среди крупного и среднего бизнеса допускают критичные ошибки в работе с корпоративными знаниями. Это приводит к увеличению нагрузки на сотрудников и становится стоп-фактором при внедрении ИИ-ассистентов, следует из результатов проведенных Minervasoft аудитов.


«Первый Бит» развернул защищенную BI-аналитику в закрытом контуре машиностроительной компании «Диполь», Первый Бит, 15:46, 20.06.2026, Россия128
Время подготовки отчетности сократилось с 1-2 дней до 10-15 минут, а бизнес-пользователи стали на 60% чаще выводить нужные отчеты самостоятельно.


  © 2003-2026 inthepress.ru