Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 206
Страна: Россия


UDV Group: энергетику ждет комплексная перестройка ИТ-ландшафта, UDV Group, 00:11, 09.05.2026, Россия637
Перечень типовых отраслевых объектов критической информационной инфраструктуры (КИИ), утвержденный в феврале 2026 года распоряжением Правительства РФ № 360-р, сделал подход к защите КИИ более жестким. Теперь игнорирование документа грозит не только высокими штрафами, но и остановкой бизнеса.


Экономия — наше всё. «Выберу.ру» подготовил рейтинг карт с кешбэком на все покупки за апрель 2026 года, Финансовый маркетплейс "Выберу.ру", 00:11, 09.05.2026, Россия628
К сезону повышенных майских расходов «Выберу.ру» составил рейтинг банков с наиболее выгодными людям дебетовыми картами благодаря максимальному кешбэку в категории «на все покупки». Топ-подборка поможет найти универсальный карточный продукт, который позволит россиянам немного сэкономить в условиях растущих цен за счёт возврата бонусов.


Банк ЗЕНИТ поздравляет с Днём Победы, Банк ЗЕНИТ, 00:10, 09.05.2026, Россия680
Банк ЗЕНИТ поздравляет своих клиентов и всех россиян с важным для страны и для каждого из нас праздником — с Днём Победы.


«Аксиома-Софт» автоматизировала учет ювелирных изделий в Торговом доме «Культура Дома», ООО "АКСИОМА-СОФТ", 00:07, 09.05.2026, Россия638
«Аксиома-Софт» автоматизировала учет ювелирных изделий в Торговом доме «Культура Дома» с помощью модуля «АКСИОМА: Интеграция с ГИИС ДМДК». Решение упростило работу по нескольким юридическим лицам: автоматическое создание номенклатуры, договоров, спецификаций. Исключено дублирование операций, ускорена передача данных в ГИИС ДМДК. Оптимизирован учет поступлений, оптовых и розничных продаж для 10 пользователей.


Sitronics Group усилила защиту внешнего ИТ-периметра с помощью платформы ETM от CICADA8, CICADA8, 00:00, 09.05.2026, Россия678
Переход на новое решение позволил автоматизировать контроль за ИТ-ландшафтом и полностью ликвидировать «слепые зоны» в защите компании.


VolgaBlob представила Smart Monitor 6.0 с функциональностью для задач observability, ИИ-движком и модулем AI Security, VolgaBlob, 23:59, 08.05.2026, Россия624
Компания VolgaBlob обновила флагманскую платформу Smart Monitor, предназначенную для анализа бизнес-процессов, ИТ-мониторинга и построения SOC/SIEM.


Hybrid: Фармбренды будут усиливать инвестиции в digital как главный канал влияния на пациента, Hybrid, 23:59, 08.05.2026, Россия679
В 2026 году российский фармацевтический рынок входит в фазу, где ключевая конкуренция за пациента разворачивается в digital-среде задолго до визита в аптеку.


Юникон Бизнес Солюшнс будет внедрять Arenadata Harmony MDM, Гармония MDM, 23:59, 08.05.2026, Россия652
Решения «Гармония», разработчик российского self-service решения для управления мастер-данными, и компания Юникон Бизнес Солюшнс, специализирующаяся на управленческом и ИТ-консалтинге, заключили стратегическое партнерство.


Первый Бит провел конференцию об электронном документообороте в Калининграде, Первый Бит, 23:58, 08.05.2026, Россия751
В Калининграде 17 апреля состоялась большая конференция о настоящем и будущем систем электронного документооборота (ЭДО).


Первый Бит и МИФИ рассказали ведущим вузам, как объединить бухгалтерию, закупки и ПЭО в единую систему, Первый Бит, 23:58, 08.05.2026, Россия714
Первый Бит совместно с НИЯУ МИФИ провел закрытый стратегический референс для представителей Сеченовского университета и МФТИ.


Группа «Борлас» представила комплексное решение для управления жизненным циклом изделия на конференции «Практики цифровизации: применение методик повышения эффективности производства», Группа "Борлас", 23:53, 08.05.2026, Россия689
В Москве состоялась X юбилейная конференция «Практики цифровизации: применение методик повышения эффективности производства», организованная Группой компаний OMEGALLIANCE FabricaONE.AI. Директор департамента производственного консалтинга Группы «Борлас» (ГК Softline) рассказал на мероприятии о комплексном подходе к управлению жизненным циклом изделия в тесной интеграции с ключевыми производственными системами.


«Астра Мониторинг» 1.4: полная наблюдаемость ИТ-инфраструктуры в едином решении корпоративного класса, "Группа Астра", 23:52, 08.05.2026, Россия124
«Астра Мониторинг» 1.4 позволяет заменить набор разрозненных инструментов единым отечественным продуктом корпоративного класса, обеспечивающим полную наблюдаемость ИТ-инфраструктуры: от метрик и логов до трейсов и управления инцидентами.


«Группа Астра» выходит на рынок цифровых финансовых активов, "Группа Астра", 23:49, 08.05.2026, Россия187
Выпуск ЦФА позволит компании расширить пул инвесторов и диверсифицировать источники финансирования бизнеса.


В России впервые реализован инструмент анализа мобильных приложений через нейросети, IT-Agency, 23:48, 08.05.2026, Россия140
Сервис для анализа присутствия брендов в AI-поиске «Киберкошка» расширил функциональность: помимо мониторинга AI-видимости брендов, платформа начала анализировать, как мобильные приложения представлены в ответах нейросетей. Это первый на рынке инструмент, который позволяет оценить их роль в формировании пользовательских рекомендаций.


ГИГАНТ - Компьютерные системы: аттестация ГИС и объектов КИИ в 2026 году, ГИГАНТ, 23:48, 08.05.2026, Россия187
Алексей Колодка, директор по работе с государственными заказчиками компании «ГИГАНТ - Компьютерные системы» рассказал о главных изменениях в аттестации ГИС и объектов КИИ в 2026 году, об особенностях для систем на open source, а также затронул неочевидные риски.


  © 2003-2026 inthepress.ru