Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 92
Страна: Россия


LG Wash Tower & LG Styler & LG CordZero All-in-One Tower: «башни» в помощь городским принцессам, LG Electronics, 01:45, 03.06.2024, Россия62
Помните, как в детстве зачитывались сказками о прекрасных принцессах, живущих в башне - под защитой от опасностей, подстерегающих юных дев со всех сторон?


«АРЕНЗА-ПРО» объявила о утверждении нового состава совета директоров, Arenza, 01:29, 03.06.2024, Россия69
Первая в России лизинговая финтех-компания ООО «АРЕНЗА-ПРО» (Arenza) объявила о смене состава совета директоров.


Работники СЛД «Сольвычегодск» организовали на предприятии место для кроссбукинга, филиал "Северный" ООО "ЛокоТех-Сервис", 00:58, 03.06.2024, Россия63
Шкаф для обмена книгами установлен в техническом классе сервисного локомотивного депо и уже пополнен изданиями о железнодорожном транспорте и классической литературой.


Вышло обновление системы расширенной аналитики «Дельта BI», Дельта BI, 00:52, 03.06.2024, Россия65
Разработчик self-service платформы «Дельта BI», входящей в топ-5 платформ бизнес-аналитики по версии CNews Analytics, анонсирует выход обновления 2023.12.


ПОДГОТОВИТЬСЯ К ЛЕТНЕМУ СЕЗОНУ? ЛЕГКО! ВМЕСТЕ С ПЛАТФОРМОЙ FITSTARS НА УМНЫХ ТЕЛЕВИЗОРАХ LG, LG Electronics, 00:51, 03.06.2024, Россия61
Весна всё больше заявляет о себе, готовя природу, настроение и планы на тёплое лето. Подготовиться к солнечному сезону отпусков можно, например, посещая различные спортивные секции за пределами дома. Но что если хочется сэкономить время на дорогу и провести больше времени с близкими людьми?


Общественный Совет по развитию такси призывает власть и бизнес к диалогу, АНО "Общественный совет по развитию такси", 00:50, 03.06.2024, Россия70
С 30 по 31 мая 2024 года в Екатеринбурге состоится XI Всероссийская конференция «Современное такси», на которой планируется обсудить и предложить решения для сдерживания роста тарифов на такси и развития безопасных перевозок.


PROF-IT GROUP стал платиновым партнером компании WINNUM, PROF-IT GROUP, 00:42, 03.06.2024, Россия58
По итогам 2023 года российский промышленный интегратор PROF-IT GROUP стал платиновым партнером компании WINNUM, разработчика решений для промышленного интернета вещей.


Агентство Demis Group включено в реестр малых технологических компаний, Demis Group, 00:39, 03.06.2024, Россия56
Digital-агентство Demis Group получает статус малой технологической компании. Этот статус открывает новые горизонты и возможности для развития и инвестиций, а также способствует закреплению в сознании клиентов имиджа надежной и перспективной компании.


Аспро: Приорити 2.0 — новая эра для корпоративных сайтов, Аспро, 00:39, 03.06.2024, Россия55
Компания Аспро представляет новое решение для создания корпоративных сайтов — Аспро: Приорити 2.0. Продукт объединяет современные инструменты для продвижения бизнеса в любой сфере: от производства до IT.


BIA Technologies впервые запустит «Школу разработчиков 1С», BIA Technologies, 00:33, 03.06.2024, Россия54
С 15 мая 2024 года системный интегратор BIA Technologies объявляет о наборе участников в новый бесплатный образовательный проект, который позволит новичкам в разработке 1С и специалистам с опытом развить свои навыки.


Ярославский ЭРЗ завершил весенний этап профориентационной акции «Неделя без турникета»., Ярославский электровозоремонтный завод им. Б. П. Бещева, 22:45, 01.06.2024, Россия137
Ярославский электровозоремонтный завод им. Б. П. Бещева (ЯЭРЗ, входит в АО «Желдорреммаш») завершил весенний этап Всероссийской акции «Неделя без турникета».


C3 Solutions – генеральный партнер конференции ИКС-МЕДИА «Data Center Design & Engineering», C3 Solutions, 22:32, 01.06.2024, Россия143
Компания C3 Solutions выступит генеральным партнером международной конференции для профессионалов в области инженерной инфраструктуры и эксплуатации ЦОД DCDE.


Как не копить и купить: «Выберу.ру» составил рейтинг лучших автокредитов без первого взноса за апрель 2024 года, Финансовый маркетплейс «Выберу.ру», 22:24, 01.06.2024, Россия150
«Выберу.ру подготовил рейтинг банков с самыми выгодными потребителям условиями автокредитов без обязательного первого взноса при покупке любых машин — с пробегом или новых.


B2B-маркетплейс "на_полке" стал новатором спецпредложений на рынке оптовых продаж, "на_полке", 22:23, 01.06.2024, Россия149
Компания «на_полке» стала первым B2B-маркетплейсом на рынке оптовых продовольственных закупок, сделавшим ставку на маркетинговые инструменты, свойственные рынку B2C. Начиная с конца 2023 года отдельным направлением в маркетинг-плане компании стали промоактивности, которые показали большую отдачу и открыли «на_полке» новые идеи коммуникации с целевой аудиторией.


Axenix выводит на рынок систему поддержки принятия решений SmartAx, Axenix, 22:14, 01.06.2024, Россия143
Компания Axenix выводит на рынок новый продукт – систему поддержки принятия решений SmartAx. Решение обеспечивает нативную интеграцию с технологиями машинного обучения, бизнес-правилами, внешними и внутренними источниками данных.


  © 2003-2024 inthepress.ru