Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 148
Страна: Россия


Hisense объявила, что в третий раз выступит в качестве официального спонсора Чемпионата мира по футболу FIFA™, Hisense, 13:15, 11.09.2025, Россия172
На международной выставке IFA 2025 компания Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, объявила, что вновь станет официальным спонсором Чемпионата мира по футболу FIFA™, укрепляя давнее сотрудничество с FIFA, начатое в 2018 году.


Аскона вошла в число компаний, чьи задачи по устойчивому развитию решат участники кейс-чемпионата MIR, Группа компаний Аскона, 17:00, 10.09.2025, Россия290
ГК “Аскона” предоставила к решению свой кейс на VI Всероссийском кейс-чемпионате MIR, посвященном вопросам устойчивого развития и корпоративной социальной ответственности. Участники чемпионата будут решать реальные задачи бизнеса, в том числе кейс от крупнейшего производителя товаров для сна в России.


Новая версия ALD Pro 3.0 – больше производительности и защиты для крупных инфраструктур с миллионами пользователей, "Группа Астра", 16:40, 10.09.2025, Россия270
«Группа Астра» вывела на рынок сразу две новинки: релиз ALD Pro 3.0 для масштабных ИТ-ландшафтов и бесплатную редакцию этого же продукта ALD Pro Free для небольших команд.


Компания LUIS+ получила сертификаты соответствия СОУЭ «Антитеррор», LUIS+, 16:35, 10.09.2025, Россия265
Оборудование торговой марки LPA компании LUIS+ прошло сертификацию соответствия требованиям СОУЭ «Антитеррор» по ГОСТ Р 71934-2025.


Сеть под контролем, даже в облаке: UDV NTA подтвердил совместимость с K2 Cloud, UDV Group, 16:35, 10.09.2025, Россия272
K2 Cloud и UDV Group подтвердили совместимость системы анализа сетевого трафика UDV NTA с облачной инфраструктурой K2 Cloud.


«DатаРу Технологии» усилила линейку серверов «ДатаРу ПИ» для ускоренного внедрения AI/ML и виртуализации рабочих мест, ДатаРу, 16:34, 10.09.2025, Россия276
Компания «DатаРу Технологии» обновила линейку серверов «ДатаРу ПИ». Ключевым изменением стало внедрение новых процессорных решений, что позволило существенно повысить производительность, масштабируемость и эффективность инфраструктуры.


CorpSoft24 модернизировал систему «Цифровое снабжение», CorpSoft24, 15:37, 10.09.2025, Россия271
Оператор цифровой экосистемы для бизнеса CorpSoft24 выводит на рынок усовершенствованную версию своей системы управления корпоративными закупками и снабжением на базе 1С – «Цифровое снабжение», предназначенной для автоматизации полного цикла закупок.


БФТ-Холдинг выпустил обновленную версию АИС «МФЦ-Капелла», БФТ-Холдинг, 15:00, 10.09.2025, Россия268
БФТ-Холдинг обновил систему для автоматизации процессов оказания госуслуг в МФЦ – АИС «МФЦ-Капелла». Решение получило больше возможностей взаимодействия со смежными федеральными информационными системами, новые инструменты оповещения заявителей, а также ряд других функциональных улучшений.


Ставкам — скорость падения: «Выберу.ру» составил рейтинг кредитов на авто с пробегом за август 2025 года, Финансовый маркетплейс "Выберу.ру", 14:59, 10.09.2025, Россия288
К началу осени «Выберу.ру подготовил рейтинг банков с наиболее выгодными потребителям условиями автокредитов на подержанные машины в условиях, когда ставки кредитования незначительно снижаются следом за «ключом» ЦБ.


СИБУР и COMITAS повысят автоматизацию логистики с вовлечением синтетических материалов, COMITAS, 14:58, 10.09.2025, Россия207
На полях ВЭФ во Владивостоке СИБУР и COMITAS подписали соглашение о взаимодействии, направленное на развитие отечественных систем автоматизации и роботизации в складской и производственной логистике с использованием решений из синтетических материалов.


Школьники со всей России могут испытать себя в космическом хакатоне «Привет, Спутник!», ООО "ГЕОСКАН", 14:57, 10.09.2025, Россия113
Компания «Геоскан» продлевает регистрацию на всероссийский школьный хакатон «Привет, Спутник!» до 15 сентября 2025 года. Проект объединяет онлайн-квест и очный финал в Москве, где команды участников будут работать с оборудованием и специализированным ПО, собирать наземную станцию и восстанавливать связь со спутником в условиях смоделированной внештатной ситуации.


ООО «ИскраТех» и Группа «Борлас» (ГК Softline) объявляют о стратегическом партнерстве для укрепления технологического суверенитета российских промышленных предприятий, Группа "Борлас", 14:57, 10.09.2025, Россия95
В рамках реализации государственной программы импортозамещения и обеспечения технологического суверенитета компания ООО «ИскраТех», российский интегратор инженерных решений, заключила стратегическое партнерское соглашение с Группой «Борлас» (ГК Softline), мастер-дистрибьютором CAE Fidesys.


«Торги223» вошла в десятку крупнейших ЭТП России, АО "Центр развития электронных торгов" - оператор ЭТП "Торги223", 14:52, 10.09.2025, Россия105
«Торги223» вошла в десятку крупнейших ЭТП России


«Искусственное обвинение»: история ребенка и инвалида отца-одиночки, обвиняемого в преступлении, ФЬЮЧА, 14:49, 10.09.2025, Россия78
19 октября в Москве в отношении Ложкина Романа Викторовича, инвалида 3 группы с детства и отца-одиночки возбуждено уголовное дело по статье "мошенничество".


Hisense представила новые решения для дома на выставке IFA 2025 в Берлине, Hisense, 14:44, 10.09.2025, Россия206
Компания Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, продемонстрировала на IFA 2025 комплекс умных технологических решений.


  © 2003-2025 inthepress.ru