Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 87
Страна: Россия


Подтверждена совместимость решений AlterOS и ключевых носителей СКЗИ «MS_KEY K» - «АНГАРА», ALMI Partner, 04:38, 26.04.2024, Россия407
ALMI Partner и ООО «НТЦ Альфа-Проект» подтвердили совместимость и корректность работы решений AlterOS со средствами криптографической защиты информации «MS_KEY K» - «АНГАРА».


ИТ-компания SIPUNI перешла на кадровый ЭДО с помощью сервиса HRlink, HRlink, 04:38, 26.04.2024, Россия409
Компания SIPUNI, специализирующаяся на корпоративной ИТ-телефонии для бизнеса, перевела на безбумажный документооборот HR-процессы с помощью платформы HRlink. Внедрение сервиса для кадрового ЭДО сделало процесс оформления документов более быстрым и простым, а также контролируемым.


BSS на «Мобильных финансах-2024»: цифровизация и ИИ ключевые драйверы развития банковской отрасли, BSS, 04:38, 26.04.2024, Россия411
Основные тренды развития электронных финансовых услуг в 2024 году и кейс цифровизации на примере проекта в Новикомбанке.


Виртуальный гид «Красный конь» использует сервис GigaChat для свободного диалога с посетителями выставки Россия на ВДНХ, Prof IT, SberDevices, 04:36, 26.04.2024, Россия415
Виртуальный гид Красный конь, работающий на стенде Ростовской области в рамках выставки Россия, получил возможность говорить уникальным голосом на любые темы в режиме свободного диалога. Это стало возможным благодаря использованию GigaChat API – программного интерфейса доступа к нейросетевой модели GigaChat и платформы речевых сервисов SaluteSpeech от SberDevices.


BIA Technologies показала, как ускорить складские операции до 35% с помощью цифрового двойника, BIA Technologies, 04:35, 26.04.2024, Россия411
Компания представила передовые решения в области имитационного моделирования на выставке Retail TECH 2024, которая проходила с 16 по 18 апреля 2024 года. С помощью демонстрационной модели распределительного центра посетители смогли увидеть, как оптимизировать работу склада и увеличить оборачиваемость товаров.


Оборудование производства АО «ИВК» на 26-й Международной выставке «Экспоэлектроника», ИВК, 04:35, 26.04.2024, Россия414
22 апреля 2024 г., Москва


Компания «Гарант» запустила обновленную программу повышения квалификации по интеллектуальной собственности, Компания "Гарант", 04:35, 26.04.2024, Россия414
Ближайший поток стартует уже 24 мая. Регистрируйтесь, количество мест ограниченно.


«НИИ «АСОНИКА» и АРПП «Отечественный софт» 15 лет, ООО "НИИ"АСОНИКА", 04:32, 26.04.2024, Россия420
Председатель правления АРПП «Отечественный софт» Наталья Касперская поздравила Шалумова А.С. с 15-летием со дня основания ООО «НИИ «АСОНИКА» и вручила Почётную грамоту.


5 июня пройдет Ventra Concept Day — концептуальное событие для топ-менеджеров в HR, HR-холдинг Ventra, 04:31, 26.04.2024, Россия104
HR-холдинг Ventra откроет лето атмосферным событием в центре Москвы для бизнес-лидеров в HR — Ventra Concept Day.


ЕДИНЫЙ ЦУПИС принял участие в платежной конференции Ассоциации банков России, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 04:25, 26.04.2024, Россия90
Ассоциация банков России провела 17 апреля 2024 года XVII Международную конференцию «Платежная индустрия – стратегическое развитие и новые решения». В мероприятии приняли участие топ-менеджеры НКО «Мобильная карта» (работает под брендом «ЕДИНЫЙ ЦУПИС») – Председатель Правления Елена Шейкина и член Правления, Коммерческий директор Артем Сычев.


«1С-Рарус» перевел «Эссити» на импортонезависимый ландшафт без остановки производства, 1С-Рарус, 04:21, 26.04.2024, Россия54
«1С-Рарус» перевел на 1С:ERP торгово-производственную компанию «Эссити». За 9 месяцев в единую экосистему на платформе «1С:Предприятие» интегрированы основные бизнес-процессы предприятия. Выполнено более 1 500 доработок для кастомизации системы. На текущий момент идет финальная стадия опытно-промышленной эксплуатации, «1С‑Рарус» запустил для пользователей ООО «Эссити» выделенную линию консультаций.


Команда Аналитического центра кибербезопасности «Газинформсервиса» предложила новые решения для защиты от кибератак, Газинформсервис, 04:16, 26.04.2024, Россия66
18 апреля команда Аналитического центра кибербезопасности компании «Газинформсервис» приняла участие в мероприятие профессионального сообщества, посвященном развитию ML-систем – митап MLOps и ML-инженеров.


Бесплатный семинар по считыванию физической маркировки с ювелирных изделий, ООО "Компания Инфорсер", 04:19, 26.04.2024, Россия77
26 апреля в 11.30 на встрече в Москве эксперты ГК Инфорсер расскажут про сложности при организации процесса считывания физической маркировки с ювелирных изделий, а также поделятся своими планами и прогнозами в этой сфере.


В LegalTech-сервисе Гарант ЧекДок появились новые функции и возможности, Компания "Гарант", 04:18, 26.04.2024, Россия61
В сервисе произошли масштабные изменения – ЧекДок стал еще умнее, функциональнее и удобнее.


В Адыгее учреждения образования продолжают оснащать новой мебелью, Адыгейское УФАС России, 04:18, 26.04.2024, Россия68
В Адыгею поступит новая школьная мебель


  © 2003-2024 inthepress.ru