Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 109
Страна: Россия


Будущие ИБ-специалисты прошли мастер-классы по кибербезопасности в «Газинформсервисе», ООО "Газинформсервис", 04:40, 18.12.2024, Россия86
В пятницу, 13 декабря, прошло занятие образовательного проекта Security Skills от компании «Газинформсервис». Никакие суеверия не страшны тем, кто готов противостоять реальным киберугрозам со студенческой скамьи: на мероприятии собрались десятки студентов из ведущих вузов Санкт-Петербурга: ИТМО, СПбГУТ, СПбПУ, СПбГМТУ, ПГУПС и других.


LG ПРЕДСТАВИТ РЕШЕНИЕ НА БАЗЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ САЛОНА АВТОМОБИЛЯ НА ВЫСТАВКЕ CES 2025, LG Electronics, 04:37, 18.12.2024, Россия81
LG Electronics (LG), лидер в области технологий в секторе мобильности, собирается продемонстрировать инновацию под названием «AI In-Vehicle Experience» от LG на выставке CES 2025.


RTBSape презентовала новые возможности для аналитики и оптимизации рекламных кампаний для self-service., RTBSape, 04:36, 18.12.2024, Россия83
В рамках обновления интерфейса RTBSape реализовали улучшенную систему отчетности, предоставляющую больше возможностей для анализа и оптимизации рекламных кампаний


mClouds представил новую облачную GPU-платформу для работы с AI, BIM и CAD на базе высокочастотных процессоров AMD EPYC и видеокарт NVIDIA, mClouds, 04:32, 18.12.2024, Россия46
mClouds запустил новую GPU-платформу на базе AMD EPYC 9374F и видеокарт NVIDIA L4, L40S и A16.платформу для высоконагруженных задач, таких как машинное обучение, анализ данных, проектирование и 3D-рендеринг.


Общими усилиями к устойчивому будущему ИБ: сотрудничество «Газинформсервиса» и Positive Technologies в 2024 году, ООО "Газинформсервис", 04:31, 18.12.2024, Россия44
Компании «Газинформсервис» и Positive Technologies продолжают стратегическое партнёрство, сосредоточенное на подготовке квалифицированных кадров и обмене передовым опытом в области кибербезопасности.


DION занял второе место в рейтинге лучших ВКС-платформ, ИТ-холдинг Т1, 04:30, 18.12.2024, Россия55
Платформа корпоративных коммуникаций DION (ИТ-холдинг Т1) заняла второе место в рейтинге российских ВКС-решений, опубликованном ИТ-маркетплейсом Market.CNews. Рейтинг был сформирован на основе балльной системы оценки по ряду критериев. К ним относятся функциональные возможности, максимальное число участников видеоконференции и аудиозвонка, продолжительность тестового периода, общее количество пользователей и стоимость лицензии на решение.


Сбер обучил МГСУ работе с искусственным интеллектом, C3 Solutions, 04:29, 18.12.2024, Россия44
«Школа 21» обучила сотрудников МГСУ работе с ИИ


SIMETRA разработала проект планировочных решений на ключевой развязке для Чебоксарской агломерации, Simetra, 04:27, 18.12.2024, Россия37
Центр компетенций в области транспортного планирования и моделирования, группа компаний SIMETRA, защитила разработанный проект по выбору оптимального планировочного решения для строительства одного из ключевых транспортных узлов Чебоксарской агломерации


«1С-Рарус:Финансовый менеджмент 3.0» прошел ресертификацию «1С:Совместимо», 1С‑Рарус, 04:27, 18.12.2024, Россия37
«1С-Рарус:Финансовый менеджмент» редакции 3.0 получил очередной сертификат «Совместимо! Система программ 1С:Предприятие». Дополнение прошло тестирование фирмы «1С» на соответствие требованиям разработки совместных решений.


Студенты факультета международных экономических отношений Финансового университета провели фиджитал-чемпионат, Финансовый университет, 04:27, 18.12.2024, Россия45
Первый фиджитал-чемпионат прошел на базе Финансового университета.


На участке федеральной трассы Р-21 «Кола» ускорили интернет, МегаФон, 04:26, 18.12.2024, Россия48
МегаФон увеличил зону покрытия и улучшил скорость мобильного интернета на 20% для абонентов на участке федеральной трассы Р-21 «Кола» под Мурманском.


ЕДИНЫЙ ЦУПИС обсудил в Ассоциации банков России перспективы внедрения Open API, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 04:22, 18.12.2024, Россия51
Председатель комитета АБР по финансовым технологиям, Председатель Правления ЕДИНОГО ЦУПИС Елена Шейкина 11 декабря провела заседание комитета АБР по финансовым технологиям. Участники встречи обсудили вопросы внедрения открытых API в банковском секторе, методические рекомендации по управлению данными участников финансового рынка, стандарты информационной безопасности и создание универсального решения для небольших банков.


Выполнен проект по тиражированию EMAS. OPT, Акционерное общество "Национальное бюро информатизации", 04:19, 18.12.2024, Россия68
Компанией АО «НБИ» для энергетической компании выполнен проект по тиражированию EMAS.OPT.


«1С-Рарус» получил сертификат «Совместимо» для решения «1С:Турагентство», 1С‑Рарус, 03:57, 18.12.2024, Россия52
«1С:Предприятие 8. Турагентство» редакции 3.0 успешно прошло очередную сертификацию на получение статуса «Совместимо! Система программ 1С:Предприятие». Функционал отраслевого решения постоянно развивается и соответствует требованиям фирмы «1С», предъявляемым к продуктам совместной разработки.


Цифровое управление строительством с помощью Directum Lite: опыт «РКС Девелопмент», Directum, 03:49, 18.12.2024, Россия54
С помощью Directum Lite в строительной организации ведут одновременно десятки объектов, координируют работу подрядчиков, обрабатывают сотни документов. А руководители компании оперативно выявляют проблемы за счет возможностей решения «Проекты», которое помогает планировать и управлять процессами строительства.


  © 2003-2024 inthepress.ru