Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 129
Страна: Россия


Дизайн и нейронные сети в топе: в «Технограде» назвали самые востребованные курсы в первом квартале, АНО "Развитие человеческого капитала", 14:20, 21.04.2025, Россия66
Столичный инновационно-образовательный комплекс «Техноград» продолжает активно откликаться на запросы рынка труда.


Игровые Обновления 2025 от Another World, Another World, 13:26, 21.04.2025, Россия72
Another World, разработчик VR игр и основатель франшизной сети VR арен, пре-анонсировал о предстоящих продуктовых релизах и апгрейдах 2025 года.


Карельский предприниматель стал первым ИП в Республике, попавшим в Реестр российского программного обеспечения Минцифры, Карельский разработчик, 13:16, 21.04.2025, Россия74
Карельский предприниматель Шестаков Андрей Русланович из Петрозаводска стал первым индивидуальным предпринимателем, попавшим в Реестр российского программного обеспечения Министерства цифрового развития Российской Федерации в Республике Карелия с собственной разработкой.


Мероприятия, приуроченные к 82-летию Главного управления контрразведки «Смерш» прошли на Урале, Уральский округ Росгвардии, 19:19, 18.04.2025, Россия254
В преддверии 82-й годовщины со дня образования Главного управления контрразведки «Смерш» НКО СССР, проведены показные занятия для подшефных школьников.


Копить — не надо: «Выберу.ру» составил рейтинг лучших автокредитов без первого взноса в апреле 2025 года, Финансовый маркетплейс «Выберу.ру», 19:26, 18.04.2025, Россия318
«Выберу.ру подготовил рейтинг банков с самыми выгодными потребителям условиями автокредитов без обязательного первого взноса при покупке любых машин — с пробегом или новых.


Весна в Желдорреммаше – время встречи гостей, https://ao-zdrm.ru/, 19:26, 18.04.2025, Россия307
На заводах АО «Желдорреммаш» стартовал весенний этап профориентационной «Недели без турникетов». Производственные площадки компании посетит несколько тысяч человек. Масштабная всероссийская акция, проводимая под эгидой Союза машиностроителей России, продлится до конца апреля


Corpsoft24 автоматизировала непрерывное химическое производство одного из крупнейших мировых производителей - ГК «ГалоПолимер», CorpSoft24, 19:23, 18.04.2025, Россия300
Компания CorpSoft24 завершила проект по внедрению информационной системы управления финансово-хозяйственной деятельностью производителя химической продукции ГК «ГалоПолимер» на базе «1С:ERP. Управление холдингом».


«Кит-системс» расширяет сотрудничество с QTECH, Кит-систепмс, 19:21, 18.04.2025, Россия302
Системный интегратор «Кит-системс» подтвердил партнерскую авторизацию российского производителя телекоммуникационного и серверного оборудования – компании QTECH на 2025 год.


Компания «Гарант» выпустила сервис на основе искусственного интеллекта, Компания "Гарант", 19:06, 18.04.2025, Россия58
ИИ-сервис «Искра» от компании «Гарант» ответит на правовой вопрос или подготовит шаблон документа.


Ресторан‑бар «Оптимист» запускает акцию «Счастливые часы»: 50 % скидка на все вина по будням, Ресторан-бар "Оптимист", 19:05, 18.04.2025, Россия59
Екатеринбург, пр. Ленина 50 «Б» – Ежедневно с 15:00 до 18:00 ресторан‑бар «Оптимист» приглашает гостей насладиться эксклюзивным предложением: полная скидка 50 % на все позиции винной карты основного меню – тихие и игристые вина (кроме шампанского).


Start Link оптимизировал процесс подбора сотрудников в Московской пивоваренной компании, HRlink, 19:05, 18.04.2025, Россия85
Московская Пивоваренная Компания (МПК) в несколько раз сократила временные и трудозатраты в процессе найма новых сотрудников с помощью модуля для удаленного приема на работу Start Link (входит в экосистему кадрового ЭДО HRlink).


Tom Tailor улучшил бизнес-показатели с помощью платформы iSpring Learn, iSpring, 19:04, 18.04.2025, Россия69
Компания Tom Tailor построила систему дистанционного обучения сотрудников с помощью LMS платформы iSpring Learn, что позволило ускорить адаптацию новичков, повысить их продуктивность с первых дней работы и влиять на товарооборот


Обновлена платформа мониторинга данных Smart Monitor, VolgaBlob, 19:04, 18.04.2025, Россия69
На конференции VB-Trend 2025 компания VolgaBlob представила новую версию своего флагманского продукта Smart Monitor. В релизе 5.0 усовершенствована технология поиска Search Anywhere, появился инструмент для заметок Smart Notebooks


Новый импульс развития аддитивных технологий для российских промышленных предприятий, Группа "Борлас", 19:04, 18.04.2025, Россия59
Санкт-Петербургский политехнический университет Петра Великого и Группа «Борлас» (входит в ГК Softlinе) подписали соглашение о стратегическом партнёрстве с целью обучения студентов и специалистов промышленных предприятий технологическим инновациям, а также для создания инженерно-производственных центров аддитивных лазерных технологий совместно с ведущими российскими промышленными предприятиями.


«ОПАСНАЯ БЛИЗОСТЬ»: СЕРИАЛ О СИЛЬНЫХ ЧУВСТВАХ НА ЭКРАНАХ ТЕЛЕВИЗОРОВ LG OLED evo, LG Electronics, 19:04, 18.04.2025, Россия71
Новый остросюжетный сериал «Опасная близость» (18+)1 от онлайн-кинотеатра START рассказывает историю Анны — успешного пластического


  © 2003-2025 inthepress.ru