Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 167
Страна: Россия


«ЭлНетМед» расширила возможности сервиса «N3.Health ОДИИ» для автоматизации инструментальной диагностики, ЭлНетМед, 21:35, 03.12.2025, Россия420
Компания «ЭлНетМед», разработчик интеграционной платформы N3.Health, модернизировала сервис «N3.Health Обмен данными инструментальных исследований» (ОДИИ).


«Биржа ATI.SU» обновила сервис оформления претензий на платформе, Биржа грузоперевозок АТИ, 21:35, 03.12.2025, Россия420
«Биржа грузоперевозок ATI.SU» обновила сервис «Претензии». Теперь он представляет собой единый инструмент, работать с которым можно в одном окне. Задача обновления — упростить и ускорить разрешение спорных ситуаций между пользователями платформы.


Minervasoft запустила аудит корпоративных знаний для эффективного внедрения ИИ-агентов, Minervasoft, 21:34, 03.12.2025, Россия420
Компания Minervasoft запустила новую услугу — аудит корпоративных знаний и процессов менеджмента знаний. Диагностика позволит компаниям избежать дорогостоящих ошибок при внедрении ИИ-агентов и сформировать конкретный план действий по исправлению текущих проблем.


ГК «Формула» автоматизировала бизнес-процессы в компании «Техкомгрупп», Группа компаний "Формула", 21:34, 03.12.2025, Россия450
Специалисты группы компаний «Формула» успешно завершили процесс автоматизации ведения учета полного цикла ремонта авиационных колёс и тормозов на предприятии «Техкомгрупп» на базе системы «1С:ERP».


ИИ-поиск «Жижи» вышел в лидеры App Store и RuStore в категории искусственного интеллекта и нейросетей, ЖИЖИ, 21:32, 03.12.2025, Россия421
Российский ИИ-поиск «Жижи» занял первые позиции в App Store и RuStore в категории искусственного интеллекта и нейросетей. По ключевым запросам «ИИ поиск», «ИИ ассистент» и «нейросеть бесплатно» сервис уверенно вышел на первое место, опередив такие решения, как Алиса AI, DeepSeek и Гигачат.


«Телфин» и Whatcrm интегрировали CRM Planfix с Telegram, Телфин, 21:32, 03.12.2025, Россия411
Провайдер коммуникационных сервисов «Телфин» представил новинку в линейке сервисов Whatcrm — интеграцию системы Planfix с Telegram. Связка бизнес-приложений позволяет равномерно распределять нагрузку между сотрудниками и повышает скорость общения с клиентами.


ATLAS и «Береста РК» представляют решение для резервного копирования данных емкостью свыше 5 ПБ, ATLAS, 21:31, 03.12.2025, Россия414
Платформа объединяет гибридную систему хранения ATLAS.SM в смешанной конфигурации (SSD/HDD) и сервер резервного копирования с установленной на нём системой резервного копирования «Береста».


АО «ЦРЭТ» и ООО «ОКСи» объявили об интеграции решений «Фармика» и «1С: Управление аптечной сетью», АО "Центр развития электронных торгов", 21:29, 03.12.2025, Россия252
АО «Центр развития электронных торгов» (оператор специализированной платформы для конкурентных закупок аптечных сетей «Фармика») и ООО «ОКСи» (разработчик системы «1С: Управление аптечной сетью») с радостью сообщают об интеграции цифровых решений.


В Екатеринбурге открылся офис «1С-Рарус», 1С-Рарус, 21:19, 03.12.2025, Россия181
«1С-Рарус» расширяет присутствие в Уральском федеральном округе, открыв офис в Екатеринбурге на базе «ЕРП ЦЕНТР». Это позволит предлагать регионам широкий спектр продуктов и сервисов, а также поддерживать крупные федеральные проекты, реализуемые «ЕРП ЦЕНТР».


НКК выпустила первый релиз системы автоматизированного проектирования композитных изделий САРУС+ Композиты, НКК, 21:19, 03.12.2025, Россия79
«Национальная компьютерная корпорация» (НКК) объявляет о выпуске коммерческой версии ПО САРУС+ Композиты для послойного проектирования и технологической подготовки производства композитных изделий сложных геометрических форм.


Решение по АвтоУСН в банке «Центр-инвест» прошло испытания ФНС России, BSS, 21:08, 02.12.2025, Россия273
Банк «Центр-инвест» успешно прошел испытания ФНС России и готовится к запуску специализированного решения по АвтоУСН от BSS. Клиентам банка станут доступны преимущества и автоматизированной упрощенной системы налогообложения.


«Наносемантика» создала новую систему для голосового управления в робототехнике, Наносемантика, 21:17, 03.12.2025, Россия348
«Наносемантика», ведущий российский разработчик нейросетевых решений, завершила создание универсального программного комплекса, который позволяет управлять роботами с помощью естественной речи без требований к высокой мощности оборудования.


CommuniGate Pro и eXpress подтвердили совместимость решений и укрепили технологическое партнёрство, CommuniGate Pro, 21:13, 02.12.2025, Россия214
Разработчик платформы унифицированных коммуникаций CommuniGate Pro и российский разработчик супераппа для бизнеса eXpress завершили комплексное тестирование и подтвердили корректную совместную работу своих продуктов.


iSpring в топ-3 решений для HRTech и EdTech на российском рынке, iSpring, 21:13, 02.12.2025, Россия214
CNews Analytics опубликовал рейтинги «Крупнейшие игроки рынка HRTech в России 2024» и «Крупнейшие поставщики ИТ-решений для образования 2024». Компания iSpring, разработчик системы для адаптации, обучения и развития сотрудников, вошла в тройку лидеров обоих исследований.


SIMETRA разработает цифровой двойник транспортной системы Ленинградской области, Simetra, 21:10, 02.12.2025, Россия215
Группа компаний SIMETRA приступила к созданию цифрового двойника дорожно-транспортной инфраструктуры Ленинградской области. В рамках проекта SIMETRA также актуализирует транспортную макромодель региона, которая будет выполнена на базе платформы RITM³


  © 2003-2025 inthepress.ru