Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева
Компания: IT_One
Добавлен: 22:30, 06.12.2023 Количество просмотров: 133
Страна: Россия


ИИ в управлении B2B-продажами: бизнес ускоряет сделки и снижает риски, Инфомаксимум, 09:21, 11.05.2025, Россия166
Согласно аналитическому исследованию компании «Инфомаксимум» внедрение ИИ позволяет сократить среднюю длительность сделки и увеличить конверсию продаж на 12%.


DатаРу развернула современную систему серверной виртуализации в Клинике академика Ройтберга, ДатаРу, 09:12, 11.05.2025, Россия169
Отечественный разработчик технологических решений и сервисов DатаРу успешно реализовала проект модернизации ИТ-инфраструктуры клиники академика Ройтберга (АО «Медицина»). В клинике развернута система серверной виртуализации на базе оборудования собственной разработки вендора и программного обеспечения Orion soft.


«Наносемантика» провела состязание между популярными LLM на лучшее стихотворение о ВОВ, Наносемантика, 08:29, 11.05.2025, Россия188
Разработчик нейросетевых решений «Наносемантика» определила победителя среди больших языковых моделей (LLM) в состязании на лучшее стихотворение о Великой Отечественной войне на русском языке.


80-лет Великой Победы: праздничный эфир телеканала «78», телеканал "78" (Петербург), 17:28, 06.05.2025, Россия431
9 мая петербуржцы увидят трансляцию Парада Победы на Дворцовой площади, прямые включения с маршрута «Бессмертного полка», проезд ретро-техники по Невскому проспекту, а также премьеры авторских документальных фильмов, созданных ведущими телеканала «78». Вечером в специальном проекте «Песни Победы» знаменитые композиции исполнят артисты петербургской сцены и военные оркестры.


Спрос на командировки в Европу вырос на 20%, Цифровая платформа для организации командировок и управления расходами Ракета, 17:26, 06.05.2025, Россия434
В апреле 2025 года российские деловые туристы на 20% чаще ездили в бизнес-путешествия в Европу. Такие данные приводят эксперты цифровой платформы для организации командировок и управления расходами Ракета, сравнивая показатели с апрелем прошлого года.


«1С-Рарус» перестроил регламентированный учет для 350+ юридических лиц ГК «Самолет», 1С-Рарус, 17:25, 06.05.2025, Россия450
«1С-Рарус» завершил проект финансовой трансформации бизнеса ГК «Самолет», лидера в сфере строительства и девелопмента. На базе «1С:Бухгалтерия КОРП» создана система управления международного класса для принятия решений на основе данных. Автоматизированы важные финансовые процессы для 351 юридического лица.


НА СТРАЖЕ СЕМЕЙНЫХ ЦЕННОСТЕЙ: НОВЫЙ СЕЗОН «ОПАСНЫХ СВЯЗЕЙ» НА «ЧЕ!», Телеканал «ЧЕ!», 17:25, 06.05.2025, Россия444
12 мая в 23:00 на телеканале «ЧЕ!» стартует новый сезон провокационного реалити-разоблачения «Опасные связи», где ведущие Дмитрий Рыбин и Дмитрий Гухман расследуют супружеские измены и помогают героям разобраться в семейных ценностях.


Желдорреммаш внедряет терминалы сбора данных, https://ao-zdrm.ru/, 17:25, 06.05.2025, Россия440
В рамках программы цифровой трансформации и модернизации логистических процессов АО «Желдорреммаш» реализует проект внедрения терминалов сбора данных (ТСД) на заводских складах.


Мобильная связь «Телфин» в 3 раза сокращает число пропущенных звонков, Телфин, 17:23, 06.05.2025, Россия113
Провайдер коммуникационных решений «Телфин» подключил сотрудников АО «АРТСИ ВОСТОК» к единой корпоративной коммуникационной платформе, разработанной на базе виртуальной АТС «Телфин.Офис» и мобильной связи «Телфин».


«DатаРу Облако» реализовала миграцию сервисов для крупнейшего FMCG-дистрибьютора на Дальнем Востоке, ДатаРу, 17:23, 06.05.2025, Россия67
Компания «Эником Невада групп» — ведущий дистрибьютор продуктов питания на Дальнем Востоке — успешно завершила миграцию своих ИТ-сервисов на облачную платформу «DатаРу Облако».


ИИ помогает врачам: как цифровые ассистенты меняют медицину, ИТ-холдинг Т1, 16:50, 06.05.2025, Россия83
Карта пациента за 30 секунд — ИИ уменьшает нагрузку на врачей, снижает количество ошибок при заполнении документации и контролирует ее соответствие нормативным требованиям.


Сила в объединении: Фонд «Экология» РСХБ подвёл итоги всероссийской акции — детские сады и школы собрали более 20 тонн макулатуры, Новосибирский РФ АО "Россельхозбанк", 16:50, 06.05.2025, Россия76
Завершилась акция «Посадим лес вместе», организованная Фондом «Экология» РСХБ и АНО «Убиратор Просвещение». В рамках инициативы 29 детских садов и школ собрали 20,5 тонны макулатуры, продемонстрировав высокий уровень экологической осознанности и стремление внести реальный вклад в сохранение окружающей среды.


«1С-Рарус» выступил партнером секции «Искусственный интеллект» на Russian Retail Show 2025, 1С-Рарус, 16:50, 06.05.2025, Россия90
«1С-Рарус» представил решения и услуги для торговых розничных сетей на форуме Russian Retail Show. Компания стала партнером секции по искусственному интеллекту, где поделилась, как ИИ помогает в бизнесе, и показала новые разработки на базе 1С


LG И MEDIATEK ПРЕДСТАВЛЯЮТ РЕШЕНИЕ ДЛЯ МОБИЛЬНОСТИ НА ВЫСТАВКЕ AUTO SHANGHAI 2025, LG Electronics, 16:49, 06.05.2025, Россия81
LG Electronics (LG), лидер в области технологий в секторе мобильности, и MediaTek, глобальная компания по производству полупроводников, представляют платформу Concurrent Multi-User (CMU) на базе Android, применяемую к системам In-Vehicle Infotainment (IVI)


DPD в России стала лауреатом CX WORLD AWARDS, DPD, 16:49, 06.05.2025, Россия80
Компания DPD в России, ведущий логистический оператор, удостоилась высокой оценки жюри награды СХ WORLD AWARDS


  © 2003-2025 inthepress.ru