Исследование Axenix: инструменты китайских вендоров для анализа больших данных оказались производительнее решений на базе open source
В России с 2022 года происходит активная трансформация рынка систем класса DWH (Data Warehouse, системы хранилищ данных). Компании энтерпрайз-сегмента реализуют проекты по миграции своих хранилищ данных на отечественные продукты, однако выбор доступных технологий сильно ограничен. На российском рынке сейчас преобладают решения, построенные на базе open source продуктов. Наиболее распространенные — различные сборки российских вендоров на базе Greenplum и Clickhouse. Также активно развивается архитектура Lakehouse, в основе которой часто лежат такие решения как Impala, Trino, Spark.
Массово-параллельная аналитическая СУБД Greenplum часто используется российскими заказчиками благодаря сравнительно простой архитектуре и тому, что она основана на широко распространённой СУБД PostgreSQL. Это делает её удобной для внедрения и сопровождения. Однако у этой технологии есть серьезные ограничения, которые не позволяют покрыть все требования российских компаний.
В этой ситуации компания Axenix решила провести исследование рынка китайского ПО, используемого для создания систем класса DWH и сравнить функциональность и производительность этих продуктов, с продуктами, используемыми на российском рынке.
При выборе СУБД и платформ для анализа больших данных российские команды разработчиков часто не имеют возможности оценить реальную производительность решений — тестирование проводится на ограниченном числе задач или в рамках узких кейсов. Поведение системы при масштабировании на реальном проекте нередко становится неожиданностью. В связи с этим команда Axenix провела нагрузочное тестирование функциональности выполнения аналитических запросов.
В тестирование были включены решения китайских вендоров Transwarp и YMatrix, а также наиболее популярные решения на базе open source: Greenplum, Trino и Apache Spark. Продукты китайских вендоров (Transwarp и YMatrix) продемонстрировали более высокую производительность по сравнению с популярными на рынке open source-инструментами.
«СУБД и платформы для обработки и аналитики данных — ключевые элементы в нашей практике Applied Intelligence. На их основе создаются корпоративные хранилища данных, их возможности учитываются при создании различных сервисов, которые эти данные используют. Расширенное тестирование решений от китайских вендоров позволило нам определить круг надёжных продуктов, способных не только эффективно обрабатывать десятки и сотни терабайт данных, но и выдерживать высокую конкурентную нагрузку в режиме близком к реальному времени», — прокомментировала Татьяна Кириленко, руководитель направления «Инженерия и архитектура данных» Axenix.
Результаты тестирования показали, что китайские решения превосходят Greenplum по производительности — в большинстве сценариев разница достигает кратных значений.
В ходе тестирования специалисты Axenix пришли к следующим выводам:
● Transwarp показал наивысшую производительность, сбалансированную стоимость и возможность сохранения логики приложений при миграции с Oracle и Teradata. Платформа также характеризуется зрелой экосистемой и высоким уровнем стабильности.
● YMatrix занял второе место по производительности. Решение развивается как совместимое с Greenplum, но имеет ряд улучшений, включая оптимизацию исполнения запросов и встроенные механизмы интеграции с потоковыми и другими источниками данных.
● Greenplum — зрелая и надёжная платформа для построения корпоративных хранилищ данных. Несмотря на богатый функционал, архитектура Greenplum не в полной мере использует потенциал современных аппаратных решений, что может ограничивать её производительность в ряде сценариев. В ходе тестирования она продемонстрировала наименьшую производительность среди всех участников.
● Trino — высокопроизводительный SQL-движок, ориентированный на выполнение интерактивных запросов к данным, находящимся в различных хранилищах. Он легко устанавливается, масштабируется и не требует переноса данных — работает «поверх» существующих источников. Trino не является СУБД в классическом смысле и не хранит данные самостоятельно.
● Apache Spark — мощная платформа для распределённой обработки больших объёмов данных, включая потоковые и пакетные сценарии. Spark поддерживает SQL через модуль Spark SQL, а также более гибкие модели работы с данными, такие как DataFrame. Несмотря на универсальность, Spark показал меньшую производительность в интерактивных запросах по сравнению с Trino, что объясняется особенностями архитектуры.
Все протестированные решения показали стабильную работу при обработке больших объемов данных и различную степень масштабируемости и эластичности.
«Результаты тестирования продуктов китайских вендоров показали, что они могут превосходить по эффективности популярные open source-решения. Transwarp, YMatrix и Trino продемонстрировали отличное быстродействие и могут быть успешно применены в проектах создания корпоративных хранилищ данных», — отметил Андрей Михайлов, руководитель команды разработки хранилищ данных Axenix.
Для тестирования использовался стандартный бенчмарк TPC-DS (Transaction Processing Performance Council - Decision Support), предназначенный для оценки производительности аналитических СУБД. Он включает разнообразные сценарии и запросы, позволяет генерировать синтетические данные в нужных объёмах и обеспечивает сопоставимость результатов.
Тестирование проводилось на единых ресурсах, развернутых в облаке российского провайдера: использовались виртуальные машины с 16 vCPU, 64 ГБ оперативной памяти и быстрым SSD-хранилищем.
О компании Axenix Российская компания Axenix (ранее Accenture) осуществляет деятельность под юридическим наименованием ООО «АксТим». Axenix предоставляет широкий спектр профессиональных услуг в области цифровых сервисов, облачных технологий и решений для обеспечения информационной безопасности. В офисах и центрах разработки в Москве, Твери, Ростове-на-Дону, Краснодаре, Санкт-Петербурге и Алматы работают около 2 000 сотрудников. Благодаря сочетанию уникальных знаний, опыта и компетенций более чем в 40 отраслях, предлагает услуги в области стратегии и бизнес-консалтинга, технологических решений и других операций, направленных на цифровизацию бизнеса.
Контактное лицо: Татьяна Алексеева
Компания: Axenix
Добавлен: 13:17, 16.04.2025
Количество просмотров: 371
Страна: Россия
Перечень типовых отраслевых объектов критической информационной инфраструктуры (КИИ), утвержденный в феврале 2026 года распоряжением Правительства РФ № 360-р, сделал подход к защите КИИ более жестким. Теперь игнорирование документа грозит не только высокими штрафами, но и остановкой бизнеса.
К сезону повышенных майских расходов «Выберу.ру» составил рейтинг банков с наиболее выгодными людям дебетовыми картами благодаря максимальному кешбэку в категории «на все покупки». Топ-подборка поможет найти универсальный карточный продукт, который позволит россиянам немного сэкономить в условиях растущих цен за счёт возврата бонусов.
«Аксиома-Софт» автоматизировала учет ювелирных изделий в Торговом доме «Культура Дома» с помощью модуля «АКСИОМА: Интеграция с ГИИС ДМДК». Решение упростило работу по нескольким юридическим лицам: автоматическое создание номенклатуры, договоров, спецификаций. Исключено дублирование операций, ускорена передача данных в ГИИС ДМДК. Оптимизирован учет поступлений, оптовых и розничных продаж для 10 пользователей.
В 2026 году российский фармацевтический рынок входит в фазу, где ключевая конкуренция за пациента разворачивается в digital-среде задолго до визита в аптеку.
Решения «Гармония», разработчик российского self-service решения для управления мастер-данными, и компания Юникон Бизнес Солюшнс, специализирующаяся на управленческом и ИТ-консалтинге, заключили стратегическое партнерство.
В Москве состоялась X юбилейная конференция «Практики цифровизации: применение методик повышения эффективности производства», организованная Группой компаний OMEGALLIANCE FabricaONE.AI. Директор департамента производственного консалтинга Группы «Борлас» (ГК Softline) рассказал на мероприятии о комплексном подходе к управлению жизненным циклом изделия в тесной интеграции с ключевыми производственными системами.
«Астра Мониторинг» 1.4 позволяет заменить набор разрозненных инструментов единым отечественным продуктом корпоративного класса, обеспечивающим полную наблюдаемость ИТ-инфраструктуры: от метрик и логов до трейсов и управления инцидентами.
Сервис для анализа присутствия брендов в AI-поиске «Киберкошка» расширил функциональность: помимо мониторинга AI-видимости брендов, платформа начала анализировать, как мобильные приложения представлены в ответах нейросетей. Это первый на рынке инструмент, который позволяет оценить их роль в формировании пользовательских рекомендаций.
Алексей Колодка, директор по работе с государственными заказчиками компании «ГИГАНТ - Компьютерные системы» рассказал о главных изменениях в аттестации ГИС и объектов КИИ в 2026 году, об особенностях для систем на open source, а также затронул неочевидные риски.