Добавить новость
Интернет |

Исследование Axenix: инструменты китайских вендоров для анализа больших данных оказались производительнее решений на базе open source

Исследование Axenix: инструменты китайских вендоров для анализа больших данных оказались производительнее решений на базе open source

В России с 2022 года происходит активная трансформация рынка систем класса DWH (Data Warehouse, системы хранилищ данных). Компании энтерпрайз-сегмента реализуют проекты по миграции своих хранилищ данных на отечественные продукты, однако выбор доступных технологий сильно ограничен. На российском рынке сейчас преобладают решения, построенные на базе open source продуктов. Наиболее распространенные — различные сборки российских вендоров на базе Greenplum и Clickhouse. Также активно развивается архитектура Lakehouse, в основе которой часто лежат такие решения как Impala, Trino, Spark.  

 

Массово-параллельная аналитическая СУБД Greenplum часто используется российскими заказчиками благодаря сравнительно простой архитектуре и тому, что она основана на широко распространённой СУБД PostgreSQL. Это делает её удобной для внедрения и сопровождения. Однако у этой технологии есть серьезные ограничения, которые не позволяют покрыть все требования российских компаний.

 

В этой ситуации компания Axenix решила провести исследование рынка китайского ПО, используемого для создания систем класса DWH и сравнить функциональность и производительность этих продуктов, с продуктами, используемыми на российском рынке.

 

При выборе СУБД и платформ для анализа больших данных российские команды разработчиков часто не имеют возможности оценить реальную производительность решений — тестирование проводится на ограниченном числе задач или в рамках узких кейсов. Поведение системы при масштабировании на реальном проекте нередко становится неожиданностью. В связи с этим команда Axenix провела нагрузочное тестирование функциональности выполнения аналитических запросов. 

 

В тестирование были включены решения китайских вендоров Transwarp и YMatrix, а также наиболее популярные решения на базе open source: Greenplum, Trino и Apache Spark. Продукты китайских вендоров (Transwarp и YMatrix) продемонстрировали более высокую производительность по сравнению с популярными на рынке open source-инструментами.

 

«СУБД и платформы для обработки и аналитики данных — ключевые элементы в нашей практике Applied Intelligence. На их основе создаются корпоративные хранилища данных, их возможности учитываются при создании различных сервисов, которые эти данные используют. Расширенное тестирование решений от китайских вендоров позволило нам определить круг надёжных продуктов, способных не только эффективно обрабатывать десятки и сотни терабайт данных, но и выдерживать высокую конкурентную нагрузку в режиме близком к реальному времени», — прокомментировала Татьяна Кириленко, руководитель направления «Инженерия и архитектура данных» Axenix.

Результаты тестирования показали, что китайские решения превосходят Greenplum по производительности — в большинстве сценариев разница достигает кратных значений.

В ходе тестирования специалисты Axenix пришли к следующим выводам:

Transwarp показал наивысшую производительность, сбалансированную стоимость и возможность сохранения логики приложений при миграции с Oracle и Teradata. Платформа также характеризуется зрелой экосистемой и высоким уровнем стабильности.

YMatrix занял второе место по производительности. Решение развивается как совместимое с Greenplum, но имеет ряд улучшений, включая оптимизацию исполнения запросов и встроенные механизмы интеграции с потоковыми и другими источниками данных.

Greenplum — зрелая и надёжная платформа для построения корпоративных хранилищ данных. Несмотря на богатый функционал, архитектура Greenplum не в полной мере использует потенциал современных аппаратных решений, что может ограничивать её производительность в ряде сценариев. В ходе тестирования она продемонстрировала наименьшую производительность среди всех участников.

Trino — высокопроизводительный SQL-движок, ориентированный на выполнение интерактивных запросов к данным, находящимся в различных хранилищах. Он легко устанавливается, масштабируется и не требует переноса данных — работает «поверх» существующих источников. Trino не является СУБД в классическом смысле и не хранит данные самостоятельно.

Apache Spark — мощная платформа для распределённой обработки больших объёмов данных, включая потоковые и пакетные сценарии. Spark поддерживает SQL через модуль Spark SQL, а также более гибкие модели работы с данными, такие как DataFrame. Несмотря на универсальность, Spark показал меньшую производительность в интерактивных запросах по сравнению с Trino, что объясняется особенностями архитектуры.

Все протестированные решения показали стабильную работу при обработке больших объемов данных и различную степень масштабируемости и эластичности.

«Результаты тестирования продуктов китайских вендоров показали, что они могут превосходить по эффективности популярные open source-решения. Transwarp, YMatrix и Trino продемонстрировали отличное быстродействие и могут быть успешно применены в проектах создания корпоративных хранилищ данных», — отметил Андрей Михайлов, руководитель команды разработки хранилищ данных Axenix.

Для тестирования использовался стандартный бенчмарк TPC-DS (Transaction Processing Performance Council - Decision Support), предназначенный для оценки производительности аналитических СУБД. Он включает разнообразные сценарии и запросы, позволяет генерировать синтетические данные в нужных объёмах и обеспечивает сопоставимость результатов.

Тестирование проводилось на единых ресурсах, развернутых в облаке российского провайдера: использовались виртуальные машины с 16 vCPU, 64 ГБ оперативной памяти и быстрым SSD-хранилищем.

 

О компании Axenix

Российская компания Axenix (ранее Accenture) осуществляет деятельность под юридическим наименованием ООО «АксТим». Axenix предоставляет широкий спектр профессиональных услуг в области цифровых сервисов, облачных технологий и решений для обеспечения информационной безопасности. В офисах и центрах разработки в Москве, Твери, Ростове-на-Дону, Краснодаре, Санкт-Петербурге и Алматы работают около 2 000 сотрудников. Благодаря сочетанию уникальных знаний, опыта и компетенций более чем в 40 отраслях, предлагает услуги в области стратегии и бизнес-консалтинга, технологических решений и других операций, направленных на цифровизацию бизнеса. 

Этот материал опубликован пользователем сайта через форму добавления новостей.
Ответственность за содержание материала несет автор публикации. Точка зрения автора может не совпадать с позицией редакции.
Ria.city

Читайте также

Авто |

BelkaCar открывает доступ молодым водителям

Авто |

BelkaCar открывает доступ молодым водителям

Блоги |

Отделение СФР по Москве и Московской области перечисляет 40 тысячам ветеранам юбилейные выплаты ко Дню Победы

Новости России

Акулова показала видео с жестким обращением панды-мамы Диндин к Катюше

Премьера сериала «Таганрог» в Санкт-Петербурге: более четырёх тысяч зрителей увидели историю подвига донского подполья

16 дополнительных поездов будут следовать из Москвы в Тулу в майские праздничные выходные

Дарующий впечатления: новая награда Angsana Velavaru

Новости от 123ru.net

Авиасообщение приостановили между Россией и Мьянмой из-за землетрясений

Арестована сотрудница Русского дома в Бишкеке: её подозревают в вербовке

ЧЕЧНЯ. Чеченская делегация представляет Грозный на Всероссийском форуме «Малая Родина — сила России»

Административное здание загорелось на юге Москвы

Moscow.media

News24.pro и Life24.pro — таблоиды популярных новостей за 24 часа, сформированных по темам с ежеминутным обновлением. Все самостоятельные публикации на наших ресурсах бесплатны для авторов Ньюс24.про и Ньюс-Лайф.ру.

Разместить свою новость локально в любом городе по любой тематике (и даже, на любом языке мира) можно ежесекундно с мгновенной публикацией самостоятельно — здесь.

Персональные новости

Музыкальные новости
Вольфганг Амадей Моцарт

Уроки под музыку Моцарта: Алсу рассказала о терапии старшей дочери

Авто в России и мире

Под Красноярском на стройке в Емельяново рабочего насмерть задавило стеной

Суд признал Шляфмана виновным: как произошло убийство музыканта Талькова

Арестована сотрудница Русского дома в Бишкеке: её подозревают в вербовке

Отрезали шестой палец российскому подростку

Экология в России и мире

Спорт в России и мире

Новости тенниса
ATP

Андрей Рублёв — лучшая ракетка России: обновлённый рейтинг ATP


Dennis Allen Telegraphed What Bears’ Focus Will Be In Draft

Steven Gerrard spotted at major sporting event as he gives personal update after Al-Ettifaq exit

Geopolitics helps drive Middle Eastern money to Asia as wealthy Gulf investors hedge their bets

Pub landlady gets lifelong restraining order against man in row over smoking