Добавить новость
Январь 2010 Февраль 2010 Март 2010 Апрель 2010 Май 2010
Июнь 2010
Июль 2010 Август 2010 Сентябрь 2010
Октябрь 2010
Ноябрь 2010 Декабрь 2010 Январь 2011 Февраль 2011 Март 2011 Апрель 2011 Май 2011 Июнь 2011 Июль 2011 Август 2011 Сентябрь 2011 Октябрь 2011 Ноябрь 2011 Декабрь 2011 Январь 2012 Февраль 2012 Март 2012 Апрель 2012 Май 2012 Июнь 2012 Июль 2012 Август 2012 Сентябрь 2012 Октябрь 2012 Ноябрь 2012 Декабрь 2012 Январь 2013 Февраль 2013 Март 2013 Апрель 2013 Май 2013 Июнь 2013 Июль 2013 Август 2013 Сентябрь 2013 Октябрь 2013 Ноябрь 2013 Декабрь 2013 Январь 2014 Февраль 2014 Март 2014 Апрель 2014 Май 2014 Июнь 2014 Июль 2014 Август 2014 Сентябрь 2014 Октябрь 2014 Ноябрь 2014 Декабрь 2014 Январь 2015 Февраль 2015 Март 2015 Апрель 2015 Май 2015 Июнь 2015 Июль 2015 Август 2015 Сентябрь 2015 Октябрь 2015 Ноябрь 2015 Декабрь 2015 Январь 2016 Февраль 2016 Март 2016 Апрель 2016 Май 2016 Июнь 2016 Июль 2016 Август 2016 Сентябрь 2016 Октябрь 2016 Ноябрь 2016 Декабрь 2016 Январь 2017 Февраль 2017 Март 2017 Апрель 2017
Май 2017
Июнь 2017
Июль 2017
Август 2017 Сентябрь 2017 Октябрь 2017 Ноябрь 2017 Декабрь 2017 Январь 2018 Февраль 2018 Март 2018 Апрель 2018 Май 2018 Июнь 2018 Июль 2018 Август 2018 Сентябрь 2018 Октябрь 2018 Ноябрь 2018 Декабрь 2018 Январь 2019 Февраль 2019 Март 2019 Апрель 2019 Май 2019 Июнь 2019 Июль 2019 Август 2019 Сентябрь 2019 Октябрь 2019 Ноябрь 2019 Декабрь 2019 Январь 2020 Февраль 2020 Март 2020 Апрель 2020 Май 2020 Июнь 2020 Июль 2020 Август 2020 Сентябрь 2020 Октябрь 2020 Ноябрь 2020 Декабрь 2020 Январь 2021 Февраль 2021 Март 2021 Апрель 2021 Май 2021 Июнь 2021 Июль 2021 Август 2021 Сентябрь 2021 Октябрь 2021 Ноябрь 2021 Декабрь 2021 Январь 2022 Февраль 2022 Март 2022 Апрель 2022 Май 2022 Июнь 2022 Июль 2022 Август 2022 Сентябрь 2022 Октябрь 2022 Ноябрь 2022 Декабрь 2022 Январь 2023 Февраль 2023 Март 2023 Апрель 2023 Май 2023 Июнь 2023 Июль 2023 Август 2023 Сентябрь 2023 Октябрь 2023 Ноябрь 2023 Декабрь 2023 Январь 2024 Февраль 2024 Март 2024 Апрель 2024 Май 2024 Июнь 2024 Июль 2024 Август 2024 Сентябрь 2024 Октябрь 2024 Ноябрь 2024 Декабрь 2024 Январь 2025 Февраль 2025 Март 2025 Апрель 2025
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
20
21
22
23
24
25
26
27
28
29
30
Интернет |

Исследование Axenix: инструменты китайских вендоров для анализа больших данных оказались производительнее решений на базе open source

Исследование Axenix: инструменты китайских вендоров для анализа больших данных оказались производительнее решений на базе open source

В России с 2022 года происходит активная трансформация рынка систем класса DWH (Data Warehouse, системы хранилищ данных). Компании энтерпрайз-сегмента реализуют проекты по миграции своих хранилищ данных на отечественные продукты, однако выбор доступных технологий сильно ограничен. На российском рынке сейчас преобладают решения, построенные на базе open source продуктов. Наиболее распространенные — различные сборки российских вендоров на базе Greenplum и Clickhouse. Также активно развивается архитектура Lakehouse, в основе которой часто лежат такие решения как Impala, Trino, Spark.  

 

Массово-параллельная аналитическая СУБД Greenplum часто используется российскими заказчиками благодаря сравнительно простой архитектуре и тому, что она основана на широко распространённой СУБД PostgreSQL. Это делает её удобной для внедрения и сопровождения. Однако у этой технологии есть серьезные ограничения, которые не позволяют покрыть все требования российских компаний.

 

В этой ситуации компания Axenix решила провести исследование рынка китайского ПО, используемого для создания систем класса DWH и сравнить функциональность и производительность этих продуктов, с продуктами, используемыми на российском рынке.

 

При выборе СУБД и платформ для анализа больших данных российские команды разработчиков часто не имеют возможности оценить реальную производительность решений — тестирование проводится на ограниченном числе задач или в рамках узких кейсов. Поведение системы при масштабировании на реальном проекте нередко становится неожиданностью. В связи с этим команда Axenix провела нагрузочное тестирование функциональности выполнения аналитических запросов. 

 

В тестирование были включены решения китайских вендоров Transwarp и YMatrix, а также наиболее популярные решения на базе open source: Greenplum, Trino и Apache Spark. Продукты китайских вендоров (Transwarp и YMatrix) продемонстрировали более высокую производительность по сравнению с популярными на рынке open source-инструментами.

 

«СУБД и платформы для обработки и аналитики данных — ключевые элементы в нашей практике Applied Intelligence. На их основе создаются корпоративные хранилища данных, их возможности учитываются при создании различных сервисов, которые эти данные используют. Расширенное тестирование решений от китайских вендоров позволило нам определить круг надёжных продуктов, способных не только эффективно обрабатывать десятки и сотни терабайт данных, но и выдерживать высокую конкурентную нагрузку в режиме близком к реальному времени», — прокомментировала Татьяна Кириленко, руководитель направления «Инженерия и архитектура данных» Axenix.

Результаты тестирования показали, что китайские решения превосходят Greenplum по производительности — в большинстве сценариев разница достигает кратных значений.

В ходе тестирования специалисты Axenix пришли к следующим выводам:

Transwarp показал наивысшую производительность, сбалансированную стоимость и возможность сохранения логики приложений при миграции с Oracle и Teradata. Платформа также характеризуется зрелой экосистемой и высоким уровнем стабильности.

YMatrix занял второе место по производительности. Решение развивается как совместимое с Greenplum, но имеет ряд улучшений, включая оптимизацию исполнения запросов и встроенные механизмы интеграции с потоковыми и другими источниками данных.

Greenplum — зрелая и надёжная платформа для построения корпоративных хранилищ данных. Несмотря на богатый функционал, архитектура Greenplum не в полной мере использует потенциал современных аппаратных решений, что может ограничивать её производительность в ряде сценариев. В ходе тестирования она продемонстрировала наименьшую производительность среди всех участников.

Trino — высокопроизводительный SQL-движок, ориентированный на выполнение интерактивных запросов к данным, находящимся в различных хранилищах. Он легко устанавливается, масштабируется и не требует переноса данных — работает «поверх» существующих источников. Trino не является СУБД в классическом смысле и не хранит данные самостоятельно.

Apache Spark — мощная платформа для распределённой обработки больших объёмов данных, включая потоковые и пакетные сценарии. Spark поддерживает SQL через модуль Spark SQL, а также более гибкие модели работы с данными, такие как DataFrame. Несмотря на универсальность, Spark показал меньшую производительность в интерактивных запросах по сравнению с Trino, что объясняется особенностями архитектуры.

Все протестированные решения показали стабильную работу при обработке больших объемов данных и различную степень масштабируемости и эластичности.

«Результаты тестирования продуктов китайских вендоров показали, что они могут превосходить по эффективности популярные open source-решения. Transwarp, YMatrix и Trino продемонстрировали отличное быстродействие и могут быть успешно применены в проектах создания корпоративных хранилищ данных», — отметил Андрей Михайлов, руководитель команды разработки хранилищ данных Axenix.

Для тестирования использовался стандартный бенчмарк TPC-DS (Transaction Processing Performance Council - Decision Support), предназначенный для оценки производительности аналитических СУБД. Он включает разнообразные сценарии и запросы, позволяет генерировать синтетические данные в нужных объёмах и обеспечивает сопоставимость результатов.

Тестирование проводилось на единых ресурсах, развернутых в облаке российского провайдера: использовались виртуальные машины с 16 vCPU, 64 ГБ оперативной памяти и быстрым SSD-хранилищем.

 

О компании Axenix

Российская компания Axenix (ранее Accenture) осуществляет деятельность под юридическим наименованием ООО «АксТим». Axenix предоставляет широкий спектр профессиональных услуг в области цифровых сервисов, облачных технологий и решений для обеспечения информационной безопасности. В офисах и центрах разработки в Москве, Твери, Ростове-на-Дону, Краснодаре, Санкт-Петербурге и Алматы работают около 2 000 сотрудников. Благодаря сочетанию уникальных знаний, опыта и компетенций более чем в 40 отраслях, предлагает услуги в области стратегии и бизнес-консалтинга, технологических решений и других операций, направленных на цифровизацию бизнеса. 

Этот материал опубликован пользователем сайта через форму добавления новостей.
Ответственность за содержание материала несет автор публикации. Точка зрения автора может не совпадать с позицией редакции.
Ria.city

Читайте также

Блоги |

Фотографии зарянки и других птиц «Михайловского» стали приглашением, от которого невозможно отказаться

Блоги |

Пенсионера в спортивной куртке продолжают разыскивать в Пскове

Блоги |

Международная конференция прошла в Псковском филиале Университета ФСИН

Новости России

Россия обладает потенциалом для войны с США, заявил экс-советник Пентагона

Проверка безопасности за пределами стандартов! Аккумуляторная система Shendun защищает Geely Galaxy E5 при фронтальном ударе о столб на скорости 50 км/ч

Губернатор встретился с зампредом правительства России

"Салават Юлаев" обыграл "Спартак" в овертайме и сократил отставание в серии

Микс новостей часа

Илона Гуськова: топ-5 уловок работодателей при увольнении и как на них реагировать

Весна в Желдорреммаше – время встречи гостей

Желдорреммаш внедряет институт молодых специалистов

Каждый пятый врач меняет работу ежегодно: кадровый кризис в здравоохранении обсудили на программе с экспертами ГК «ДИАКОН»

Moscow.media

News24.pro и Life24.pro — таблоиды популярных новостей за 24 часа, сформированных по темам с ежеминутным обновлением. Все самостоятельные публикации на наших ресурсах бесплатны для авторов Ньюс24.про и Ньюс-Лайф.ру.

Разместить свою новость локально в любом городе по любой тематике (и даже, на любом языке мира) можно ежесекундно с мгновенной публикацией самостоятельно — здесь.

Персональные новости

Музыкальные новости
Виктор Цой

Паша Техник: Уважение к Цою и загадочное появление граффити в Москве

Авто в России и мире

Не работавшего «на линии боевого соприкосновения» в Белгородской области Антона Бондарева назначили главврачом московской больницы

Мечты о «легионе узбеков» и Россия "место для малообразованных"

«Аэрофлот» заявил, что его самолет не выкатывался за пределы полосы в Кемерово

Глава МИД Арагчи: отношения Ирана и РФ никогда не были столь близкими и прочными

Экология в России и мире

Спорт в России и мире

Новости тенниса
Карен Хачанов

Карен Хачанов вышел в четвертьфинал теннисного турнира в Барселоне


‘World’s most controversial Wag’ goes topless and shows off major sideboob leaving fans in shock

Wayne Rooney watches travels to Spain to watch son Klay, 11, as he takes on fellow ex-Premier League star’s child

Steven Gerrard spotted at major sporting event as he gives personal update after Al-Ettifaq exit

Get Arsenal to win Champions League at 100/1 after Real Madrid heroics with talkSPORT BET