Ssylka

Как построить универсальную аналитическую систему, избежав привязки к вендору?

Переход от пакетной обработки к аналитике в реальном времени сталкивает с выбором: либо сложная лямбда-архитектура, либо поиск универсального решения. Традиционные колоночные хранилища часто требуют перестроек при каждом обновлении данных, а гибридные форматы могут привести к привязке к конкретному поставщику. Iceberg – открытый табличный формат, представляет собой альтернативу, позволяя работать в различных средах с time travel.
Как построить универсальную аналитическую систему, избежав привязки к вендору?
Изображение носит иллюстративный характер

Проблема миграции данных и CDC в Iceberg подтолкнула к созданию собственного CLI-инструмента Ora2Iceberg. Он обеспечивает прямую выгрузку данных из Oracle в любую открытую аналитическую среду. Этот инструмент решает задачу переноса данных для тех сценариев, где данные неизменны или могут быть извлечены повторно с фильтром по дате обновления.

Производительность Iceberg была протестирована на примере переноса данных из Oracle в S3, с последующей работой через Oracle, PostgreSQL, Athena и Snowflake. Результаты показали, что Snowflake и Athena демонстрируют стабильную линейную производительность, а PostgreSQL и Oracle «проседают» при увеличении объёма данных.

В дальнейшем планируется расширение поддержки каталогов, тестирование Presto, Trino и DuckDB, а также реализация near real-time CDC из Oracle в Iceberg. Цель – создать унифицированную аналитическую экосистему, подходящую для краткосрочной и долгосрочной аналитики.


Новое на сайте

18663Масштабная кампания ShadyPanda заразила миллионы браузеров через официальные обновления 18662Как помидорные бои и персонажи Pixar помогают лидерам превратить корпоративную культуру 18661Как астероид 2024 YR4 стал первой исторической проверкой системы планетарной защиты и... 18660Агентные ИИ-браузеры как троянский конь новой эры кибербезопасности 18659Многовековая история изучения приливов от античных гипотез до синтеза Исаака Ньютона 18658Как выглядела защита от солнца римских легионеров в Египте 1600 лет назад? 18657Хакеры ToddyCat обновили арсенал для тотального взлома Outlook и Microsoft 365 18656Асимметрия безопасности: почему многомиллионные вложения в инструменты детекции не... 18655Как безопасно использовать репозитории Chocolatey и Winget, не подвергая инфраструктуру... 18654Масштабная утечка конфиденциальных данных через популярные онлайн-форматеры кода 18653Как расширение списка жертв взлома Gainsight связано с запуском вымогателя ShinySp1d3r 18652Как расширение Crypto Copilot незаметно похищает средства пользователей Solana на... 18651Как обновление политик безопасности Microsoft Entra ID в 2026 году искоренит атаки 18650Архитектурная уязвимость Microsoft Teams позволяет хакерам отключать защиту Defender 18649Вторая волна червеобразной атаки Shai-Hulud прорвала защиту экосистем npm и Maven