Как построить универсальную аналитическую систему, избежав привязки к вендору?

Переход от пакетной обработки к аналитике в реальном времени сталкивает с выбором: либо сложная лямбда-архитектура, либо поиск универсального решения. Традиционные колоночные хранилища часто требуют перестроек при каждом обновлении данных, а гибридные форматы могут привести к привязке к конкретному поставщику. Iceberg – открытый табличный формат, представляет собой альтернативу, позволяя работать в различных средах с time travel.
Как построить универсальную аналитическую систему, избежав привязки к вендору?
Изображение носит иллюстративный характер

Проблема миграции данных и CDC в Iceberg подтолкнула к созданию собственного CLI-инструмента Ora2Iceberg. Он обеспечивает прямую выгрузку данных из Oracle в любую открытую аналитическую среду. Этот инструмент решает задачу переноса данных для тех сценариев, где данные неизменны или могут быть извлечены повторно с фильтром по дате обновления.

Производительность Iceberg была протестирована на примере переноса данных из Oracle в S3, с последующей работой через Oracle, PostgreSQL, Athena и Snowflake. Результаты показали, что Snowflake и Athena демонстрируют стабильную линейную производительность, а PostgreSQL и Oracle «проседают» при увеличении объёма данных.

В дальнейшем планируется расширение поддержки каталогов, тестирование Presto, Trino и DuckDB, а также реализация near real-time CDC из Oracle в Iceberg. Цель – создать унифицированную аналитическую экосистему, подходящую для краткосрочной и долгосрочной аналитики.


Новое на сайте

19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций 19194Цена ручного управления: почему отказ от автоматизации данных разрушает национальную...
Ссылка