Ssylka

Как построить универсальную аналитическую систему, избежав привязки к вендору?

Переход от пакетной обработки к аналитике в реальном времени сталкивает с выбором: либо сложная лямбда-архитектура, либо поиск универсального решения. Традиционные колоночные хранилища часто требуют перестроек при каждом обновлении данных, а гибридные форматы могут привести к привязке к конкретному поставщику. Iceberg – открытый табличный формат, представляет собой альтернативу, позволяя работать в различных средах с time travel.
Как построить универсальную аналитическую систему, избежав привязки к вендору?
Изображение носит иллюстративный характер

Проблема миграции данных и CDC в Iceberg подтолкнула к созданию собственного CLI-инструмента Ora2Iceberg. Он обеспечивает прямую выгрузку данных из Oracle в любую открытую аналитическую среду. Этот инструмент решает задачу переноса данных для тех сценариев, где данные неизменны или могут быть извлечены повторно с фильтром по дате обновления.

Производительность Iceberg была протестирована на примере переноса данных из Oracle в S3, с последующей работой через Oracle, PostgreSQL, Athena и Snowflake. Результаты показали, что Snowflake и Athena демонстрируют стабильную линейную производительность, а PostgreSQL и Oracle «проседают» при увеличении объёма данных.

В дальнейшем планируется расширение поддержки каталогов, тестирование Presto, Trino и DuckDB, а также реализация near real-time CDC из Oracle в Iceberg. Цель – создать унифицированную аналитическую экосистему, подходящую для краткосрочной и долгосрочной аналитики.


Новое на сайте

18884Знаете ли вы, что приматы появились до вымирания динозавров, и готовы ли проверить свои... 18883Четыреста колец в туманности эмбрион раскрыли тридцатилетнюю тайну звездной эволюции 18882Телескоп Джеймс Уэбб раскрыл тайны сверхэффективной звездной фабрики стрелец B2 18881Математический анализ истинного количества сквозных отверстий в человеческом теле 18880Почему даже элитные суперраспознаватели проваливают тесты на выявление дипфейков без... 18879Шесть легендарных древних городов и столиц империй, местоположение которых до сих пор... 18878Обзор самых необычных медицинских диагнозов и клинических случаев 2025 года 18877Критическая уязвимость CVE-2025-14847 в MongoDB открывает удаленный доступ к памяти... 18876Научное обоснование классификации солнца как желтого карлика класса G2V 18875Как безграничная преданность горным гориллам привела Дайан Фосси к жестокой гибели? 18874Новый родственник спинозавра из Таиланда меняет представления об эволюции хищников Азии 18873Как новая электрохимическая технология позволяет удвоить добычу водорода и снизить... 18872Могут ли ледяные гиганты Уран и Нептун на самом деле оказаться каменными? 18871Внедрение вредоносного кода в расширение Trust Wallet привело к хищению 7 миллионов... 18870Проверка клинического мышления на основе редких медицинских случаев 2025 года