Тестирование эволюции схем состояния Apache Flink с пользовательским сериализатором

Для тестирования эволюции схем состояния в Apache Flink, когда используется пользовательский сериализатор, например JacksonStateSerializer, необходимо создать два разных classloader'а, каждый из которых будет содержать свою версию класса состояния. Это позволяет имитировать ситуацию, когда схема состояния меняется между двумя запусками приложения. Тест состоит из двух этапов. На первом этапе создается и сохраняется состояние с первой версией схемы, а на втором этапе происходит восстановление состояния с новой версией схемы.
Тестирование эволюции схем состояния Apache Flink с пользовательским сериализатором
Изображение носит иллюстративный характер

Для реализации этого процесса используется ряд вспомогательных компонентов. MiniClusterUtils обеспечивает запуск Flink MiniCluster с возможностью указания пользовательского classpath. TestStatefulMapCounter представляет собой простой stateful оператор, который инкрементирует счетчик при повторном обращении к состоянию. ObjectTypeClassLoaderDto хранит объект с типом, загруженным определенным classloader'ом. StateClassLoadingUtil компилирует классы из текстовых файлов с исходным кодом, а ClassLoaderUtils выполняет запись исходников в файлы, компиляцию и создание ClassLoader.

Сам тест включает в себя создание Flink MiniCluster с первой версией схемы, сохранение состояния с использованием этой схемы и снятие savepoint'а. Далее запускается новый Flink MiniCluster с другой версией схемы, восстановлением состояния из savepoint'а и проверкой, что данные успешно десериализовались в новую схему. Это достигается путем добавления в classpath каждой джобы своей версии схемы с помощью URLClassLoader.

Ключевым моментом теста является то, что используются разные ClassLoader'ы, что позволяет избежать конфликта имен классов. Это дает возможность независимо манипулировать разными версиями схемы состояния и тестировать эволюцию схемы в различных направлениях (v1 -> v2 и v2 -> v1). Для инициализации объектов в тесте применяется библиотека EasyRandom, которая генерирует случайные объекты по схеме. Это позволяет получить объект нужной версии схемы, сгенерировав его на основании загруженного класса.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка