Ssylka

Промышленный деплой Apache Airflow в Kubernetes

Статья описывает развертывание Apache Airflow в Kubernetes с акцентом на безопасность и наблюдаемость. Для управления секретами предлагается использовать SOPS, который шифрует конфиденциальные данные на уровне файлов, что позволяет безопасно хранить их в репозиториях. Для структурирования и избежания дублирования конфигураций в YAML-файлах применяются якоря, обеспечивающие централизованное управление параметрами. В статье подчеркивается важность использования KubernetesExecutor для выполнения задач DAG в отдельных подах. Ресурсы для этих подов настраиваются с учетом однопоточной природы Python, ограничивая использование CPU до одного ядра по умолчанию.
Промышленный деплой Apache Airflow в Kubernetes
Изображение носит иллюстративный характер

Для мониторинга Apache Airflow используется Prometheus StatsD Exporter, собирающий метрики, с последующей визуализацией в Grafana. Логирование подов, выполняющих DAG, реализуется через FluentBit с фильтрацией и преобразованием для удобного анализа в Graylog. Статья подробно разбирает конфигурацию FluentBit, включая фильтрацию нерелевантных логов и структурирование данных для облегчения поиска. Отмечается интеграция с MinIO для хранения логов выполнения задач DAG, которые настраиваются через переменные окружения и коннекшены Airflow.

В качестве базы данных используется MySQL, также настраиваемый с помощью секретов. В статье приведены примеры конфигурации, включающие использование ServiceMonitor для метрик, конфигурацию MinIO и примеры создания коннекшенов в Airflow. Описываются способы деплоя с помощью Helm, включая установку и обновление чартов с зашифрованными секретами. Весь процесс направлен на создание отказоустойчивой и масштабируемой системы, обеспечивающей прозрачность ETL-процессов.


Новое на сайте

19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению... 19017Вредоносная кампания в Chrome перехватывает управление HR-системами и блокирует... 19016Глубоководные оползни раскрыли историю мегаземлетрясений зоны Каскадия за 7500 лет 19015Насколько глубоки ваши познания об эволюции и происхождении человека? 19014Как уязвимость CodeBreach в AWS CodeBuild могла привести к глобальной атаке через ошибку... 19013Затерянный фрагмент древней плиты пионер меняет карту сейсмических угроз Калифорнии 19012Генетические мутации вызывают слепоту менее чем в 30% случаев вопреки прежним прогнозам 19011Завершено строительство космического телескопа Nancy Grace Roman для поиска ста тысяч... 19010Вязкость пространства и фононы вакуума как разгадка аномалий расширения вселенной 19009Приведет ли массовое плодоношение дерева Риму к рекордному росту популяции какапо? 19008Как уязвимость CVE-2026-23550 в плагине Modular DS позволяет захватить управление сайтом? 19007Может ли уличная драка французского авантюриста раскрыть кризис американского гражданства... 19006Может ли один клик по легитимной ссылке заставить Microsoft Copilot и другие ИИ тайно... 19005Утрата истинного мастерства в эпоху алгоритмов и скрытые механизмы человеческого...