Ssylka

Промышленный деплой Apache Airflow в Kubernetes

Статья описывает развертывание Apache Airflow в Kubernetes с акцентом на безопасность и наблюдаемость. Для управления секретами предлагается использовать SOPS, который шифрует конфиденциальные данные на уровне файлов, что позволяет безопасно хранить их в репозиториях. Для структурирования и избежания дублирования конфигураций в YAML-файлах применяются якоря, обеспечивающие централизованное управление параметрами. В статье подчеркивается важность использования KubernetesExecutor для выполнения задач DAG в отдельных подах. Ресурсы для этих подов настраиваются с учетом однопоточной природы Python, ограничивая использование CPU до одного ядра по умолчанию.
Промышленный деплой Apache Airflow в Kubernetes
Изображение носит иллюстративный характер

Для мониторинга Apache Airflow используется Prometheus StatsD Exporter, собирающий метрики, с последующей визуализацией в Grafana. Логирование подов, выполняющих DAG, реализуется через FluentBit с фильтрацией и преобразованием для удобного анализа в Graylog. Статья подробно разбирает конфигурацию FluentBit, включая фильтрацию нерелевантных логов и структурирование данных для облегчения поиска. Отмечается интеграция с MinIO для хранения логов выполнения задач DAG, которые настраиваются через переменные окружения и коннекшены Airflow.

В качестве базы данных используется MySQL, также настраиваемый с помощью секретов. В статье приведены примеры конфигурации, включающие использование ServiceMonitor для метрик, конфигурацию MinIO и примеры создания коннекшенов в Airflow. Описываются способы деплоя с помощью Helm, включая установку и обновление чартов с зашифрованными секретами. Весь процесс направлен на создание отказоустойчивой и масштабируемой системы, обеспечивающей прозрачность ETL-процессов.


Новое на сайте

19032Микрогравитация на мкс превратила вирусы в эффективных убийц устойчивых бактерий 19031Как древние римляне управляли капиталом, чтобы обеспечить себе пассивный доход и защитить... 19030Миссия Pandora: новый инструмент NASA для калибровки данных телескопа «Джеймс Уэбб» 19029Телескоп Джеймс Уэбб запечатлел «неудавшиеся звезды» в звездном скоплении вестерлунд 2 19028Как «пенопластовые» планеты в системе V1298 Tau стали недостающим звеном в понимании... 19027Возможно ли одновременное глобальное отключение всего мирового интернета? 19026Станет ли бактериальная система самоуничтожения SPARDA более гибким инструментом... 19025Насколько опасной и грязной была вода в древнейших банях Помпей? 19024Гравитационная ориентация и структура космических плоскостей от земли до сверхскоплений 19023Сколько частей тела и органов можно потерять, чтобы остаться в живых? 19022Зачем Сэм Альтман решил внедрить рекламу в бесплатные версии ChatGPT? 19021Хитроумная маскировка вредоноса GootLoader через тысячи склеенных архивов 19020Удастся ли знаменитому археологу Захи Хавассу найти гробницу Нефертити до ухода на покой? 19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению...