Ssylka

Langfuse: платформа для версионирования и управления промтами в разработке БЯМ

Langfuse — это open-source платформа, разработанная для отслеживания, версионирования и управления промтами (затравками) при работе с большими языковыми моделями (БЯМ). Она позволяет командам разработчиков контролировать эксперименты, сохранять метаданные и обеспечивает возможность воспроизводимости результатов. Langfuse поддерживает self-hosting, что важно для сохранения контроля над данными, и предоставляет инструменты для совместной работы.
Langfuse: платформа для версионирования и управления промтами в разработке БЯМ
Изображение носит иллюстративный характер

Ключевые компоненты платформы включают: трейсы (представление запросов), наблюдения (логи выполнения шагов), сессии (группы трейсов, например, диалог), и оценки (результаты измерений). Langfuse поддерживает два типа промтов: текстовые (для однократных запросов) и чатовые (для диалогов с историей). Промты могут содержать переменные шаблоны, которые можно динамически подставлять при выполнении запроса. Также для организации и фильтрации данных можно использовать метки (labels) и теги.

Система позволяет логировать запросы к БЯМ, обертывая функции, взаимодействующие с моделями, декоратором @observe(). Это автоматически отслеживает ход выполнения и отправляет информацию в Langfuse. Также можно создавать наборы данных (dataset) для тестирования промтов. Каждый элемент набора данных содержит входные параметры и ожидаемые результаты. Langfuse предоставляет функции для оценки ответов БЯМ, например, сравнение с ожидаемым результатом. Для более сложных случаев возможно подключение LLM-as-a-judge.

В Langfuse есть возможность сравнивать результаты различных экспериментов и аннотировать запросы вручную, что полезно для анализа. Платформа предоставляет различные типы оценки: числовой, категориальный и булевый. Langfuse также поддерживает сохранение контекста в чатах, что позволяет создавать более сложные и интерактивные приложения с БЯМ. История сообщений сохраняется и передается модели при каждом запросе, обеспечивая контекст для диалога.


Новое на сайте

18904Почему эволюция лишила человека способности управлять пальцами ног по отдельности, как... 18903Как нестандартная архитектура браузера Adapt и оптимизация рабочих процессов решают... 18902Как средневековые писательницы разрушили мужской миф о дружбе как зеркальном отражении? 18901Где искать на небе уникальное волчье суперлуние в соединении с Юпитером в начале 2026... 18900Ботнет RondoDox атакует 90 тысяч серверов через критическую уязвимость React2Shell 18899Что приготовила луна на 2026 год: когда наблюдать 13 полнолуний, кровавое затмение и... 18898Глобальная кампания кибершпионажа DarkSpectre скомпрометировала миллионы браузеров в... 18897Действительно ли человечеству необходимо колонизировать другие миры? 18896Особенности наблюдения метеорного потока квадрантиды в условиях январского полнолуния 18895Каменные пирамиды раздора и наследие «мясника Гипсленда» в Австралии 18894Критическая уязвимость в IBM API Connect с рейтингом 9.8 угрожает безопасности глобальных... 18893Эволюция киберугроз в npm и Maven: самораспространяющийся червь Shai-Hulud и поддельный... 18892Уникальная перуанская трофейная голова указывает на сакральный статус людей с врожденными... 18891Как аномально «гладкое» землетрясение в Мьянме меняет прогнозы для грядущего катаклизма в... 18890США неожиданно сняли санкции с ключевых фигур разработчика шпионского по Predator