ML Pet-проекты для 2025: от идей к реализации

В 2025 году перспективными ML pet-проектами могут стать: поиск Деда Мороза на изображениях с помощью YOLO, определение объема подарочной коробки по фото, генерация уникальных снежинок и инструкций для их вырезания на основе Stable Diffusion. Дополнительные возможности откроют LLM и RAG, обученные на конкретной книге, а также голосовые дневники с транскрипцией, анализом, суммаризацией и тематические эмбеддинги «из коробки».
ML Pet-проекты для 2025: от идей к реализации
Изображение носит иллюстративный характер

Для поиска Деда Мороза стоит собрать собственный датасет размеченных изображений и использовать transfer learning для дообучения YOLO. Оценка объема коробки требует CNN для карт глубины, object detection для локализации и 3D-реконструкции для вычисления объема. Генерация снежинок включает дообучение Stable Diffusion на собранных данных и анализ геометрии для создания инструкций.

RAG для конкретной книги начинается с выбора мощной LLM, векторизации текста и создания базы данных векторов для быстрого поиска релевантных фрагментов. Голосовой дневник с аналитикой использует транскрибацию речи, лингвистический анализ текста, кластеризацию и суммаризацию с применением LLM для генерации резюме и создания векторного пространства.

Для тематических эмбеддингов необходимы предобученная языковая модель, качественный датасет из предметной области и бенчмарк для оценки качества. Проект RAG по книге можно упростить с помощью сервиса , предоставляющего UI и возможность загрузки до 50 источников бесплатно.


Новое на сайте