Ssylka

Интеллектуальный помощник по подбору вакансий: анализ и улучшения

Система подбора вакансий и кандидатов использует анализ текста резюме и вакансий для сопоставления требований и навыков. Для этого применяется RAG-модель, которая анализирует данные из векторной базы данных. Применяются техники обработки естественного языка для структурирования данных и извлечения ключевой информации, такой как опыт работы, навыки, образование и тип занятости. Для анализа используются векторные представления, включая dense и sparse вектора, что повышает точность поиска релевантных документов.
Интеллектуальный помощник по подбору вакансий: анализ и улучшения
Изображение носит иллюстративный характер

Первоначальные результаты показали, что использование только плотных векторов (например, deepvk/USER-bge-m3) дает неплохие результаты, но гибридный подход на основе «матрёшечного» ранжирования, сочетающего dense и sparse вектора (bm25 и Tochka-AI/ruRoPEBert-e5-base-2k) значительно улучшил метрики, в частности MAP@10 и Recall@10. В качестве мультиагентной системы используется LangGraph, где каждый агент отвечает за конкретную задачу, начиная от классификации текста и заканчивая генерацией ответа пользователю.

Backend реализован на FastAPI для обработки запросов загрузки документов и получения результатов. Frontend на Angular позволяет загружать резюме и вакансии в текстовом формате, pdf и docx. Пользователь после обработки получает отранжированный список релевантных вакансий. Несмотря на достигнутые успехи в ранжировании, система еще нуждается в улучшениях.

Необходимо более глубокое понимание контекста, так как формальное перечисление навыков не отражает их уровень, поскольку сложность и время освоения могут значительно различаться. Например, SQL и SSH требуют разного уровня подготовки. Также, стоит обратить внимание на взаимосвязи навыков, так как наличие одного навыка может подразумевать наличие других, связанных с ним. И еще, необходимо уделить внимание обработке полей с малым количеством контента. В перспективе, использование bert-like моделей для NER и оптимизация vLLM могут ускорить обработку данных.


Новое на сайте

18884Знаете ли вы, что приматы появились до вымирания динозавров, и готовы ли проверить свои... 18883Четыреста колец в туманности эмбрион раскрыли тридцатилетнюю тайну звездной эволюции 18882Телескоп Джеймс Уэбб раскрыл тайны сверхэффективной звездной фабрики стрелец B2 18881Математический анализ истинного количества сквозных отверстий в человеческом теле 18880Почему даже элитные суперраспознаватели проваливают тесты на выявление дипфейков без... 18879Шесть легендарных древних городов и столиц империй, местоположение которых до сих пор... 18878Обзор самых необычных медицинских диагнозов и клинических случаев 2025 года 18877Критическая уязвимость CVE-2025-14847 в MongoDB открывает удаленный доступ к памяти... 18876Научное обоснование классификации солнца как желтого карлика класса G2V 18875Как безграничная преданность горным гориллам привела Дайан Фосси к жестокой гибели? 18874Новый родственник спинозавра из Таиланда меняет представления об эволюции хищников Азии 18873Как новая электрохимическая технология позволяет удвоить добычу водорода и снизить... 18872Могут ли ледяные гиганты Уран и Нептун на самом деле оказаться каменными? 18871Внедрение вредоносного кода в расширение Trust Wallet привело к хищению 7 миллионов... 18870Проверка клинического мышления на основе редких медицинских случаев 2025 года