Ssylka

Интеллектуальный помощник по подбору вакансий: анализ и улучшения

Система подбора вакансий и кандидатов использует анализ текста резюме и вакансий для сопоставления требований и навыков. Для этого применяется RAG-модель, которая анализирует данные из векторной базы данных. Применяются техники обработки естественного языка для структурирования данных и извлечения ключевой информации, такой как опыт работы, навыки, образование и тип занятости. Для анализа используются векторные представления, включая dense и sparse вектора, что повышает точность поиска релевантных документов.
Интеллектуальный помощник по подбору вакансий: анализ и улучшения
Изображение носит иллюстративный характер

Первоначальные результаты показали, что использование только плотных векторов (например, deepvk/USER-bge-m3) дает неплохие результаты, но гибридный подход на основе «матрёшечного» ранжирования, сочетающего dense и sparse вектора (bm25 и Tochka-AI/ruRoPEBert-e5-base-2k) значительно улучшил метрики, в частности MAP@10 и Recall@10. В качестве мультиагентной системы используется LangGraph, где каждый агент отвечает за конкретную задачу, начиная от классификации текста и заканчивая генерацией ответа пользователю.

Backend реализован на FastAPI для обработки запросов загрузки документов и получения результатов. Frontend на Angular позволяет загружать резюме и вакансии в текстовом формате, pdf и docx. Пользователь после обработки получает отранжированный список релевантных вакансий. Несмотря на достигнутые успехи в ранжировании, система еще нуждается в улучшениях.

Необходимо более глубокое понимание контекста, так как формальное перечисление навыков не отражает их уровень, поскольку сложность и время освоения могут значительно различаться. Например, SQL и SSH требуют разного уровня подготовки. Также, стоит обратить внимание на взаимосвязи навыков, так как наличие одного навыка может подразумевать наличие других, связанных с ним. И еще, необходимо уделить внимание обработке полей с малым количеством контента. В перспективе, использование bert-like моделей для NER и оптимизация vLLM могут ускорить обработку данных.


Новое на сайте

14779Взлом аккаунта министра: криптовалютная афера на платформе X 14778Google под прицелом антимонопольной комиссии Японии 14777Хор для тех, кто не умеет петь: как Zest Choir меняет отношение к музыке 14776Поглотила ли покупка Instagram конкуренцию на рынке соцсетей? 14775Как у прилавка с суши возникла уэльская морская трава? 14774Почему муравьи становятся новой целью международных браконьеров? 14773Как пятеро друзей из Dude Perfect стали символом семейного развлечения? 14772Может ли Хельсинки стать новой столицей европейских стартапов? 14771Кто стоял за великой железнодорожной кражей: элита преступного мира? 14770Meta возобновляет обучение искусственного интеллекта на публичных данных европейских... 14769Солнечная буря приносит северное сияние в необычные широты 14768Как WNBA-драфт стал витриной культурной идентичности? 14767Музей Кука вновь открыт: тайна благотворителя остаётся нераскрытой 14766Воссоединение