Ssylka

Автоматизация отбора подрядчиков с помощью LLM

Для автоматизации отбора подрядчиков, участвующих в тендерах, была разработана система на основе LLM Mistral-7B-v0.2. Она анализирует документы претендентов и проверяет соответствие их компетенций требованиям заказчика. Система состоит из двух этапов: классификации документов и их сверки.
Автоматизация отбора подрядчиков с помощью LLM
Изображение носит иллюстративный характер

На первом этапе классификатор на базе LLM отсеивает нерелевантные документы, сопоставляя их с критериями отбора. Для корректной классификации используется дополнительный контекст, такой как тип контракта, и предварительная суммаризация документов. Однако в дальнейшем от суммаризации отказались, чтобы избежать потери данных. В результате классификации достигается точность 79%, полнота 82% и F1-мера 0.86.

На втором этапе происходит сверка отобранных документов. Из документов извлекаются ключевые сведения (метаданные) с помощью RAG, а затем эти сведения передаются LLM для принятия окончательного решения о соответствии участника критериям. Этот этап включает в себя выделение необходимых характеристик, таких как контрагенты и даты услуг из документов, а также извлечение метаданных, например, ФИО и квалификации из дипломов.

Результаты показали высокую эффективность системы по большинству критериев (F1 ~0.82), но есть проблемы с критериями, где требуется точное соответствие данных из нескольких документов, например, договоров и актов, что указывает на необходимость улучшения извлечения метаданных и, возможно, использование моделей с большим контекстным окном для обработки целых документов.


Новое на сайте

18884Знаете ли вы, что приматы появились до вымирания динозавров, и готовы ли проверить свои... 18883Четыреста колец в туманности эмбрион раскрыли тридцатилетнюю тайну звездной эволюции 18882Телескоп Джеймс Уэбб раскрыл тайны сверхэффективной звездной фабрики стрелец B2 18881Математический анализ истинного количества сквозных отверстий в человеческом теле 18880Почему даже элитные суперраспознаватели проваливают тесты на выявление дипфейков без... 18879Шесть легендарных древних городов и столиц империй, местоположение которых до сих пор... 18878Обзор самых необычных медицинских диагнозов и клинических случаев 2025 года 18877Критическая уязвимость CVE-2025-14847 в MongoDB открывает удаленный доступ к памяти... 18876Научное обоснование классификации солнца как желтого карлика класса G2V 18875Как безграничная преданность горным гориллам привела Дайан Фосси к жестокой гибели? 18874Новый родственник спинозавра из Таиланда меняет представления об эволюции хищников Азии 18873Как новая электрохимическая технология позволяет удвоить добычу водорода и снизить... 18872Могут ли ледяные гиганты Уран и Нептун на самом деле оказаться каменными? 18871Внедрение вредоносного кода в расширение Trust Wallet привело к хищению 7 миллионов... 18870Проверка клинического мышления на основе редких медицинских случаев 2025 года