Автоматизация отбора подрядчиков с помощью LLM

Для автоматизации отбора подрядчиков, участвующих в тендерах, была разработана система на основе LLM Mistral-7B-v0.2. Она анализирует документы претендентов и проверяет соответствие их компетенций требованиям заказчика. Система состоит из двух этапов: классификации документов и их сверки.
Автоматизация отбора подрядчиков с помощью LLM
Изображение носит иллюстративный характер

На первом этапе классификатор на базе LLM отсеивает нерелевантные документы, сопоставляя их с критериями отбора. Для корректной классификации используется дополнительный контекст, такой как тип контракта, и предварительная суммаризация документов. Однако в дальнейшем от суммаризации отказались, чтобы избежать потери данных. В результате классификации достигается точность 79%, полнота 82% и F1-мера 0.86.

На втором этапе происходит сверка отобранных документов. Из документов извлекаются ключевые сведения (метаданные) с помощью RAG, а затем эти сведения передаются LLM для принятия окончательного решения о соответствии участника критериям. Этот этап включает в себя выделение необходимых характеристик, таких как контрагенты и даты услуг из документов, а также извлечение метаданных, например, ФИО и квалификации из дипломов.

Результаты показали высокую эффективность системы по большинству критериев (F1 ~0.82), но есть проблемы с критериями, где требуется точное соответствие данных из нескольких документов, например, договоров и актов, что указывает на необходимость улучшения извлечения метаданных и, возможно, использование моделей с большим контекстным окном для обработки целых документов.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка