Прорывная проверка пространственных прогнозов

В недавних исследованиях специалисты из MIT выявили, что классические методы проверки точности могут серьёзно подвести в задачах пространственного прогнозирования. Это особенно важно для таких сфер, как прогноз погоды или оценка уровня загрязнения воздуха, где надёжный анализ определяет качество решения практических задач.
Прорывная проверка пространственных прогнозов
Изображение носит иллюстративный характер

Примером подобных ситуаций служит обычная привычка брать зонт, опираясь на прогноз погоды, или оценивать риски для здоровья при повышенном уровне загрязнения воздуха. Учёные традиционно полагались на стандартные методики валидации, доказавшие свою эффективность в других областях, однако оказалась, что пространственная специфика выводит эти подходы за пределы корректности.

Для решения проблемы инициаторами работы выступили Тамара Бродерик, доцент MIT в подразделении Electrical Engineering and Computer Science (EECS) и член ряда исследовательских институтов, а также ведущий автор Дэвид Р. Бёрт и соавтор Юньи Шэнь, аспирант EECS. Их статья будет представлена на конференции International Conference on Artificial Intelligence and Statistics (AISTATS 2025) и уже доступна на сервере arXiv.

В ходе работы команда разработала технику, позволяющую оценивать, насколько адекватен метод проверки при пространственном прогнозировании. Было доказано, что два популярных классических метода могут быть «принципиально ошибочны» в подобных задачах. Учёные пояснили механизм этих сбоев и предложили новую систему валидации, ориентированную специально на данные, зависящие от расположения. Практические опыты с реальными и моделируемыми наборами данных показали превосходство нового подхода в точности.

Оказалось, что классические методики валидации полагаются на предположение о независимой и одинаково распределённой выборке (i.i.d.), что не характерно для реальных пространственных данных. Так, датчики Агентства по охране окружающей среды США (EPA) порой устанавливаются с учётом уже имеющихся станций, а значит, распределения показателей загрязнения воздуха не являются полностью независимыми. К тому же валидационную часть могут составлять показания в городе, тогда как основная задача – прогноз для удалённых населённых пунктов и природных зон.

Новое решение базируется на допущении, что характеристики наблюдаемых явлений «изменяются плавно в пространстве». Это делает возможным более точный расчёт вероятности ошибки в конкретной точке, будь то скорость ветра или уровень загрязнения. Подход особенно важен в климатических исследованиях, где требуется предсказывать, например, температуру поверхности моря, а также в эпидемиологии, когда оценивается роль загрязнения воздуха в распространении болезней.

Проверка осуществлялась на сымитированных и полуреальных наборах данных, а также при прогнозировании скорости ветра в аэропорту Чикаго О'Хара, заблаговременном определении температуры воздуха в пяти городах США и оценке стоимости квартир в Англии в зависимости от локации. Итоги показали, что новый метод даёт более надёжные результаты по сравнению с двумя основными классическими алгоритмами валидации.

В дальнейшем авторы планируют применять предложенную технику для повышения точности оценки неопределённости в задачах, где пространственные зависимости оказывают ключевое влияние. Кроме того, они намерены исследовать, сможет ли аналогичный подход приносить пользу в обработке временных рядов и в других областях анализа данных.


Новое на сайте

19989Шесть историй, которые умещаются на ладони 19986Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров? 19985LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы 19984Автономная проверка защиты: как не отстать от ИИ-атак 19983Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по... 19982Почему почти 3000 монет в норвежском поле перевернули представление о викингах? 19981Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту? 19980Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля 19979Как хакеры грабят компании через звонок в «техподдержку» 19978Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед... 19977Как одна команда git push открывала доступ к миллионам репозиториев 19976Зачем древние народы убивали ножами и мечами: оружие как основа власти 19975Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно? 19974Послание в бутылке: математика невозможного 19973Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?
Ссылка