Как GeoAggregator меняет подход к анализу геопространственных данных?

Ученые из Университета Глазго (Шотландия) разработали новую программную модель под названием "GeoAggregator", которая призвана сделать анализ геопространственных данных более экологичным и доступным. Соответствующая научная работа "GeoAggregator—An Efficient Transformer Model for Geo-spatial Tabular Data" представлена на Конференции по искусственному интеллекту AAAI.
Как GeoAggregator меняет подход к анализу геопространственных данных?
Изображение носит иллюстративный характер

Появление GeoAggregator обусловлено стремительным ростом объемов геопространственных данных, собираемых ежедневно с GPS-устройств и спутников. Существующие модели искусственного интеллекта и традиционные статистические методы зачастую не справляются с выявлением сложных пространственных взаимосвязей в таких массивных наборах данных.

GeoAggregator представляет собой облегченную трансформерную модель искусственного интеллекта, специально разработанную для эффективного анализа пространственной автокорреляции (влияния близлежащих мест друг на друга) и пространственной гетерогенности (изменения паттернов от одного места к другому). Модель работает быстрее, масштабируется лучше и требует меньше ресурсов по сравнению с традиционными моделями глубокого обучения, что делает ее более доступной для исследователей, политиков и малых/средних организаций.

Одна из ключевых особенностей GeoAggregator — механизм локального внимания с гауссовым смещением, который помогает модели фокусироваться на релевантных близлежащих точках данных, сохраняя при этом более широкий пространственный контекст. Это улучшает прогнозирование для различных задач, связанных с пространственными данными, включая прогнозирование загрязнения воздуха, тенденции цен на жилье и анализ распределения бедности.

Дополнительно разработчики внедрили механизм декартова внимания, который позволяет модели оставаться легковесной при сохранении высокой точности. Это обеспечивает эффективную обработку больших наборов данных без существенного снижения производительности.

GeoAggregator был протестирован на синтетических данных, прогнозах цен на жилье и оценках качества воздуха. Результаты показали, что модель работает так же хорошо или лучше, чем геостатистические методы, XGBoost и другие модели глубокого обучения, достигая высокой точности при меньших вычислительных затратах.

«От сделок с недвижимостью до покупок в продуктовых магазинах и бизнес-данных — если к информации привязано местоположение, это географические данные», — отмечает доктор Миншу Ван из Школы географических и наук о Земле Университета Глазго, соавтор исследования. "GeoAggregator представляет собой большой шаг вперед в повышении эффективности и доступности сложного анализа данных. Весь анализ данных был выполнен на одном ноутбуке».

Исследователи сделали свой код открытым, чтобы способствовать более широкому использованию и сотрудничеству. В настоящее время разрабатывается открытый Python-пакет, который сделает GeoAggregator свободно доступным для всех.

"GeoAggregator идеально подходит для малых и средних компаний, исследователей или образовательных целей с ограниченными ресурсами», — говорит Руи Дэн, ведущий автор работы. «Крупные организации также могут использовать его для сокращения потребления энергии и воды в рамках своих целей устойчивого развития».

Проект является частью продолжающегося докторского исследования Руи Дэна, направленного на улучшение возможностей модели в течение следующих двух лет. В работе также принимал участие доктор Цзици Ли, доцент Университета штата Флорида, почетный научный сотрудник и соруководитель Руи Дэна в Школе географических и наук о Земле.

Разработка GeoAggregator связана с партнерством EXAGeo — сотрудничеством между академическими кругами, промышленностью и правительственными партнерами, которое подготовит 65 новых докторантов для разработки и применения программного обеспечения для экологических приложений на вычислительных системах эксамасштаба следующего поколения.


Новое на сайте

20099Нейронаука одиночества: есть ли в мозге клетки, которые страдают? 20098Почему глаза так долго привыкают к темноте — и что за этим стоит? 20097Мыть или не мыть рис: что реально происходит в кастрюле 20095Мне не предоставили текст для написания статьи. 20094Мыть или не мыть рис: что реально происходит в кастрюле 20092Почему глаза так долго привыкают к темноте — и что за этим стоит? 20087Игла сквозь череп: медицинский случай с рыбой-иглой и задачей, которую хирурги решали... 20085Живая квантовая сеть в Нью-Йорке: как Qunnect пытается построить интернет, который нельзя... 20084Живые обои: дрожжи, алгинат и 3D-принтер вместо поклейки 20083ИИ-агент уничтожил базу данных за 9 секунд и сам же признался в этом 20082CVE-2026-5027: почему уязвимость в Langflow уже активно эксплуатируется хакерами? 20081GreatXML: новый обход BitLocker через Recovery Partition 20080Июньский Patch Tuesday 2026: 206 уязвимостей, три zero-day и неуправляемый ИИ в поиске дыр
Ссылка