Как GeoAggregator меняет подход к анализу геопространственных данных?

Ученые из Университета Глазго (Шотландия) разработали новую программную модель под названием "GeoAggregator", которая призвана сделать анализ геопространственных данных более экологичным и доступным. Соответствующая научная работа "GeoAggregator—An Efficient Transformer Model for Geo-spatial Tabular Data" представлена на Конференции по искусственному интеллекту AAAI.
Как GeoAggregator меняет подход к анализу геопространственных данных?
Изображение носит иллюстративный характер

Появление GeoAggregator обусловлено стремительным ростом объемов геопространственных данных, собираемых ежедневно с GPS-устройств и спутников. Существующие модели искусственного интеллекта и традиционные статистические методы зачастую не справляются с выявлением сложных пространственных взаимосвязей в таких массивных наборах данных.

GeoAggregator представляет собой облегченную трансформерную модель искусственного интеллекта, специально разработанную для эффективного анализа пространственной автокорреляции (влияния близлежащих мест друг на друга) и пространственной гетерогенности (изменения паттернов от одного места к другому). Модель работает быстрее, масштабируется лучше и требует меньше ресурсов по сравнению с традиционными моделями глубокого обучения, что делает ее более доступной для исследователей, политиков и малых/средних организаций.

Одна из ключевых особенностей GeoAggregator — механизм локального внимания с гауссовым смещением, который помогает модели фокусироваться на релевантных близлежащих точках данных, сохраняя при этом более широкий пространственный контекст. Это улучшает прогнозирование для различных задач, связанных с пространственными данными, включая прогнозирование загрязнения воздуха, тенденции цен на жилье и анализ распределения бедности.

Дополнительно разработчики внедрили механизм декартова внимания, который позволяет модели оставаться легковесной при сохранении высокой точности. Это обеспечивает эффективную обработку больших наборов данных без существенного снижения производительности.

GeoAggregator был протестирован на синтетических данных, прогнозах цен на жилье и оценках качества воздуха. Результаты показали, что модель работает так же хорошо или лучше, чем геостатистические методы, XGBoost и другие модели глубокого обучения, достигая высокой точности при меньших вычислительных затратах.

«От сделок с недвижимостью до покупок в продуктовых магазинах и бизнес-данных — если к информации привязано местоположение, это географические данные», — отмечает доктор Миншу Ван из Школы географических и наук о Земле Университета Глазго, соавтор исследования. "GeoAggregator представляет собой большой шаг вперед в повышении эффективности и доступности сложного анализа данных. Весь анализ данных был выполнен на одном ноутбуке».

Исследователи сделали свой код открытым, чтобы способствовать более широкому использованию и сотрудничеству. В настоящее время разрабатывается открытый Python-пакет, который сделает GeoAggregator свободно доступным для всех.

"GeoAggregator идеально подходит для малых и средних компаний, исследователей или образовательных целей с ограниченными ресурсами», — говорит Руи Дэн, ведущий автор работы. «Крупные организации также могут использовать его для сокращения потребления энергии и воды в рамках своих целей устойчивого развития».

Проект является частью продолжающегося докторского исследования Руи Дэна, направленного на улучшение возможностей модели в течение следующих двух лет. В работе также принимал участие доктор Цзици Ли, доцент Университета штата Флорида, почетный научный сотрудник и соруководитель Руи Дэна в Школе географических и наук о Земле.

Разработка GeoAggregator связана с партнерством EXAGeo — сотрудничеством между академическими кругами, промышленностью и правительственными партнерами, которое подготовит 65 новых докторантов для разработки и применения программного обеспечения для экологических приложений на вычислительных системах эксамасштаба следующего поколения.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка