GeoAI

地理大模型

字号+ 作者:gisempire 来源:未知 2025-01-03 10:53 我要评论( )

大数据与人工智能时代推动地图科学的创新发展,使得地图学与神经科学的深度交叉结合成为了新的发展途径,利用认知神经科学的方法和成果分析地图,同样促进了地图和地理信息领域与人工智能的融合与深度应用。

    人工智能与地理空间科学研究的交集是有历史渊源的,人工智能技术在地理学和地球科学领域的应用并不新鲜。Smith(1984)和 Couclelis(1986)在 20 世纪 80 年代就讨论过人工智能在解决地理问题方面的潜在作用;Openshaw(1997)也发表了关于地理人工智能的专著。解决自然地理空间和社会人文地理空间产生的很多科学难题需要包括人工智能在内的新方法和新技术的支持;不断产生的遥感卫星数据、人口移动位置大数据、车辆运营轨迹数据等时空数据也可以支持人工智能模型训练和新算法的研发(高松,2020;吴华意等,2019)。
     机器学习(ML)和人工智能(AI)的发展给基础的通用大模型带来了巨大的成功,但
对于地理空间人工智能(GeoAI)相关专用大模型的探索相对较少,其关键技术是挑战 GeoAI固有的多模式特性。GeoAI 的核心数据模式包括文本、图像(遥感影像和街景图像)、轨迹数据、知识图和地理空间矢量数据(如 OpenStreetMap 的地图层),所有这些数据都包含重要的地理空间信息(几何和语义信息)。每种模态的数据都有特殊的结构,都需要空间表达的数据模型,因此如何有效地将这些表示以适当的归纳偏差结合在一个模型中需要仔细的设计。GeoAI 的多模态特性阻碍了在GeoAI 任务中直接应用现有的预训练基础模型。
    地理学包含了不同的子领域,是一门跨度非常广泛的学科,包括地理空间语义学、健康地理学、城市地理学、遥感科学等等。现有的大型语言模型在地名识别、位置描述识别、痴呆症的时间序列预测等一些地理空间任务上能够很好地胜过完全监督的任务特定的 ML/DL模型;但是在涉及点数据、街景图像、遥感影像等多种数据模式的任务时,现有的基础模型仍然不如特定的模型,如何从空间思维视角出发。由于空间数据的可用性和重要性日益增加,GeoAI 的研究也将为更广泛的问题回答和智能数字助理做出贡献。作为空间数据科学的一个子领域,GeoAI 利用技术和数据服务的进步来支持为各种下游任务创建更智能的地理信息以及方法、系统和服务。其中包括图像分类、目标检测、场景分割、仿真和插值、链接预测、检索和问题回答、实时数据集成、地理丰富等。
     在 2015 年之后,与深度学习(如卷积神经网络、生成对抗网络模型、图神经网络)相结合的地理空间科学研究不断涌现。如今,机器学习已经成为地理信息中空间分析的核心组成部分,用于分类、聚类和预测,深度学习和人工智能算法已成功开发并应用于许多地理信息应用。DL 正在与地理空间数据集成,根据数据类型的不同,有不同的 AI 方法用于分类、语义分割或对象检测,通过图像分类、目标检测、语义和实例分割,从卫星、航空或无人机图像中自动提取有用的信息(Pierdicca and Paolanti, 2022)。
    地理空间位置是关联多专题图层(天气、水文、土壤、城市建筑等)、多要素(人、事件、地理对象)、多异构数据(图像、文字、视频等)的纽带,将人工智能技术应用于地理空间研究主要有空间隐式模型和空间显式模型两类建模方法。空间隐式模型是指在构建人工智能模型的过程中只把地理空间位置当作多维度特征向量中的普通维度,没有把空间位置特殊对待或没有把空间关系和其他空间约束引入模型。比如把地理坐标带入一个简单的 K 均值聚类模型只属于空间隐式机器学习模型,但是如果利用 Delaunay 三角网构建空间约束的聚类模型则属于空间显式模型。举例来讲,一个包含城市地理位置和人口的数据集,如果是让机器仅基于人口数量进行城市排名,因为地理位置不属于分析对象的一部分,所以不是一个空间显式模型。相反,如果要回答人口密度高的城市是否在空间聚集在一起,则需要明确的空间分析视角,所以是一个空间显式模型。
    研究已经表明空间显式的人工智能模型要比不考虑空间的经典机器学习模型在计算机图像分类等视觉任务和基于地理知识图谱的智能归纳推理任务中的表现更加优越。因此,在开发新的机器学习模型支持地理空间的知识发现和智能化决策时,我们需要思考如何结合地理空间数据的特性和人工智能模型的特点计出合理的模型。成功的 GeoAI 研究必须通过建立空间显式模型来解决重要的地理空间,还要展示如何将符号和子符号级别上开发的图形数据和新方法集成到当今的 GIS 工作流程中(Janowicz et al., 2020)。关于空间数据智能大模型的研究主要集中在空间表征学习、时空预测和空间插值、对地资源环境监测、地图学和地理文本语义分析等方面(高松,2020)。
(1)  空间表征学习
    许多机器学习算法的成功通常取决于数据表示和特征工程的质量。因此,空间特征学习
或表征学习对研发空间显式人工智能模型和推动 GeoAI 的创新发展尤为重要。研究者们利用表征学习技术提取出潜在的地理空间特征提高机器学习模型的预测准确率:Yan 等提出 Place2Vec 模型,采用自然语言处理的思路对于地图兴趣点数据(POI)、建筑环境和周边区域上下文语义进行特征表示学习,进而提升关于场所信息检索和智能推荐的能力,并把模型输出作为机器学习特征输入来进行城市土地利用分类;Liu 等提出 Road2Vec 模型,基于大规模的出租车运营轨迹数据,对道路之间的隐性交通相互作用关系进行量化,可以捕捉潜在的空间异质性和非线性交互特性进而提升路段的交通量预测准确率;Crivellari 和 Beinat 提出 Mot2Vec 模型,对利用大规模人群移动数据进行训练生成活动场所的特征向量进行表示,进而刻画场所的关联特性和相似性;Jean 等介绍了应用于遥感数据的 Tile2Vec 模型,是一种无监督的表征学习算法,它将自然语言处理中的分布假说(即出现在相似上下文语境中的词往往具有相似的含义)扩展到空间数据分布中,通过空间表征学习显著提高了预测任务
(比如土地覆盖类型、发展中国家贫困区域识别)的性能;Mai 等创新性地提出多尺度空间位置编码方法 Space2Vec,通过表征学习模型来编码地方的绝对位置和空间关系,发现该模型在位置建模和图像分类任务中的表现优于成熟的机器学习方法。
(2)  时空预测和空间插值
    时间和空间预测的基本思想是根据多维属性变量估计一个目标对象或地理变量在未知时间或地点的数值。空间插值则是 GIS  中常见的空间分析功能,利用已知位置的属性数值推测未知点相同属性的数值。传统的空间插值方法包括:反距离加权(IDW)、三角不规则网络(TIN)、和克里金法(Kriging)等。运用机器学习和深度学习方法来探索时空间预测和空间插值的新方法,已经在测绘、社会感知、智能交通等领域。Zhu 等设计了一种新型的深度学习架构,命名为用于空间插值的条件编码器-解码器生成对抗神经网络(CEDGANs),并应用于DEM 中的高程空间插值;Li 等从稀疏采样的手机位置数据中提取人群活动地点和移动模式并提出新的模糊长短期记忆网络轨迹预测模型(TrjPre-FLSTM);Bao 等基于带有地理标签的社交媒体数据构建了一个基于空间聚类和深层神经网络的 BiLSTM-CNN 模型来提升用户区域位置的预测精度;Liang 等引入时间动态属性改进了经典的商业地理哈夫模型并结合位置大数据对顾客到访商店的时空概率进行智能估算;Xing  等提出了一个通用的空间数据驱动的端到端智能预测框架 Neighbor-ResNet,基于遥感影像多层特征感知区域景观物理特征来进行人类活动量的估算;Pourebrahim  等比较了空间相互作用重力模型和卷积神经网络在出行空间分布预测上的表现;Yao 等对比了空间相互作用的多个经典模型和图神经网络模型在空间点对交互流预测上的性能。同时考虑到人类出行活动主要沿着道路交通网络,基于交通网络的相关研究也非常丰富;Murphy 等利用卷积神经网络(CNN)对给定出行路线上的GPS 轨迹数据的距离误差进行分类,以方便有条件地选择使用原始 GPS 轨迹数据和地图匹配后的路线作为驾驶路径的最佳估计;Zhang 等基于城市中的大量街景图片数据训练深度卷积模型进行沿街的交通流量时空类型预测;Zhang 和 Cheng 提出基于图深度学习的稀疏网络时空点过程预测模型 GLDNet,适合分析空间集聚特征明显但时间分布比较随机的交通事故、沿街犯罪事件等数据;对于稠密的时空数据,Ren 等提出了利用残差长短期记忆网络来进行城市尺度交通流量预测的模型;Zhao 等提出了一种新型的时空图卷积网络 T- GCN  用于交通预测任务,采用了图卷积网络 GCN  学习复杂的路网拓扑结构以捕捉空间依赖性,并利用门控递归单元GRU 来学习交通状态的时间动态变化以捕捉时间依赖性。随着多源地理大数据的出现,融合遥感数据和社会感知数据的研究也不断涌现。北京大学刘瑜教授团队提出了从"人-地-静-动"这四个维度并集成多源地理大数据和机器学习方法感知城市空间分异格局的理论和技术框架;Zhang 等利用机器学习方法融合社交媒体用户签到数据和城市街景图像,提出了从场所类型、访问量、人群信息、和周边环境多个维度定量刻画场所的智能分析框架支持挖掘不同特征的场所;Helbich 和 Yao 等结合城市街景与城市居民活动、
    调查问卷等数据源来进行多维度感知和城市动态建模,发现了环境视觉变量和人们精神状态的影响;Cao 等利用残差神经网络(ResNet)、空间金字塔池化方法(SPP-Net)和堆叠双向长短期记忆网络(LSTM-Net)对社会感知数据和遥感数据多维度特征进行学习并用于城市功能区域智能分类,同时比较了连接、元素相加、和元素最大池化三种不同的融合方法;Ye等融合社交媒体和街景数据进行城市功能的精准识别; Law 等融合开放街道数据 OpenStreetMap 和街景图片数据开发了一种卷积神经网络——街面网(Street-Frontage-Net)并用于城市街面质量的智能评估。
(3)  对地资源环境监测
    近年来,全球范围内对地观测卫星数量激增,基于卫星遥感和航空影像的观测数据量剧增,对于调查和动态监测土地资源、森林覆盖、环境变化,分析城市扩张和土地利用变化趋势等提供了丰富的观测数据源。同时,多源、多时相、多波段、多分辨率的遥感数据特点也给实际应用分析带来一定的挑战。多种利用深度学习模型结合多源遥感数据提取时空间特征的方法正在探索。Reichstein 等建议将物理过程模型与数据驱动的机器学习耦合关联形成混合建模方法;Scott 等采用了迁移学习和网络调优技术、数据增强技术与深层卷积网络模型结合提高土地覆盖的分类精度; Huang 等提出了一种半转移深层卷积神经网络模型 STDCNN,并从 WorldView 高分辨率影像中生成了高精度的城市土地利用地图;Peng 等设计了基于图斑相似性的卷积神经网络 PSNet,利用光谱反照率数值而非原始图像数值进行模型训练,降低在光照不一致造成的数值误差;Yuan 等讨论了多源遥感大数据、时空信息和深度学习模型的多种融合方式。
    同时,地理大模型在国际上也引起了广泛关注,2023 年 8 月,针对地理空间大模型的关键因素、如何有效预训练大模型、利用训练数据的不同特征在地理科学领域推广等难题, IBM 联合 NASA 开源了地理空间大模型 Prithvi。模型基于 NASA 的 Harmonized Landsat Sentinel-2(HLS)卫星影像,实现了多时相影像重建,开展了洪水、火灾及其他地理场景变化的高分辨率地图应用,揭示了环境发展变化过程。该模型采用 ViT 架构和掩膜自动编码器(Masked AutoEncoder,MAE)学习策略开发的自监督编码器,训练连续的 HLS 影像。模型包括跨多个 patch 的空间注意力以及每个 patch 的时间注意力,既能考虑不同区域的空间位置关系,又能考虑同一区域的时间演变规律(Jakubik et al., 2023)。
(4)  地图学
    大数据与人工智能时代推动地图科学的创新发展,主要包括以下几个方面。第一,利用深层卷积模型可以自动提取地图和影像上的多类别地物目标、地图符号和文本标注信息。第二,利用强化深度学习方法可以精确标注当代地理要素在历史扫描地图上的空间位置。第三,利用生成对抗网络模型可以进行地图样式风格的迁移学习,地形图的阴影自动渲染,并利用合成信息来改进制图风格设计或实现国土安全领域的地图位置电子欺骗。第四,人工智能与地图设计的整合可能会部分地实现制图综合的自动化工作流,比如建筑物多边形的简化与聚合、道路网的线简化与按联通性合并等步骤。此外,类脑计算和脑机接口(brain computer interface,BCI)等新兴技术的发展,使得地图学与神经科学的深度交叉结合成为了新的发展途径,利用认知神经科学的方法和成果分析地图,同样促进了地图和地理信息领域与人工智能的融合与深度应用(钟耳顺,2022)。
(5)  地理文本语义分析
    基于地理文本的数字地名词典和非结构化的地理文本数据在地理信息检索、时空知识组织和位置数据驱动的智能决策方面发挥着重要的作用。大多数地名词典数据库都是由权威机构采集制作,数据量大、制作成本高、更新周期较慢,如何从海量自然语言文本和社交媒体大数据中自动采集和提取地理文本信息显得非常重要。地理文本数据语义分析主要步骤包括地名识别、地名解歧和匹配、空间坐标提取等。Hu 总结了用于地理文本数据处理的多种分
析方法,如主题建模、基于规则的匹配、深度学习模型等。地理文本语义分析的智能应用包括从用户文字评论中获取人们对场所和居住环境的意见和情绪表达,自动识别与理解用户空间查询语句并进行智能推荐 GIS  空间分析功能和匹配操作工具等。此外,采用改进的深度学习模型来分析带有地理标签的社交媒体文本数据可以更精准的提取自然灾害期间用户所在位置,辅助灾害应急响应决策与救援工作。
    大模型作为人工智能技术的前沿成果,在自然语言处理领域得到广泛应用,例如文本分类、情感分析、摘要生成、翻译等,可以用于自动写作、聊天机器人、虚拟助手、语音助手、自动翻译等多个方面,并且在文本处理、图像识别、多模态数据处理等各个领域有着广泛的应用。目前,大模型正在彻底改变自然语言处理任务的状态,催生出更强大、更智能的语言技术,逐渐成为推动技术和社会发展的核心力量。

转载请注明出处。GIS帝国网站报道中出现的商标及图像版权属于其合法持有人,只供传递信息之用,非商务用途。

1.GIS帝国遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
网友点评
精彩导读