cl991036
管理员
管理员
  • 注册日期2003-07-25
  • 发帖数5913
  • QQ14265545
  • 铜币29653枚
  • 威望213点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • GIS帝国铁杆
阅读:1843回复:1

数字地球与地学知识创新

楼主#
更多 发布于:2003-09-12 17:29
张健挺


随着地球空间数据的获取手段飞速发展,对这些数据的处理已远远超过传统的人工处理模式的能力,从大量数据中自动快速有效地提取模式和发现知识显得越来越重要。正如John Naisbett所说,“我们已被信息所淹没,但是却正在忍受缺乏知识的煎熬”。数据挖掘与知识发现的出现很好地满足了地球空间数据处理的需要。GIS作为地球空间数据管理的重要性已得到地学研究领域广泛的认可和重视,但是GIS分析功能的不足一直是制约GIS广泛应用的瓶颈。在GIS数据库平台和它的基本空间分析功能的基础上根据地学空间数据的特点,将机器学习算法引入GIS,形成自动化、智能化的地学空间数据挖掘与知识发现的通用模型对于增强地学数据处理能力和提高GIS的应用水平都具有非常重要的意义。

一般而言,数据挖掘和知识发现的方法可分为如下几种类型:(1)分类,如自然地理综合区划,农业区划和灾害风险区划等。(2)回归,如各种社会经济指标的单变量和多变量回归分析等。(3)聚类:如各种遥感影像的非监督分类方法。(4)概括(或称泛化):寻找描述各数据子集共性的方法,如沿着土壤分类中土类到亚类的概念层次顺序进行统计,寻找各亚类土壤在土类层次上的共性。(5)依赖模式:寻找描述变量间显著依赖关系的模式,如土壤盐碱化与地下水位的依赖关系。(6)变化和偏离检测:从与以前数据对比中发现显著变化,如多时相遥感影像的变化监测,区域城镇体系的变化等。

数据挖掘与知识发现的主要方法有:(1)基于决策树分类的ID3和C4.5方法。(2)基于贝叶斯概率的非监督分类Autoclass方法。(3)用于概括的AQ15和CN2方法。(4)解决不精确、不确定知识的粗糙集(Rough Set)方法。(5)大量人工神经网络方法,如经典的反向传播〔BP〕算法,自组织映射(SOM)算法等。(6)用于产生关联规则的Apriori的方法。(7)贝叶斯概率网络学习方法。

地学数据与其它类型的数据一个重要区别就是它的空间特性。目前在地学数据分析中对空间特性的处理主要有以下几种方法:(1)将空间作为框架,同一区域范围内不考虑空间要素,静态研究如各种区域统计指标计算,动态研究如系统动力学模型等。(2)利用空间统计方法,如变异函数,空间自相关指数 Moron I和 Gray C等,探讨空间分布的特征。(3)将空间要素转化为一维属性要素参与分析:如距离、方向等用于主成分分析,多变量相关等。(4)空间要素作为属性要素的乘积因子:如交通中的等到达时线,水文中的等流时线等。(5)将不同要素的图层进行空间配准后采用GIS中的覆盖(Overlay)方法,形成规则网格或最小图斑单元然后参与一般分析,不再考虑空间因素。

目前国内外都开展了地球空间数据挖掘与知识发现方面的研究。加拿大西蒙.法拉色大学计算机科学系的Han Jiawei教授领导的小组在MapInfo平台上建立了空间数据挖掘的原型系统,实现了空间数据特征描述、空间比较、空间关联、空间聚类和空间分类等空间数据挖掘方法。国内武汉测绘科技大学李德仁教授最早关注到从GIS数据库中发现知识的问题,提出从GIS数据库可以发现包括几何信息、空间关系、几何性质与属性关系以及面向对象知识等的多种知识。他认为数据挖掘同时也使得GIS的有限数据变成无限的知识,用KDD可以进行GIS的数据精炼和数据更新,使GIS成为智能的信息系统。

总之,随着地学空间数据的急剧增多,地学空间数据挖掘与知识发现作为地学研究与数据挖掘研究的结合点将成为研究热点之一。地学空间数据挖掘与知识发现的分析方法和应用结果对于对于建立在“数字地球”之上的地球信息机理研究具有重要的意义,将为全球变化和区域可持续发展提供有力的分析工具。
喜欢0 评分0
没钱又丑,农村户口。头可断,发型一定不能乱。 邮箱:gisempire@qq.com
游客

返回顶部