阅读:1619回复:0
熊伟:迎接测绘地理信息“大数据”时代
拥有能够满足实际应用需要的地理信息数据是测绘地理信息事业的立业之基。地理信息数据在测绘地理信息事业中的重要位置不可替代,这既通过测绘地理信息工作多年的实践所检验和反映,也是由测绘地理信息工作的本质特点所决定。客观来说,没有地理信息数据,测绘地理信息服务无从谈起;没有海量、规模化、多类型的地理信息数据,测绘地理信息智能服务将举步维艰。在即将来临的“智慧中国”时代,拥有大数据量级别、高信息含量的地理信息数据是推进测绘地理信息服务走向智能化、智慧化由此转型升级的必经之路。
一、什么是“大数据”? 2011年3月29日,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》 (Big Data Research and Development Initiative),旨在提升利用大量复杂数据集合获取知识和洞见的能力,并将为此投入两亿美元以上资金。美国政府的这一惊人举动透露了“大数据”背后潜在的重要价值。那么,到底什么是“大数据”呢?借用百度百科、维基百科等搜索引擎网站的定义:大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 “大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和GoogleFile System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。总的来说,“大数据”主要有四个方面的特征:一是数据体量巨大,从TB级别跃升到PB级别。二是数据类型繁多,包括网络日志、视频、图片、地理位置信息等各种类型数据。三是价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。四是处理速度快,遵循“1秒定律”,即可从各种类型的数据中快速获得高价值的信息,这与传统的数据挖掘技术有着本质的不同。“大数据”的四大特征概括起来即4个“V”,即Volume(容量)、Variety(种类)、Value(价值)、Velocity(速度)。 二、测绘地理信息需要建立“大数据” “大数据”的发展是大势所趋,是建设智慧城市的客观需要,是开启智慧时代的必然要求。“大数据”的本质特征来看,每个行业、每个领域都可以建立专属的“大数据”。测绘地理信息是国民经济和社会发展的一个重要行业和领域,建立测绘地理信息“大数据”有着强烈的现实要求。 目前,测绘地理信息系统内已经积累了大量的地理信息数据:全国重力、三角、水准及GPS大地测量成果,包括2500余个2000国家GPS大地控制点,近5万个2000国家大地控制点,20余个重力基准点和120余个重力基本点,1600多个全国CORS站点;全球1:100万矢量数据、DEM数据(1995,2002版),全国1:25万DLG、DEM、DOM数据(1998,2002,2008版),全国1:5万DLG、DEM、DOM数据(2006,2010,2012版),各省(自治区、直辖市)覆盖重点区域的1:500-1:10000大比例尺地形图数据,西部挂图(1027个县)矢量和影像数据及各类专题数据等;超过500万张的航空影像数据,覆盖陆地国土超过7000万平方千米(含重复覆盖面积)的多种分辨率卫星影像数据,覆盖全部国土的10~30米分辨率卫星影像,对重点地区基本完成必要覆盖的优于5米分辨率的卫星影像数据,以及分辨率优于2.1米的225TB(截至2012年)的资源三号卫星影像数据。 这些丰富的地理信息数据是测绘地理信息工作服务大局、服务社会、服务民生的宝贵财富,近年来已在政府决策、公共应急救急、规划管理、重大基础设施建设、土地资源动态监测与调查管理、水资源和水利工程调查与监测、生态环境监测与管理、森林资源调查和森林灾害监测、地质矿产石油煤炭资源调查与监测、轨道交通规划设计、新农村建设、电力、航空航天、通信、地震、军事、气象、提高百姓生活质量等多个方面、多个领域发挥了重要作用。 虽然经过多年的努力发展,测绘地理信息系统已积累了大数据量级别和多种类的地理信息数据,但是,应该客观看到,在地理信息数据量和数据类型上还有巨大的扩展潜力;另一方面,现有地理信息数据的价值并未充分发挥出来,很多数据应用离智慧发展的要求还存在很大的差距,需要密切结合实际发展需要,充分挖掘地理信息数据的使用价值,更好地服务智慧中国的建设与发展。 三、怎样建立测绘地理信息“大数据” (一)扩展地理信息数据量和种类 测绘是指对自然地理要素或者地表人工设施的形状、大小、空间位置及其属性等进行测定、采集、表述以及对获取的数据、信息、成果进行处理和提供的活动。从本义上来说,测绘天然就是与数据打交道的,而且是与地表上所有的物体打交道,这其中蕴涵着非常巨大的数据量,符合“大数据”的特征之一。另一方面,近年来,在全世界范围内已逐渐形成一种共识:地球上人类活动中80%以上的信息都与地理位置有关,这既体现地理信息与其它信息之间强大的粘合度,也间接表明地理信息在信息容量方面的巨大扩展空间,可进一步去挖掘和提取与地理位置相关的各类数据和信息。 长期以来,测绘地理信息数据采集工作更多的都是侧重于测形状、测大小、测位置,对自然地理要素或者地表人工设施的属性数据和信息采集、挖掘的还不够深入。笔者认为测形状、大小、位置是获得基本的地理信息数据,测定目标物的属性数据将有助于获得更多重要信息,有利于拓展和提升测绘地理信息服务的领域和质量。举例来说,在测量建筑物的时候,如果仅对建筑物的位置、大小、形状(属性信息)进行测定,获得的数据、信息量和类别比较有限;如果增加建筑物的名称和变更史、年代、楼层数、用途、建筑结构、建筑面积、常驻人口等基于地理位置的综合属性信息,将扩充该要素的整体信息含量,进一步丰富测绘地理信息“大数据”。其中,地理位置、用途、建筑结构、常住人口等方面的数据和信息对于应对建筑物突发事件必不可少,是作出正确决策的关键参考要素;建筑物的名称和变更史通常隐含着丰富的历史信息,能够折射出某个企业、甚至某个行业、某个民族的发展史,意义重大。更深入一步,如果全面掌握和监测城市中每一栋建筑物的深度地理信息,将有助于全方位、系统、深入地展示城市建设发展现状、揭示城市规划建设与管理重点和方向,为智慧城市建设、城镇化建设提供重要的参考依据。 上文举例只是测绘对象中的冰山一角,现实工作中测绘涉及的对象众多,几乎涵盖地表上所有的物体,既包括自然形成的水系、地形、海岸线、土质和植被等自然地理要素,比如河流、湖泊、山脉、山峰、沙漠、森林、草原等,也包括人工建造的、非自然 形成的地表人工设施,如居民地、厂矿、学校、医院、公园、体育馆、旅馆、写字楼、道路、桥梁、隧道、水库、地上地下管线、高压电线杆、界桩、井盖等,如果将每个方面的信息加以衍生和扩充,测绘地理信息“大数据”将更加丰富和完备。例如,在测绘池塘的时候,不仅仅采集池塘的位置信息,还可以调查池塘利用情况、污染程度、水深、池塘位置的合理性等方面的属性信息;在测绘花坛的时候,不仅仅获得花坛的位置信息,还可以增加花坛中植物类别、生长情况、土质状况等方面的综合信息。 从另一个层面来看,地理信息数据的时空变化情况也是建立测绘地理信息“大数据”的重要内容,这赋予了地理信息生命特征。通过动态监测各类地理要素在时间维度的变化情况,能够极大地丰富地理信息的数据量,不是简单意义上的加减法,而是指数级的变化,所形成的庞大数据源,有助于对监测要素作出质变分析和科学判断。根据不同的现实需要,时空地理信息数据可以分文连续的和间断的,从根本上来说,它是一种动态的地理信息变化数据。实现智能交通,需要每时每刻监测汽车流在公路上的位置变化情况,这里面涵盖了以时间为单元的连续的、庞大的地理位置信息,同时结合路段限速、路段长度、汽车保有量、每日汽车最大出行量等综合因素,对整个区域的交通情况作出科学的管理和调度。实现农业估产,需要获取不同阶段的农作物生长情况,这里面包含着大量的时空地理信息数据,同时综合历史数据、气候和天气等多方面因素,科学计算农作物产量。推进城镇化建设,需要监测不同阶段的城镇发展变化情况,包括城乡边界的变化、城镇公共基础设施的变化、城镇房屋的变化、城镇道路交通的变化、城镇人口密度的变化、城镇生产力布局的变化等,所有这些涵盖了巨量的时空地理信息数据。总的来说,现实生活中需要时空地理信息数据支持的事例无处不在,山洪、泥石流、滑坡需要实时监测,停车场需要实时监测,沙漠化需要阶段性监测……。 (二)提升地理信息数据的价值挖掘能力 在“大数据”4大特征中,特别强调从各种类型的数据中快速获得高价值的信息,这是建立测绘地理信息“大数据”面临的巨大挑战。针对这一点,笔者认为可从以下几个方面着手。 第一个层面是要准确把握客观需求,做好定制服务。提供的是否是高价值的信息关键在于是否充分满足了用户的实际需要,是否能为用户提供更加智慧的服务。经济社会发展对地理信息数据的需求千变万化,不同的用户在数据需求上定会有微小的差异,要全面深入地了解不同用户对地理信息数据的不同需要,进而为其提供智慧式的地理信息数据服务。举例来说,如果某个用户只有每天获得海量卫星影像元数据目录的简单需求,那么就要竭尽所能地为用户提供便捷的获取方式,使其能够远程调用云端元数据目录,而不是让用户每次都要跑到卫星影像元数据目录存储中心拷贝数据。再比如,抢险救灾的分分秒秒、每一个细节都可能关乎受灾群众的生命安全,这就需要高效处理灾区道路、交通、房屋、地形等方面的变化数据,分析灾情现状和演变,快速提炼出抢险救灾所需高价值信息。 第二个层面是要深入挖掘地理信息数据的信息价值,为经济社会各领域各层次的发展提供智慧服务。人类社会的一切活动,包括经济活动、社会活动、产业活动等都是在一定地理空间范围内的活动,这些活动与地理空间位置密不可分。深入分析研究了这些活动数据与地理信息数据的关系,通过建立关联数据模型,就能基于地理空间分析功能提炼出各种高价值含量的信息和知识,促进各领域各方面的智慧发展。比如,通过监测分析某一地理空间范围内常住人口与流动人口的规模变化及趋势,进而研究分析该区域在食品消耗、垃圾处理、物流交通等方面的需求变化信息,为市场运行提供相关信息服务指导,就能够有效防止粮食的无谓浪费或粮食的供应不足、物流交通的无谓运行或运力不足、垃圾处理能力不足等问题,促进该地理空间范围内经济社会的智慧运行。通过将道路数据(静态)与汽车运行位置数据(动态)进行叠加分析和综合计算,借助卫星导航定位终端实时发布最佳行驶路线信息、驾驶时 间估算信息等,促进智慧交通运行,减少碳排放。 第三个层面是要发展海量地理信息数据快速处理和智能分析工具。从海量地理信息数据中快速提炼出高价值的信息,离不开数据处理能力的提升。构建基于网络的地理信息数据计算中心,充分整合计算资源,最大限度地释放计算资源的处理能力,能够有效 解决数据快速处理的问题。基于网络的地理信息数据计算中心可分为基于专网、局域网和广域网的数据计算中心,以满足不同类型用户的数据处理需要。另一方面,要开发基于云端数据中心的智能化终端设备,通过标准接口实现对网络的访问,快速获取云计算服务。该智能化终端设备内嵌GIS基础软件系统、专题GIS软件系统等,具备直接调用云端数据和信息、辅助地理空间智能分析的功能。 |
|
|