版权归原作者所有,如有侵权,请联系我们

人工“智能”—数字地球到信息地球的推进“技”

上传时间:2018-12-18 14:07 来源:(航空物探遥感中心) 作者:闫柏琨

简介:

当今,全球变化问题及形势得到前所未有的关注,其发展趋势及背后驱动力争论不休。地球系统科学方法论应运而生,力求以系统论、整体观出发研究“岩石圈、土壤圈、水圈、生态圈、大气圈”之间物质与能量循环与交互,以及与人类活动间的影响制约规律。对地观测技术是重要支撑,可获得地球现状、变化的宏观监测数据。近二十年来,卫星与遥感器快速发展,对地观测网初显规模,数据匮乏的问题大大缓解。数据利用率与信息转化率低、信息综合与认知能力弱的矛盾更加凸显并将长期存在。“大数据闲置”成了行业内普遍关切的难题。近几年来人工智能技术爆发,在图像与语音识别、大数据分析、人机对弈等方面的巨大成功,无疑是雪中送炭。对地观测领域专家勾绘出了基于人工智能与遥感大数据的智慧地球远大发展理念与构想。本文在介绍对地观测技术、数字地球的基础上,粗略分析人工智能的发展及本质,介绍了人工智能在推进数字地球向信息地球转变的思路、挑战及发展。

地球扫描仪:对地观测技术

地球如此之大,以致人类长期以来对自己赖以生存的地球缺乏全面深刻的了解。“天圆如张盖、地方如棋局”、“天似穹庐、笼盖四野”就是古人对天地宇宙的总结与认识。麦哲伦的环球航行,证实了地球是一个球体,颠覆了人们的传统认识。长期以来,人类一直梦想能站在高处看地球。上世纪50年代,人造卫星升空,60年代通过在卫星上搭载遥感器,拍摄了大量地球表面的图像。梦想成真,人们在感受地球之美的同时,更为过度开发利用造成的“千疮百孔”而焦虑(图1),更加刺激了人类搭乘卫星顺风车,“多、快、好、省”地观测地球的热情。经过几十年的发展,逐渐形成了地球系统研究新技术—对地观测技术,也称为遥感技术(图2)。

                

1 大面积“农进林退”(左:2015年,右:2017年)

对地观测技术是搭载卫星、飞船、飞机等平台,利用电磁波谱对地球进行观测的技术体系,包括观测数据的采集、处理、分析、展示等(图2)。根据信号源的不同,可分为“主动遥感”(电磁信号由遥感器发射至地表并反射回遥感器)、“被动遥感”(电磁信号源自太阳或地物辐射)两种,观测对象包括大气、陆地、海洋,获取的数据包括温度、影像、物质成分、地形等,应用领域包括气象预报、国土普查、作物估产、森林调查、地质找矿、海洋预报环境保护、灾害监测、城市规划、地图测绘以及军事侦察、导弹预警和战场评估等方方面面。

2 对地观测示意图(引自维基百科网)

由于广阔的应用领域与巨大的应用价值,各国十分重视对地观测技术,特别是卫星对地观测技术的发展。据统计,截止到20166月美国在轨运行的地球轨道卫星共576颗,其中政府132颗,军方146颗,商业卫星286颗(据泰伯网,2017年)。目前我国各方面提出的商业卫星计划中发射卫星总数达(包括即将发射)约近300颗。随着各国政府国防增加利用商业数据源的支持,尤其是美国,全球商业遥感卫星数据市场业务收入也得到了快速的发展。数据显示,2008年全球商业遥感卫星销售收入为7亿美元,至2016年上升到了20亿元,年复合增长率超过14%(据搜狐网,2018)。

卫星发展的多元化趋势正在加剧,主要表现在探测方式、工作谱段、技术指标等方面的多样化。在高空间分辨率商业遥感领域,“微小卫星群”是目前的热点与新宠,其特点是卫星具有体积小、价格低廉,可以 “一箭多星(甚至百星)”的方式发射入轨,最大的优势数量庞大的卫星观测网可实现对地球进行高空间分辨率、高时相分辨率的“双高”与“扫描式”观测,是名副其实的地球扫描仪。以美国PlanetLab公司为例,预计今年将拥有数以百计的Dove卫星(250px x 250px x 750px)(图3),组成了全球最大的微小卫星观测网,是世界上唯一具有全球高分辨率、高频次、全覆盖能力的遥感卫星系统,有望实现一天全球覆盖,最大特点是可以为客户提供快速更新的商用卫星影像(据百度百科词条,2018)。

3 鸽子卫星(引自百度百科)

预计随着卫星观测网的增扩、互联,甚至智能化发展,地球上发生的一起变化将再也无法躲避卫星的“实时扫描”。

数字地球:海量数据的虚拟地球

顾名思义,数字地球是“数字化的地球”,是以数字的形式在互联网上记录地球过去、现在甚至未来的状况,最早由美国副总统戈尔于1998年在加利福尼亚中心开幕典礼上发表“数字地球:认识二十一世纪我们所居住的星球”的演说时提出。在戈尔的演说中,将数字地球看成是“能够放入大量的地理数据、三维不同分辨率遥感影像”的集地理信息系统、遥感、互联网、虚拟现实等技术在内的系统工程概念。数字地球概念提出后,引起了世界范围内科技界的重视,很多专家对其定义、构成进行了分析解读。中国有关专家迅速跟进,开展全方位的数字实践,开展了数字城市、数字林业、数字农业、数字滑坡、数字地质、数字矿山、数字地理、数字桥梁、数字海洋、数字水利等研究,“数字”概念深入各行各业。

与此同时,美国以遥感影像数据库、宽带数据网、超级计算机为切入点开展了遥感数字影像地球系统的构建,谷歌公司于20056月推出首款Google Earth软件,使人们可以从“上帝”视角俯视地球、玩转地球,这带给了每个人从未有过、从未想象的奇妙体验。现在,谷歌地球在大多数年轻人工作、生活中必不可缺少。Google Earth发布后,世界网民为之沸腾。有人评价说:“(它)让任何一个普通人都可以从高空俯视我们生存的这片大地,获得了前所未有的震撼视角,有一种上帝的感觉。”。戈尔副总统在竞选美国总统失败后的次年,加入谷歌公司担任高级顾问。戈尔从加盟谷歌到谷歌推出Google Earth软件期间,具体做了些什么,Google Earth软件的推出中戈尔起了怎样的作用,无从得知。但偶然背后一定有某种必然与联系。

困局:数据海洋难解信息之渴

随着对地观测技术体系的发展,遥感影像数据量急剧增加,呈几何级数增长。但是,由于遥感信息挖掘技术严重滞后,海量数据难以及时转化为有效信息,大量数据不仅得不到有效利用,还会造成极大的存储压力,形成了某种意义上的“数据灾害”。

20182月搜狐网发布了“空间‘大数据’缘何为美军造成困扰”一文,指出:“空间大数据为美军提供便利的同时,也带来了诸多困扰和挑战……困难存在于数据的获取、存储、搜索、共享、分析和可视化等诸多方面”。20168月,《人民日报》发表文章:《别让卫星在天上“空转”》,指出:过去,国家把重心和投入放在卫星、火箭技术的创新研制上,对地面管理系统的关注较少。要想天上的卫星既发好又用好,就要重视和加强地上的工作。人民日报2016年发文《别让卫星在天山“空转”》,指出要加强应用系统技术的创新,最大程度发挥卫星的作用。有专家形容“我们已进入了信息时代,丹是我们却淹没在数据的海洋里,渴求着信息的淡水”,据统计我国遥感数据信息利用率不足5%(李大庆,2011,科技日报)。在遥感信息挖掘中,“数据闲置”最突出的首当其冲的是中-高分辨率遥感土地覆盖与变化监测。目前仍是通过人工图像分析与判读来解决问题,效率与数据利用率很低。

目前,遥感影像自动解译与判读难的问题突出表现在遥感影像特征表达、场景理解、目标分割、变化检测等技术没有根本上的突破,形成工程化的应用技术。地表覆盖分类与信息提取是最早发展的遥感应用技术,主要基于最大似然等各种统计算法对遥感信息(辐射、纹理与时间信息)进行分类识别。但由于地物光谱与辐射特性的复杂性,“同物异谱、异物同谱”现象广泛存在,一直是遥感科学家与技术专家难以逾越的大山。为了提高分类效果,科学家想法设法在光谱信息的基础上,融入地物纹理、时间变化信息,但提升效果有限,导致长期以来难以形成高精度的地表覆盖分类遥感产品。宫鹏教授为首的团队在充分运用世界范围内大量先验知识与样本的情况下,编制了全球30米尺度分辨率地表覆盖分类遥感产品(图4),为全球变化、生态环境保护等提供了基础数据。由于没有高级的语义分析与总结能力,仅从光谱与辐射特征、影像细节纹理特征,传统的分类算法很难分析影像特征的不一致的原因是目标的变化,还是光照等其他因素的变化(图5),因此分类分割效果欠佳。

4 全球30米尺度分辨率地表覆盖分类遥感产品(引自:引自宫鹏教授团队论文)

5影像特征变化是地表覆盖精细分类的最大难题

而且,上述分类方法需要大量的先验知识与样本支撑,且未充分应用地表纹理及场景特征,难以应用于高空间分辨率遥感影像处理,且分类精度不足以支撑更加精细的应用研究、土地利用管理、大众应用需求等。因此,如不能另辟奇径,“海量数据与信息贫瘠并存”的困局将难以破解。

人工智能:跨越“数字信息”的桥梁

以深度学习人工神经网络为代表的人工智能技术(深度学习技术)近年来快速发展并有了突破性的进展。有望充分学习利用遥感数据的光谱、辐射、纹理、形状、场景等全方位信息,实现目标、地表覆盖的高精度分类识别与变化检测。

人工智能是由人类创造、可解决数学理论方法难以定量描述的复杂问题。人工智能对信息进行智能化处理的基本模式主要分专家系统与神经网络两类。专家系统分词法是通过专家知识的表达、逻辑推理实现信息处理。神经网络是对人脑神经网络进行模拟,具有自主学习能力的数学网络模型。典型的神经网络模型包括输入层、隐含层、输出层(图6)。隐含层数越多,学习能力越强,以往由于计算机计算能力及学习方法的限制,人们无法训练隐含层数超过一层的网络。近10年来,由于网络训练学习方法得到改进,网络结构得到优化,硬件计算能力显著增强,人们可训练更深的网络,目前最深的网络已达1000多层。

深度学习技术已在医学影像、街景图像的目标识别分割中得到的成功应用。图像识别精度已达甚至超越人类,目标分割精度也可达到85%以上(图7)。

尽管在医学影像、街景图像分析中取得了显著成功,对于遥感图像分析,方法的简单移植可能无法达到理想效果。可能主要有三方面的问题有待研究:(1)不同时相数据的辐射变化及校正;(2)如何根据不同地物及目标、不同遥感数据(包括数据组合)设计最佳的网络结构;(3)如何设计合理的网络结构以充分充分利用光谱、辐射及其他辅助信息。

6 神经网络结构(L1为输入层,L2L3为隐含层,L4为输出层)

现实:没有智能的“人工智能”

人工智能是研究可以延伸、扩展甚至模拟人类智能的理论、方法、技术及应用系统的技术科学,最终目标是完全模拟人类的智能。人类的智能非常复杂,包括意识、自我、推理,以及智能背后的生物基础。

推理可分为归纳总结与逻辑演绎两种基本类型。神经网络属于归纳总结,专家系统数据逻辑演绎。在语音识别、知识竞赛、围棋等特定的领域,人工智能确实很大成功,甚至超过人类,使人对人工智能的理解出现了一定偏差,寄希望于人工智能技术解决人类难以解决的科学难题。以人工智能矿床预测为例,矿床的形成的物理过程复杂,涉及的要素多样,时间空间跨度大,致使矿床预测成功率较低,不同的专家预测方法相差较大。由于专家预测的过程、准则并不十分明确,不可清晰表达与描述的经验、认知、判断在其中起了很大作用,涉及到归纳、演绎两种推理模式的复杂组合。对于这类问题,对于这里问题,人工智能技术无能为力。对于普遍关注的地球系统科学问题,同样如此。准确的说,人工智能并不具备类似人的复杂的逻辑推理、分析、判断与思维能力。从这个意义上讲,目前的人工智能还是非常低级的智能形式,或者说低级人工智能。追求高级人工智能是我们的目标,但同时必须接受一个现实:当前,人工智能无智能。这也是本文题目中智能加引号的原因。

                 图像        人工分割    自动识别      自动识别

7 目标分割效果(引自:Zhao et al., 2017

前景:对地观测不再“视而不见”

目前尽管仍无基于人工智能的大区域尺度的地表覆盖及变化检测遥感产品问世,人工智能初步具备了图像特征分析、识别、理解的能力,一定会在遥感图像分割、目标识别、变化检测,甚至更深层次的信息挖掘方面发挥特有的作用,更准更快从遥感影像中提取地物的分布及变化信息,推动数字地球向信息地球发展。对地观测技术“视而不见”的困局将得到很大程度的缓解,甚至彻底破解。

分享到:
征集
关于我们
分享