近年来,人工智能(AI)蓬勃发展,在计算机视觉、自然语言处理和机器翻译等任务上,AI的准确性甚至超过了人类。深度学习是AI领域目前研究的热点,深度学习与GIS融合能够更高效地解决现实问题,比如在精准农业领域帮助提高农作物产量、通过预测模型助力警务打击犯罪等等,因此也创造了前所未有的巨大机遇,具有广阔的应用前景。
近日,新一代国产地理信息平台GeoScene 2.1正式发布,在地理人工智能GeoAI方面实现了重大技术突破。GeoScene平台和深度学习结合的重点目前主要在计算机视觉领域,可以实现基于卫星遥感、航空航天、无人机图像、激光雷达点云等的目标识别和图像分类任务。平台提供端到端的深度学习解决方案,从样本制作、到模型训练、推理分析以及结果后处理,提供了丰富的产品、工具、APIs,无论业务人员,还是数据科学家,亦或开发者,都能选择合适趁手的“兵器”,体验深度学习的魅力,尽享智能化带来的乐趣。
具体来看,GeoScene全流程的GeoAI支持样本制作一键导出,提供即拿即用的样本标注工具和样本导出工具,可将GIS数据导出为深度学习框架所支持的样本;训练模型丰方面,内置丰富的模型,如SSD、Unet、MaskRCNN、Deeplab、PointCNN等,无需切换环境即可训练;推理方面,提供多种推理工具,支持场景实现,支持服务器端分布式推理及GPU推理;精度评估方面,通过使用深度学习工具将检测到的目标与地面真相数据进行比较,计算深度学习模型的精度,如目标检测结果精度计算。
图1 GeoScene全流程的GeoAI赋能敏捷应用
2.1版本中,为了满足更丰富的应用场景需求,平台也在不断扩展高质量深度学习模型的类型、数量。目前内置模型达到20余种,覆盖了图像分类、图像翻译、变化检测、语义分割等应用方向,新增支持道路提取、变化检测、影像翻译等深度学习算法模型,全方位赋能用户业务应用升级,使得驱动数字化转型的过程更加高效和智能化。
以道路提取为例,MultiTaskRoadExtractor模型是一个像素分类模型,与传统的像素分类不同的是,此像素分类专门针对于道路。就像是模型名称一样,模型的另外一个特点是多任务。先来看一下模型结构:
图2-1 MultiTaskRoadExtractor模型结构
此模型结构属于编码器解码器结构,但是在解码的时候,一部分用来生成语义掩膜,另一部分解码器则去做了道路拓扑与道路连通性检查。做的事情如图2-2所示:
图2-2 拓扑与道路连通性检查
在图2-2b中可以明显的看到红圈内为道路断点,在拓扑上与道路连通性上都有问题,所以通过检查将语义分割掩膜完善,进而完善模型。
再看下变化检测,变化检测是深度学习计算机视觉领域一个小方向,其所做的事情顾名思义,提取出两幅不同时向变化的地方(如图3-1)。一般来说,变化检测根据场景以及人们的关注可以分为单类别变化以及多类别变化。单类别的常见场景如建筑物增减变化,多类别的常见场景如国情普查数据变化。
图3-1:变化检测
GeoScene中的变化检测模型ChangeDetector来源于STANet(2020年5月发布),模型整体架构如图3-2所示:
图3-2:STANet模型结构
从模型结构上可以很清晰的了解整个模型工作流重点。整体模型是一个类似Unet的编码解码过程,其中比较重要的是两期影像先进行特征图提取后会经过特定的注意力机制模块。图3-2中的I为输入的两期影像数据,X为提取的特征图,Z为经过特定的注意力机制之后的特征图,Metric Module为损失函数,P为最终的语义图。在特征图提取时的backbone是ResNet家族,代表着可以选择任意ResNet家族的backbone应用于模型。此模型适用于单类别变化检测,如建筑物增减、查违拆违等业务场景。
图3-3:变化检测实例
6月3日至4日,2021年易智瑞空间信息技术开发者大会将在北京举行。届时,全新发布的GeoScene 2.1将重磅亮相,进一步激发广大开发者创新活力,为各行各业数字化转型提供重要支撑。届时,大会将对GeoScene在GeoAI方面的最新进展进行深入解读,并对新版本中提供的丰富AI模型进行应用展示。
转载请注明出处。