PNAS:深度学习提升生物多样性制图的前景
期刊:PNAS
中文题目:深度学习使生物多样性制图的前景更加清晰
英文题目:Deep learning sharpens vistas on biodiversity mapping
作者:Thomas J. Givnish
发表日期:2024年9月30日
作者Thomas首先说明了深度学习在各领域的优势,可以通过检测和分析复杂数据来挖掘出预测因子与被预测变量之间的最优的拟合方法,并且可以有效避免过拟合。其次,在生态学领域,遥感技术可以在多尺度上收集物种、功能特征、生理生化参数、群落组成、多样性及生态系统生产力等海量空间结构信息,同时还能揭示这些信息的时间变化趋势。而遥感技术应用的挑战在于很难利用无人机、航空或卫星搭载的传感器来获取生态系统中稀有或底层物种的遥感信息特征。
作者Thomas主要评论了Gillespie等人利用深度学习算法准确预测不同空间尺度下常见、稀有或林下植被物种分布。该项成果在加利福尼亚州的应用得到了很好的测试结果。Gillespie等结合高分辨率彩色和红外航片、气候数据以及数十万个地理定位的物种信息,通过在属和科的级别上训练神经网络在不同空间尺度上预测物种和相关分类群落的分布信息。Gillespie等提出的Deepbiosphere卷积神经网络模型预测了北加州沿海红杉、南加州地中海气候区的多种树木和灌木、年轻和老龄红杉林的底层植物。此外,Deepbiosphere模型的预测物种分布的结果精度比Maxent、Inception、随机森林等模型更为准确,尤其是在稀有物种中的效果。Deepbiosphere模型考虑了气候数据和遥感数据以及系统发育和共生数据,可以在较大区域内进行更多物种分布的预测,同时能够利用长时序遥感数据来反映动态变化。
在未来,Deepbiosphere模型可以利用信息量更多的多光谱或高光谱遥感数据、基质以及土壤或地壳等地理要素来进行更精确的物种分布模拟。同时也可以整合空间和时间维数据,特别是景观要素、迁移走廊、物种间的互动及自扰动等时间信息,来改进模型预测受碎片化、边缘效应及演替动态影响强烈的物种分布。
Deepbiosphere模型相关文献介绍:
Deep learning models map rapid plant species changes from citizen science and remote sensing data
作者:Lauren E. Gillespie, Megan Ruffley,Moises Exposito-Alonso
摘要
全球植物生物多样性因栖息地破坏和气候变暖而发生迅速变化。然而,现有方法难以在足够的空间和时间分辨率上检测单一物种的变化。Gillespie等开发了一种基于深度学习的方法,结合公民科学数据,能够从高分辨率卫星或航空图像中检测数千种植物物种。该方法可以在加利福尼亚州以米级和亚米级分辨率检测单个物种,并捕捉植物群落组成在时空上的快速变化。该方法为高效的上空植物多样性绘制提供了可扩展至全球的监测系统。
方法
从Global Biodiversity Information Facility (GBIF) 收集了2015到2022年间的植物物种观测数据,经过过滤后,最终包含了约65万条高质量的植物物种观测记录。利用国家农业影像计划(NAIP)的RGB-红外航空影像,以1米的分辨率生成256 x 256像素图像。然后,结合19个来自WorldClim的生物气候变量,通过修改后的残差网络(RS TResNet)模型处理多标签图像分类。模型分别利用气候数据、遥感影像数据以及两者结合的数据进行训练,并通过多头架构将TResNet与多层感知器(MLP)模型结合,形成Deepbiosphere模型。针对数据中常见的观测偏差,采用了采样偏差感知的二元交叉熵损失函数,使模型更好地适应数据的不完整性。
图1 利用训练的深度神经网络预测多个植被物种分布
结果
(1)高分辨率植物分布预测:通过深度学习模型“Deepbiosphere”,本研究成功在数米分辨率下预测2000多种植物的存在情况,涵盖从红杉森林到高度碎片化的景观。与传统物种分布模型相比,Deepbiosphere在准确性上具有显著提升(如AUC值从0.88提升至0.95)。
图2 加利福尼亚州各物种分布范围预测
(2)栖息地碎片化与火灾影响检测:本研究应用Deepbiosphere在加利福尼亚州进行栖息地碎片化和火灾影响的高分辨率检测,结果表明Deepbiosphere优于传统的物种分布模型(如Maxent和随机森林),该方法能够精确识别火灾对植物群落组成的影响。利用2012年和2014年发生森林大火的前后图像生成时空变化的估计,发现烧毁区域内的物种组成变化更为显著。
图3 探测加利福尼亚州大火后植被群落的快速变化
(3)多物种检测和分类提升:通过邻居填充和多标签优化,Deepbiosphere显著提高了稀有物种的检测精度,使得其在分类中对物种、属、科等层级具有更好的泛化性。
图4 利用Deepbiosphere和Maxent模型对门多西诺县红山附近大叶杜鹃的分布预测对比
研究意义
本研究展示了结合社会数据和遥感数据的深度学习在生物多样性监测中的巨大潜力。Deepbiosphere能够实时监测植物群落在细微栖息地变化(如碎片化、火灾等)下的响应,填补了全球生物多样性监测在空间和时间分辨率上的空白。此外,研究提出了将模型扩展到其他生物类群的潜在方向,以帮助全面理解生态群落的复杂相互关系。未来,该方法将结合更多数据和公众观测以构建开源的基础模型,为全球生物多样性保护提供支持。
创新点总结
(1)深度学习架构的改进:“Deepbiosphere”深度学习模型整合了遥感数据和公民科学观测数据,并通过改进的残差网络(RS TResNet)和采样偏差感知损失函数来增强模型性能,特别是对数据缺失的处理,能够在米级分辨率上监测单一及多物种的时空变化分布。
(2)高效的实际场景应用:通过邻居填充、采样偏差处理和多标签分类,解决了公民科学数据中普遍存在的稀有物种观测不足的问题,使模型对栖息地异质性较强的物种具有更高的检测精度。首次在大型生态系统中验证了深度学习对自然灾害(如火灾)影响的检测能力,证明其能够在碎片化的复杂景观中进行实时生物多样性监测,为环境保护决策提供了科学依据。
文献来源:
https://doi.org/10.1073/pnas.2416358121(Deep learning sharpens vistas on biodiversity mapping)
https://doi.org/10.1073/pnas.2318296121(Deep learning models map rapid plant species changes from citizen science and remote sensing data)
声明:以上中文翻译为译者个人对于文章的概略理解,论文传递的准确信息请参照英文原文。
撰稿人:王景旭
审核:杜军
终审:鲁鹏