机器学习方法融合北半球长时间序列逐日雪深数据集(1980-2019)

Long-term series of daily snow depth dataset over the Northern Hemisphere based on machine learning (1980-2019)


在地球大数据科学工程专项时空三极环境项目第一课题“三极大数据共享与集成” (XDA19070100)资助下,中国科学院西北生态环境资源研究院车涛课题组利用机器学习方法结合多源雪深产品数据、环境因子变量及地面观测雪深数据等制备了北半球长时间序列逐日雪深数据集。

首先将人工神经网络、支持向量机和随机森林方法在积雪深度融合的适用性进行对比研究,发现随机森林方法在雪深数据融合上表现出较强优势。其次,利用随机森林方法,结合AMSR-E,AMSR2,NHSD和GlobSnow等遥感雪深产品及ERA-Interim和MERRA2等再分析资料格网雪深产品和环境因子变量等作为模型的输入自变量,用中国气象台站数据(945)、俄罗斯气象台站(620)、俄罗斯积雪调查数据(514)和全球历史气象网络逐日数据(41261)等43340个地面观测站点的雪深数据作为参考真值对模型训练与验证,在专项“地球大数据科学工程”提供的云平台上制备1980~2019年积雪水文年(上一年9月1日至本年度5月31日)的逐日格网雪深数据集。由于1980~1987年微波亮温数据为隔日数据,所以这段时间的数据会出现少量条带缺失现象。利用全球积雪模型对比计划及独立的地面观测数据进行验证,融合数据集的质量在整体上有所提升。利用地面观测数据及融合前的雪深产品对比来看,融合数据的决定系数(R2)从6种融合前产品中最高的0.23(GlobSnow雪深产品)提升至0.81,而相应的均方根误差(RMSE)和平均绝对误差(MAE)也减小至7.7 cm 和2.7 cm。


数据文件命名方式和使用方法

逐日的雪深数据是一个1440列和360行的矩阵,数据的空间分辨率为0.25°,NODATA_value用-9999表示。数据按照自然年逐文件夹进行存储,每年文件夹中包含当年的逐日格网雪深数据集,逐日雪深数据集用GeoTiff格式存储,雪深数据的单位为cm,投影方式为WGS84。其中1980年包含1980年9月1日至当年12月31日的雪深数据集,2019年包含2019年1月1日至当年5月31日的数据集,除此之外,所有文件夹均包含了当年1月1日至5月31日及9月1日至12月31日的数据集,6月1日至8月31日没有制备雪深数据集。文件名称为“ML_NHSD_YYYY-MM-DD.tif”,其中ML表示机器学习,NHSD表示北半球雪深,YYYY代表的为1980~2019的自然年,MM代表1~12月(除6~8月),DD表示日期。该文件可以用ArcMAP或QGIS等软件查看并进行相应的数据处理。1980~1987年NHSD雪深数据集及GlobSnow雪深数据集利用SMMR微波亮温数据,该亮温数据为隔日数据且存在大量条带缺失现象,尽管两种产品都已填充为逐日数据,但不可避免的都出现大量数据缺失现象而融合数据也出现了类似的情况。1988年之后的逐日雪深数据集尽可能保证了北半球陆地区域的完整性但在部分天数还是出现了轻微的缺失现象,格陵兰和冰岛等海岸带区域不在研究范围之内。


本数据要求的引用方式 查看数据引用帮助 数据引用必读
数据的引用

车涛, 胡艳兴, 戴礼云, 肖林. (2021). 机器学习方法融合北半球长时间序列逐日雪深数据集(1980-2019). 时空三极环境大数据平台, DOI: 10.11888/Snow.tpdc.271701. CSTR: 18406.11.Snow.tpdc.271701.
[Che, T., Hu, Y., Dai, L., Xiao, L. (2021). Long-term series of daily snow depth dataset over the Northern Hemisphere based on machine learning (1980-2019). A Big Earth Data Platform for Three Poles, DOI: 10.11888/Snow.tpdc.271701. CSTR: 18406.11.Snow.tpdc.271701. ] (下载引用: RIS格式 | RIS英文格式 | Bibtex格式 | Bibtex英文格式 )

文章的引用

1. Hu,Y.X., Che, T., Dai, L.Y., & Xiao, L. (2021). Snow depth fusion based on machine learning methods for the Northern Hemisphere. Remote Sensing, 13,1250.( 查看 | Bibtex格式)

使用本数据时必须引用“文章的引用”中列出的文献,并进行数据的引用


资助项目

地球大数据科学工程专项时空三极环境项目(XDA19000000) (项目编号:XDA19000000) CASEarth:Big Earth Data for Three Poles(grant No. XDA19070000)

三极大数据共享与集成(XDA19070100) (项目编号:XDA19070100) [XDA19070100] Strategic Priority Research Program of the Chinese Academy of Sciences

数据使用声明

为尊重知识产权、保障数据作者的权益、扩展数据中心的服务、评估数据的应用潜力,请数据使用者在使用数据所产生的研究成果中(包括公开发表的论文、论著、数据产品和未公开发表的研究报告、数据产品等成果),明确注明数据来源和数据作者。对于转载(二次或多次发布)的数据,作者还须注明原始数据来源。


License: This work is licensed under an Attribution 4.0 International (CC BY 4.0)


相关资源

1. 2024-11-04 10*   用途:免登录下载 ……

2. 2024-10-24 10*   用途:免登录下载 ……

3. 2024-10-02 10*   用途:免登录下载 ……

4. 2024-10-02 10*   用途:免登录下载 ……

5. 2024-09-18 10*   用途:免登录下载 ……

6. 2024-09-13 10*   用途:免登录下载 ……

7. 2024-09-11 10*   用途:免登录下载 ……

8. 2024-09-10 10*   用途:免登录下载 ……

9. 2024-09-03 10*   用途:免登录下载 ……

10. 2024-08-25 10*   用途:免登录下载 ……

11. 2024-08-16 10*   用途:免登录下载 ……

12. 2024-08-12 10*   用途:免登录下载 ……

13. 2024-08-02 10*   用途:免登录下载 ……

14. 2024-07-30 10*   用途:免登录下载 ……

15. 2024-07-21 10*   用途:免登录下载 ……

16. 2024-07-19 10*   用途:免登录下载 ……

17. 2024-07-18 10*   用途:免登录下载 ……

18. 2024-07-17 10*   用途:免登录下载 ……

19. 2024-07-16 10*   用途:免登录下载 ……

20. 2024-07-14 10*   用途:免登录下载 ……

暂无数据

数据评论

当前页面默认显示 中文 评论 显示所有语种的评论

下 载 关注
关键词
空间位置
East: 180.00 West: -180.00
South: 90.00 North: 0.00
数据细节
  • 时间分辨率: 日
  • 空间分辨率: 0.1º - 0.25º
  • 大小: 2,834 MB
  • 浏览: 9611 次
  • 下载量: 492 次
  • 共享方式: 开放获取
  • 数据时间范围: 1980-09-01 至 2019-05-31
  • 元数据更新时间: 2022-03-22
联系信息
车涛   胡艳兴   戴礼云   肖林  

分发方: 时空三极环境大数据平台

Email: poles@itpcas.ac.cn

附件信息
导出元数据