%0 Dataset %T 基于多变量随机森林模型的中国1公里日环境PM2.5和O3浓度全覆盖数据集(2005-2017 年) %J 国家冰川冻土沙漠科学数据中心 %I 国家冰川冻土沙漠科学数据中心(www.ncdc.ac.cn) %U http://www.ncdc.ac.cn/portal/metadata/f8eb2dc3-7336-48b9-aae1-98bd27fad833 %W NCDC %R 10.5281/zenodo.4009308 %A 李甜甜 %K 随机森林;PM2.5;O3浓度 %X 近年来,细颗粒物(PM2.5)和环境臭氧(O3)的健康风险已得到广泛认可。对 PM2.5 和 O3 暴露的准确估计对于支持健康风险分析和环境政策制定非常重要。本数据集研究旨在构建高性能的随机森林模型,以 1 km × 1 km 的空间分辨率估算 2005-2017 年中国PM2.5 日平均浓度和臭氧日最大 8 h 平均浓度(O3-8 hmax)。模型变量包括气象变量、卫星数据、化学传输模型输出、地理变量和社会经济变量。建立了基于 10 倍交叉验证的随机森林模型,并进行了时空验证以评估模型性能。根据我们基于样本的划分方法,测试数据集的 PM2.5 日、月和年估计值的平均模型拟合 R2 值分别为 0.85、0.88 和 0.90;O3-8 hmax 的R2 值分别为 0.77、0.77 和 0.69。气象变量及其滞后值会显著影响 PM2.5 和 O3-8 hmax 的估计值。2005-2017 年期间,PM2.5 浓度总体呈下降趋势,而环境 O3 浓度则呈上升趋势。2005 年至 2017 年期间,PM2.5 和 O3-8 hmax 的空间模式几乎没有变化,但时间趋势具有空间特征。