Python 栅格数据处理教程(二)
本文将介绍通过 ArcGIS Pro 的 Python 模块(arcpy)对栅格数据进行栅格计算及数据统计的方法。
1 数据来源及介绍
本文使用的数据为国家青藏高原科学数据中心的 中国1km分辨率逐月降水量数据集基础上通过《Python 栅格数据处理教程(一)》中的方法提取出的吉林省范围降水量数据。该数据降水量单位为 0.1 mm,本文通过栅格计算器将数据单位批量转换为 mm。根据各月份降水量叠加生成年降水量栅格及多年平均降水量栅格,同时统计历年降水量数据信息,并整理为 Excel 表。
2 示例代码
2.1 降水量单位转换
import os
import arcpy
from arcpy import sa
from tqdm import tqdm # 进度条工具,需自行安装
# 设置工作空间
arcpy.env.workspace = "Pre_Jilin.gdb"
# 如果在代码同级文件夹中没有结果数据库,则创建该数据库
if "Pre_Jilin1.gdb" not in os.listdir("."):
print("即将为您创建用于保存结果栅格的文件地理数据库(Pre_Jilin1.gdb)……")
arcpy.CreateFileGDB_management(".", "Pre_Jilin1")
print("数据库创建完成!")
# 遍历工作空间内所有栅格数据
for raster in tqdm(arcpy.ListRasters()):
# 通过栅格计算器将栅格值单位转换为 mm,并保存到结果数据库
sa.RasterCalculator([raster], [raster], f"{raster} * 0.1").save(f"Pre_Jilin1.gdb/{raster}")
print("计算完成!")
栅格数据转换前如下所示:
栅格单位转换后如下所示:
2.2 根据各月份降水量生成年降水量栅格
import os
import arcpy
from arcpy import sa
from tqdm import tqdm
# 设置工作空间
arcpy.env.workspace = "Pre_Jilin1.gdb"
# 创建栅格文件字典,以年份为键,值为该年份对应的各月份降水量栅格列表
file_dict = dict()
for raster in arcpy.ListRasters():
if raster[4:8] not in file_dict:
file_dict[raster[4:8]] = [raster]
else:
file_dict[raster[4:8]].append(raster)
# 如果在代码同级文件夹中没有结果数据库,则创建该数据库
if "Pre_Jilin_Year.gdb" not in os.listdir("."):
print("即将为您创建用于保存结果栅格的文件地理数据库(Pre_Jilin_Year.gdb)……")
arcpy.CreateFileGDB_management(".", "Pre_Jilin_Year")
print("数据库创建完成!")
# 定义变量名,并构建代数表达式,以对输入栅格执行空间分析
# 以 a-l 代表12个月份的降水量栅格,求全年总降水量
input_names = ["a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l"]
expression = "a + b + c + d + e + f + g + h + i + j + k + l"
# 遍历栅格文件字典
for year in tqdm(file_dict):
# 提取历年降水量栅格,通过栅格计算器生成年降水量栅格,并保存到结果数据库中
sa.RasterCalculator(file_dict[year], input_names, expression).save(f"Pre_Jilin_Year.gdb/Pre_{year}")
print("计算完成!")
2023年吉林省年降水量栅格如下图所示:
2.3 统计研究区年降水量的最值、均值、标准差等信息
import os
import arcpy
from arcpy import sa
from tqdm import tqdm
# 设置工作空间
arcpy.env.workspace = "Pre_Jilin_Year.gdb"
# 如果在代码同级文件夹中没有结果数据库,则创建该数据库
if "Pre_Jilin_Year_Info.gdb" not in os.listdir("."):
print("即将为您创建用于保存结果栅格的文件地理数据库(Pre_Jilin_Year_Info.gdb)……")
arcpy.CreateFileGDB_management(".", "Pre_Jilin_Year_Info")
print("数据库创建完成!")
# 遍历工作空间内所有栅格数据
for raster in tqdm(arcpy.ListRasters()):
# 统计吉林省范围内年降水量的最值、均值、标准差等信息,并以表格的形式保存到结果数据库中
sa.ZonalStatisticsAsTable("Data/Jilin.shp", "FID", raster, f"Pre_Jilin_Year_Info.gdb/{raster}")
print("统计完成!")
2.4 将统计信息表格导出为 txt 文本文件
import os
import arcpy
from tqdm import tqdm
arcpy.env.workspace = "Pre_Jilin_Year_Info.gdb"
# 如果在代码同级文件夹中没有结果文件夹,则创建该文件夹
if "Pre_Jilin_Year_Table" not in os.listdir("."):
print("即将为您创建用于保存转换结果的文件夹(Pre_Jilin_Year_Table)……")
os.mkdir("Pre_Jilin_Year_Table")
print("文件夹创建完成!")
# 遍历工作空间内所有表格,将表格逐一导出为 txt 文本文件
for table in tqdm(arcpy.ListTables()):
arcpy.ExportTable_conversion(table, f"Pre_Jilin_Year_Table/{table}.txt")
print("转换完成!")
2023 年的统计信息文本如下所示:
2.5 将历年的 txt 文件整理为 Excel 表
import os
import pandas as pd
pre_dict = dict()
# 遍历文件列表
for fileName in os.listdir("Pre_Jilin_Year_Table"):
# 通过后缀名判断是否为 txt 文件
if fileName[-4:] == ".txt":
# 基于 UTF-8 编码读取 txt 文件内容
with open(f"Pre_Jilin_Year_Table/{fileName}", "r", encoding="utf-8") as file:
file_txt = file.readlines()
# 文本内容的第一行是标题,第二行是数据
# 读取第二行数据第5个数值开始的所有数据值,即 MIN,MAX,RANGE,MEAN,STD,SUM,MEDIAN,PCT90
# 将这些数据值合并为列表
# 注:ArcGIS Pro 不同版本转换得到的 txt 数据表字段可能不同,需要根据实际情况调整代码
val_list = file_txt[1].replace("\n", "").split(",")[4:]
# 将所有数据值从字符串类型转换为数值类型
for i in range(len(val_list)):
val_list[i] = eval(val_list[i])
# 以数值类型年份为键,数据值列表为值,将数据存入字典
pre_dict[eval(fileName[4:8])] = val_list
# 将字典转换为 DataFrame 二维数据表
df = pd.DataFrame(pre_dict, index="MIN,MAX,RANGE,MEAN,STD,SUM,MEDIAN,PCT90".split(",")).T
print(df)
# 将 DataFrame 导出为 Execl 表格
df.to_excel("Pre_Jilin_Year_Table.xlsx")
print("导出表格完成!")
简单调整 Excel 表的格式后,其展示效果如下图所示:
2.6 基于历年降水量生成多年平均降水量栅格
import os
import arcpy
from arcpy import sa
# 设置工作空间,并根据数据库中的栅格数据数量确定年份数量
arcpy.env.workspace = "Pre_Jilin_Year.gdb"
year_num = len(arcpy.ListRasters())
# 定义变量名,并构建代数表达式,以对输入栅格执行空间分析
# input_names = ["Pre_2001", "Pre_2002", "Pre_2003", ......, "Pre_2021", "Pre_2022", "Pre_2023"]
# expression = "(Pre_2001 + Pre_2002 + Pre_2003 + ...... + Pre_2021 + Pre_2022 + Pre_2023) / 23"
input_names, expression = [], ""
for raster in arcpy.ListRasters():
input_names.append(raster)
if expression == "":
expression += raster
else:
expression += f" + {raster}"
expression = f"({expression}) / {year_num}"
# 如果在代码同级文件夹中没有结果数据库,则创建该数据库
if "Pre_Jilin_Mean.gdb" not in os.listdir("."):
print("即将为您创建用于保存结果栅格的文件地理数据库(Pre_Jilin_Mean.gdb)……")
arcpy.CreateFileGDB_management(".", "Pre_Jilin_Mean")
print("数据库创建完成!")
# 计算多年平均降水量栅格并保存到结果数据库中
sa.RasterCalculator(arcpy.ListRasters(), input_names, expression).save("Pre_Jilin_Mean.gdb/Pre_Mean")
print("计算完成!")
运行完成后生成的结果栅格如下图所示:
3 降水数据参考文献格式
3.1 数据的引用
彭守璋. (2020). 中国1km分辨率逐月降水量数据集(1901-2023). 国家青藏高原数据中心. https://doi.org/10.5281/zenodo.3114194.
Peng, S. (2020). 1-km monthly precipitation dataset for China (1901-2023). National Tibetan Plateau / Third Pole Environment Data Center. https://doi.org/10.5281/zenodo.3114194.
3.2 文章的引用
1、Peng, S.Z., Ding, Y.X., Wen, Z.M., Chen, Y.M., Cao, Y., & Ren, J.Y. (2017). Spatiotemporal change and trend analysis of potential evapotranspiration over the Loess Plateau of China during 2011-2100. Agricultural and Forest Meteorology, 233, 183-194. https://doi.org/10.1016/j.agrformet.2016.11.129
2、Ding, Y.X., & Peng, S.Z. (2020). Spatiotemporal trends and attribution of drought across China from 1901–2100. Sustainability, 12(2), 477.
3、Peng, S.Z., Ding, Y.X., Liu, W.Z., & Li, Z. (2019). 1 km monthly temperature and precipitation dataset for China from 1901 to 2017. Earth System Science Data, 11, 1931–1946. https://doi.org/10.5194/essd-11-1931-2019
4、Peng, S., Gang, C., Cao, Y., & Chen, Y. (2017). Assessment of climate change trends over the loess plateau in china from 1901 to 2100. International Journal of Climatology.