当前位置:首页 » 《随便一记》 » 正文

Python 使用netCDF4读写nc文件以及截取指定经纬度范围内的数据生成新的nc文件

13 人参与  2023年04月05日 16:22  分类 : 《随便一记》  评论

点击全文阅读


Python 使用netCDF4读写nc文件以及截取nc文件经纬度范围内的数据

简单介绍nc文件的读写操作,以及实现输入nc文件和坐标范围,输出一个新的nc文件的功能

环境

python3.8.13
netcdf4 1.5.7 py38h3de5c98_1
numpy 1.23.1 py38h7a0a035_0

读写nc文件代码

导入netCDF4和np包

import netCDF4 as ncimport numpy as np

读取nc文件

# 打开文件dataset = nc.Dataset(r'H:\test.nc')# 维度print('1. Dimensions: ',dataset.dimensions)# 变量print('2. Variables: ',dataset.variables.keys())# 全局属性 ncattrs获取name getncattr获取valueprint('3. Global attribute\'s names: ',      dataset.ncattrs(),      '\n4. Global attribute\'s values: ',      [dataset.getncattr(i) for i in dataset.ncattrs()])# 以下为输出结果,有三个维度,分别是'depth','lat','lon',十三个变量'depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'#1. Dimensions:  {'depth': <class 'netCDF4._netCDF4.Dimension'>: name = 'depth', size = 40, 'lat': <class 'netCDF4._netCDF4.Dimension'>: name = 'lat', size = 1501, 'lon': <class 'netCDF4._netCDF4.Dimension'>: name = 'lon', size = 1191}#2. Variables:  dict_keys(['depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'])#3. Global attribute's names:  ['classification_level', 'distribution_statement', 'downgrade_date', 'classification_authority', 'institution', 'source', 'history', 'field_type', 'Conventions'] #4. Global attribute's values:  ['UNCLASSIFIED', 'Approved for public release. Distribution unlimited.', 'not applicable', 'not applicable', 'Naval Oceanographic Office', 'HYCOM archive file', 'archv2ncdf3z', 'instantaneous', 'CF-1.6 NAVO_netcdf_v1.1']

访问变量

单个变量

water_temp = dataset.variables['water_temp'][:]print(water_temp.shape)# 输出#(40, 1501, 1191)

所有变量

# 访问所有变量for name in dataset.variables.keys():    data = dataset.variables[name][:]    print(data.shape)# 输出#(40,)#(1501,)#(1191,)#()#()#(40, 1501, 1191)#(1501, 1191)#(40, 1501, 1191)#(1501, 1191)#(40, 1501, 1191)#(1501, 1191)#(40, 1501, 1191)#(1501, 1191)#(1501, 1191)

访问变量的属性

for name in dataset.variables.keys():# 根据名称获取变量    var = dataset.variables[name]    for attr in var.ncattrs():    # 属性名,属性值        print(attr,var.getncattr(attr))# 结果太长就不列出来了

最后关闭文件

dataset.close()

写入nc文件

# 创建一个新的数据集newdataset = nc.Dataset(r'H:\testout.nc','w')# 创建维度 维度名,维度长度(默认None)newdataset.createDimension('lat',10)newdataset.createDimension('lon',10)# 创建变量 变量名,数据类型(numpy中的数据类型),维度(如果不给维度,则变量是标量)lat = newdataset.createVariable('lat',np.float32,('lat'))lon = newdataset.createVariable('lon',np.float32,('lon'))water_temp = newdataset.createVariable('water_temp',np.float32,('lat','lon'))# 给变量赋值lat[:] = np.arange(10)lon[:] = np.arange(10)water_temp[:] = np.arange(10 * 10).reshape(10,10)newdataset.close()

保存的结果

截取目标区域的数据生成新的nc文件

导入包

import netCDF4 as ncimport numpy as np

打开已有的nc文件,并且读取出全局属性,变量名称,维度信息

filename = r'H:\test.nc'dataset = nc.Dataset(filename)# 定义需要的经纬度范围extent = [18.,27.,121.,135.]# 全局属性存入global_attrs_dict中global_attrs = dataset.ncattrs()global_attrs_dict = {}for attr in global_attrs:    print(attr,dataset.getncattr(attr))    global_attrs_dict[attr] = dataset.getncattr(attr)# 根据经纬度大小,获取索引范围x1,x2,y1,y2old_lat = dataset.variables['lat'][:]old_lon = dataset.variables['lon'][:]x1 = np.searchsorted(old_lat,extent[0]) + 1x2 = np.searchsorted(old_lat,extent[1])y1 = np.searchsorted(old_lon,extent[2]) + 1y2 = np.searchsorted(old_lon,extent[3])# 新的经纬度new_lat = old_lat[x1:x2]new_lon = old_lon[y1:y2]# 获取维度信息dims = dataset.dimensions# 获取变量名列表variables_list = list(dataset.variables.keys())

新建nc文件,写入维度,全局属性,变量属性以及数据

# 新建一个nc文件newfilename = r'H:\output.nc'newdataset = nc.Dataset(newfilename,'w')# 创建维度for item in dims.items():    size = item[1].size    if item[1].name == 'lat':        size = len(new_lat)    if item[1].name == 'lon':        size = len(new_lon)    newdataset.createDimension(item[1].name, size)# 设置新nc文件的全局属性newdataset.setncatts(global_attrs_dict)# 写入裁剪后的数据for varname in variables_list:    print('current variable: %s' % varname)    var = dataset.variables[varname]    # 创建变量    newdataset.createVariable(varname,var.dtype,var.dimensions)    # 获取变量属性    var_attr_dict = {}    for attr in var.ncattrs():        var_attr_dict[attr] = var.getncattr(attr)    newvar = newdataset.variables[varname]    # 写入变量属性    newvar.setncatts(var_attr_dict)    # 获取维度信息    dims_name_list = list(newvar.dimensions)    # 若有经度或维度,则需要进行截取    if 'lon' in dims_name_list or 'lat' in dims_name_list:    # 1维数据        if len(dims_name_list) == 1:            if 'lon' in dims_name_list:                newvar[:] = var[:][y1:y2]            elif 'lat' in dims_name_list:                newvar[:] = var[:][x1:x2]        # 2维数据        elif len(dims_name_list) == 2:            newvar[:] = var[:][x1:x2,y1:y2]        # 3维数据        elif len(dims_name_list) == 3:            newvar[:] = var[:][:,x1:x2,y1:y2]        else:        # 数据中只有三维及以下数据,因此不处理超过三维的数据            raise ValueError('variable %s\'s dimension > 3.' %varname)           # 无经纬度,不需要截取数据    else:        newvar[:] = var[:]# 关闭文件newdataset.close()dataset.close()

参考
netCDF4 API 文档


点击全文阅读


本文链接:http://zhangshiyu.com/post/58495.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1