python 几种常见的音频数据读取、保存方式

1. soundfile 库的使用

soundfile库是一个Python库，主要用于读取和写入音频文件。它支持多种音频格式，包括WAV、AIFF、FLAC和OGG等。通过soundfile库，用户可以方便地将numpy数组存储到音频文件或者将音频文件加载到numpy数组中。此外，soundfile库还提供了一些函数，用于处理音频数据。它的使用简单且灵活，方便进行音频处理和分析的工作。

1.1 read 读文件

读取音频文件数据

import soundfile as sf# wav numpy 型数据，sr是采样率filename = "xx/xx.wav"wav, sr = sf.read(filename, dtype='float64)

可通过dtype将任意的音频文件数据格式转为float64,float32,int16,int32 的numpy型数据，其中float64,float32是归一化后的结果。dtype 默认值为float64。

1.2 write 保存文件

保存音频文件数据

# save_filename, 保存的音频文件路径，data保存的数据，samplerate是采样率sf.wrtie(save_filename,data,samplerate)

支持写入的数据也为float64,float32,int16,int32，并保存相应格式的数据

2. torchaudio 库的使用

torchaudio是PyTorch深度学习框架的一部分，主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口，使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。通过使用torchaudio，开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式，并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外，torchaudio还支持多声道音频处理和GPU加速，以满足不同应用场景的需求。

2.1 load 读文件

加载音频文件数据

import torchaudiofile_path = "xx/xx.wav"waveform, sr = torchaudio.load(file_path, normalize=True)

主要说明：
可以读取float32, int16, int32类型数据，返回的是torch.tensor类型的数据；
normalize=True时，返回的数据是归一化到(-1,1)的float32数据；
normalize=False时，返回的是float32、int16或者int32数据，具体需要看file_path本身是什么类型的音频数据；
normalize默认值为True。

2.2 save 保存文件

保存音频数据到文件

# out_path, 保存的音频文件路径，waveform保存的数据，sr是采样率torchaudio.save(out_path, waveform, sr)

根据waveform的格式自动保存为float32、int16或者int32

3. from scipy.io import wavfile 库的使用

scipy.io.wavfile库是SciPy科学计算库中的一个模块，主要用于读取和写入WAV格式的音频文件。该库提供了函数用于将音频数据存储为WAV文件或者将WAV文件加载为numpy数组，方便进行音频数据的处理和分析。用户可以使用scipy.io.wavfile库来读取音频文件的采样率和数据，以及将音频数据写入WAV文件。此外，该库还提供了一些函数用于处理音频数据，如获取音频数据的声道数、比特深度等信息。通过scipy.io.wavfile库，用户可以方便地进行音频文件的读写操作，并结合其他Python库进行音频数据处理和分析。

3.1 read 读文件

from scipy.io import wavfilefile_name = "xx/xx.wav"sr, wav_data = wavfile.read(file_name)

返回的是float32、int16、int32型numpy数据，具体格式根据file_name文件的音频格式

3.2 save 保存文件

# filename, 保存的音频文件路径，wav_data保存的数据，sr是采样率wavfile.wrtie(filename, sr, wav_data)

根据wav_data的格式自动保存为float32、int16或者int32。

注：以上float32、float64数据是归一化后的结果，与其他转换为int16 / 2 ** 15，int32 / 2 ** 31

张士玉小黑屋

当前位置：首页 » 《关于电脑》 » 正文

python 几种常见的音频数据读取、保存方式

10 人参与 2024年05月02日 13:50 分类 : 《关于电脑》评论

1. soundfile 库的使用

1.1 read 读文件

1.2 write 保存文件

2. torchaudio 库的使用

2.1 load 读文件

2.2 save 保存文件

3. from scipy.io import wavfile 库的使用

3.1 read 读文件

3.2 save 保存文件

评论（0）

赞助本站

search zhannei

最新文章

张士玉小黑屋

当前位置：首页 » 《关于电脑》 » 正文

python 几种常见的音频数据读取、保存方式

10 人参与 2024年05月02日 13:50 分类 : 《关于电脑》 评论

1. soundfile 库的使用

1.1 read 读文件

1.2 write 保存文件

2. torchaudio 库的使用

2.1 load 读文件

2.2 save 保存文件

3. from scipy.io import wavfile 库的使用

3.1 read 读文件

3.2 save 保存文件

评论（0） 赞助本站

search zhannei

最新文章

10 人参与 2024年05月02日 13:50 分类 : 《关于电脑》评论

评论（0）

赞助本站