使用Python合并多个wav音频-白红宇

使用Python合并多个wav音频

阅读量：144 次

发布时间：2019-02-27

本文共 2212 字，大约阅读时间需要 7 分钟。

项目需要将多个相关的wav文件进行合并，尝试不借助工具，使用Python代码来实现。

1. 合并两个文件

以下是一个将两个WAV文件合并到一个文件中的示例代码：

import waveinfiles = ["sound_1.wav", "sound_2.wav"]outfile = "sounds.wav"data = []for infile in infiles:    w = wave.open(infile, 'rb')    data.append([w.getparams(), w.readframes(w.getnframes())])    w.close()output = wave.open(outfile, 'wb')output.setparams(data[0][0])output.writeframes(data[0][1])output.writeframes(data[1][1])output.close()

2. 合并一个文件夹下多个文件

如果需要将一个文件夹下的多个WAV文件合并，可以使用以下方法：

import osimport wave# 定义需要合并的文件夹和扩展名input_dir = "sounds"output_file = "all_sounds.wav"ext = ".wav"# 遍历文件夹中的所有WAV文件for infile in os.listdir(input_dir):    if infile.endswith(ext):        current_file = os.path.join(input_dir, infile)        w = wave.open(current_file, 'rb')        data.append([w.getparams(), w.readframes(w.getnframes())])        w.close()

3. 合并多个文件夹下指定数量的文件

如果需要从多个文件夹中选择指定数量的文件进行合并，可以按照以下步骤操作：

import osimport wave# 定义需要合并的文件夹列表input_dirs = ["dir1", "dir2", "dir3"]# 定义每个文件夹下要合并的文件数量file_num = 2# 遍历每个文件夹，收集需要的文件all_files = []for dir in input_dirs:    for infile in os.listdir(dir):        if infile.endswith(".wav"):            all_files.append(os.path.join(dir, infile))            # 按照文件名排序，确保稳定性all_files.sort()# 选择前file_num个文件selected_files = all_files[:file_num]# 初始化数据列表data = []# 读取并存储文件数据for infile in selected_files:    w = wave.open(infile, 'rb')    data.append([w.getparams(), w.readframes(w.getnframes())])    w.close()# 写入输出文件output = wave.open("final_sounds.wav", 'wb')output.setparams(data[0][0])for i in range(len(data)):    output.writeframes(data[i][1])output.close()

4. wave 模块小结和拓展

Python的wave模块提供了一个处理WAV格式音频文件的便利接口。该模块不支持压缩/解压，但支持单声道和立体声文件。

wave 模块的使用方法

wave.open(file, mode=None) 是一个基本的接口：

mode 参数可选为 'rb' 或 'wb'：
- 'rb'：生成wav_read对象，用于读取文件。
- 'wb'：生成wav_write对象，用于写入文件。

wav_read 和 wav_write 对象都支持以下方法：

getparams()：获取音频文件的参数，如声频率、通道数、位深等。

readframes()：读取音频数据框。

writeframes()：向音频流中写入音频数据框。

模块扩展

在处理音频文件时，还可以选择其他库：

librosa：适合进行音频信号处理，内部使用Numpy存储数据，读取文件时依赖soundfile模块（不支持MP3格式）。

pydub：底层基于ffmpeg读写文件，代码简洁且功能丰富，支持音频切割、格式转换、音量调整和ID3标签等操作，门槛较低。

在日常使用中，pydub足够应付基本需求，而对信号处理有更高要求的项目可以考虑librosa，但需要一定的数学基础知识，熟悉傅立叶变换等基本算法。

以上内容提供了从简单到复杂的WAV文件合并方法，涵盖了单文件合并、多文件夹合并以及指定文件数量合并等场景。通过合理搭配wave模块的功能，可以实现多种音频文件操作需求。

转载地址：http://ludd.baihongyu.com/