博客
关于我
使用Python合并多个wav音频
阅读量:144 次
发布时间:2019-02-27

本文共 1009 字,大约阅读时间需要 3 分钟。

文章目录

项目需要将多个相关的wav文件进行合并,尝试不借助工具,使用Python代码来实现。

1. 合并两个文件

import waveinfiles = ["sound_1.wav", "sound_2.wav"]outfile = "sounds.wav"data= []for infile in infiles:    w = wave.open(infile, 'rb')    data.append( [w.getparams(), w.readframes(w.getnframes())] )    w.close()output = wave.open(outfile, 'wb')output.setparams(data[0][0])output.writeframes(data[0][1])output.writeframes(data[1][1])output.close()

2. 合并一个文件夹下多个文件

3. 合并多个文件夹下指定数量的文件

这两种可以去查看 jupyter notebook文件 0817_join_wav

4. wave 模块小结 和拓展

wave 模块提供了一个处理 WAV 声音格式的便利接口。它不支持压缩/解压,但是支持单声道/立体声

用法:wave.open(file, mode=None)

mode为

  • rb:生成 wav_read 对象
  • wb:生成 wav_write 对象
    注意不支持同时读写

注:关于 rwrbwb

rw是普通读和写文件(简单理解为人工编写的文件);
rbwb是读写二进制文件(简单理解为可以操作图片等非手工编写的文件)

更多用法可以查看:

拓展:

wave 是Python的标准模块,Python 处理音频数据等常见模块有两个:

  • librosa:擅长音频信号处理,内部用 numpy 存储数据,读写文件依赖 soundfile 模块(不支持mp3)
  • pydub :底层基于 ffmpeg 读写文件,代码简洁,支持切割、格式转换、音量、ID3等常用功能,门槛低。(ffmpeg 是一个极其强大的开源视频处理软件)

使用建议:日常用 pydub 足够应付,更强大的信号处理则需要 librosa,但有一定数学门槛,需要了解信号处理原理,掌握傅立叶变换等基本算法。

具体的使用方法总结这里不再赘述,可以查看:

参考:

转载地址:http://ludd.baihongyu.com/

你可能感兴趣的文章
NLog 自定义字段 写入 oracle
查看>>
NLog类库使用探索——详解配置
查看>>
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP、CV 很难入门?IBM 数据科学家带你梳理
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP入门(六)pyltp的介绍与使用
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
查看>>
NLP:从头开始的文本矢量化方法
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>
NLTK - 停用词下载
查看>>