2018-12-12
从今天开始学习名为librosa的库。 该库主要用于语音处理,有助于机器学习语音分类的初步处理
第一步,你需要学习如何读取音频文件
1.librosa中音频文件的基本处理模块如下
1 ) load模块读取音频文件,变换为音频时间序列的np排列
sr-采样频率: sr=None表示使用音频的原始采样,在不对sr分配值的情况下采用默认值22050
to_mono-变成单声道
resample-重采样,还未使用
get_duration-音频获取时间,以s为单位
自动校正-还没有使用
zero_crossings-过零率
clicks-根据特定标记对声音进行重采样(不确定、未使用) ) ) ) )。
需要由defdisplay_mfcc(audio ) :“”: param audio :解析的音频文件路径:return:是音频文件的mel频谱程序“” _=Librosa.load(audio ) audio _ time=librosa.get _ duration ) y ) # # 音频时间print(audio_time ) y1=Librosa.featuure fmax=8000 ) MFCC=librosa.feature.MFCC (s=librosa.power _ to ) 4 ) ) y_axis=’mel ‘ ) PLT.colorbar(PLT.title ) audio (PLT.tight _ layout ) plt.show ) ) ) )。