当前位置:   article > 正文

项目实训:python whisper安装运行 实现语音识别技术_whisper运行教程

whisper运行教程

1.最好用python3.9以上的版本

2.安装whisper库

pip install -U openai-whisper

输入whisper查看是否安装成功

3.下载ffmpeg并添加环境变量 

Releases · BtbN/FFmpeg-Builds (github.com)

下载成功后,配置环境变量,右键我的电脑->属性->高级系统设置->环境变量->系统变量->Path

将bin目录的地址添加进来

然后检查是否成功 win+R cmd,输入ffmpeg,显示如下,则安装成功

3.Whisper主要是基于Pytorch实现,所以需要在安装有pytorch的环境中使用。

安装pytorch

pip3 install torch torchvision torchaudio

4.安装zhconv,将繁体字转换为简体字

pip install zhconv

5.测试

写一段代码

  1. import whisper
  2. import zhconv
  3. model = whisper.load_model("base", "cpu")
  4. mps_path = r"1.mp3"
  5. result = model.transcribe(mps_path, fp16=False, language='Chinese')
  6. s = result["text"]
  7. s1 = zhconv.convert(s, 'zh-cn')
  8. print(s1)
运行,报错,错误信息:
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

参考https://blog.csdn.net/zdm_0301/article/details/133854913?spm=1001.2014.3001.5506

感谢这位博主,成功解决这个给问题,把参数改为true后,重启电脑,运行成功

没有做分词操作,后续继续处理,总体识别还是不错的。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/754536
推荐阅读
相关标签
  

闽ICP备14008679号