python:3+
ffmpeg:用于处理视频和语音
gradio:UI界面和读取语音
我们的目的是做一个语音智能助手
下面我们开始
Visual Studio Code
因为需要写python代码,用比较方便。
python官网
最新官网telegram下载的地方哪里有
telegram最新官方下载地方在哪呢
执行下载好的exe文件,可以建议选择自定义安装,这样可以修改安装路径,只要别安装到C盘就行。
记得勾选添加到环境变量
添加环境变量
telegram完整版的下载网站在哪里
假设在安装时候,忘记了勾选添加到环境变量,那么我们可以自己配置
修改subprocess.py文件
https://ffmpeg.org/
官方的最新版telegram下载入口是多少
将下载好的安装包,进行解压,然后将解压后的文件夹放到平时自己喜欢的安装目录里。
比如:我的是D盘:。
https://github.com/p-groarke/wsay/releases/tag/v1.5.0
点击下图进行下载:
先创建一个项目文件夹,比如我的:
然后打开我们之前下载好的vsCode,并打开相关目录。
参照gradio官网写测试代码
https://gradio.app/quickstart/
测试代码1:页面
执行代码:
可以看到控制台会打印如下信息:
然后浏览器打开网址:
但是我们是需要做成语音的,所以我们需要调整下;
在官网找到:
https://gradio.app/docs/#audio
测试代码2:
执行命令:
浏览器刷新地址如下页面:
官网的最新版的telegram下载入口在哪里
接入openAI:
测试代码3:
执行命令:
效果如下:
ffmpeg 来处理语音利用WSAY,将文字转成语音利用gradio,来生成UI页面,并提供语音输入
参考地址:
https://updayday.notion.site/Chat-GPT-WHISPER-API-GPT-3-5-TURBO-2af2630c857a4f0da92abcc763b4fd48
Whisper API cannot read files correctly
Renaming file extension using pathlib (python 3)
Path not found in Python