您现在的位置是:首页 >技术交流 >基于QT C++封装微软开源的edge-TTS网站首页技术交流
基于QT C++封装微软开源的edge-TTS
微软Edge TTS是一种先进的语音合成技术,它能够将文本转换为自然流畅的语音。该技术基于深度学习和人工智能技术,能够模拟人类语音的音调、语速、语调和情感,使得合成的语音听起来非常自然。
微软edge-tts项目地址:GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python (without needing Microsoft Edge/Windows or an API key)。(推荐使用python3.10及以上环境)。
可以直接使用pip进行安装:
pip install edge-tts
常用命令:
列出所有支持的语音声音:
edge-tts --list-voices
根据语音生成mp3音频文件:
edge-tts --voice zh-CN-XiaoyiNeural --text "白日依山尽,黄河入海流。欲穷千里目,更上一层楼。春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。秦时明月汉时关,万里长征人未还。但使龙城飞将在,不教胡马渡阴山。" --write-media 123.mp3
由于需要安装python环境,在应用程序里面调用不方便,所以将其改写为QT C++版本。
原理:
下载源代码GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python (without needing Microsoft Edge/Windows or an API key)。在communica.py中发现edge-tts的本质是使用websocket和微软的服务器进行通信,服务器地址在constans.py中。由此可以使用QT QWebSocket来代替python的aiohttp.ClientSession来和TTS服务器进行通信,实现相同的功能。
项目demo下载地址如下,可以在windows 64位系统运行。