是的,Linux 系统可以通过多种工具和框架实现文本转语音(TTS)功能。以下是常见的解决方案和详细步骤:
# 安装
sudo apt install espeak # Debian/Ubuntu
sudo dnf install espeak # Fedora
# 使用(英文)
espeak "Hello, this is Linux TTS"
# 使用中文(需指定语言代码)
espeak -v zh "你好,这是中文测试"
特点:速度快、占用资源少,但语音较机械。
# 安装
sudo apt install festival festvox-{语言包} # 例如 festvox-us1
# 使用
echo "Hello Linux" | festival --tts
注意:中文支持有限,需额外安装语言包。
# 安装 Python 包
pip install gtts
# 生成语音并播放
from gtts import gTTS
import os
tts = gTTS(text="你好,这是谷歌TTS", lang='zh')
tts.save("output.mp3")
os.system("mpg123 output.mp3") # 需安装 mpg123
特点:语音自然,依赖网络和 Google 服务。
# 克隆项目
git clone https://github.com/mozilla/TTS
cd TTS
pip install -e .
# 使用预训练模型生成语音
tts --text "Hello" --model_name "tts_models/en/ljspeech/tacotron2-DDC" --out_path output.wav
特点:高质量语音,但需要 GPU 加速。
# 安装
sudo apt install speech-dispatcher
# 使用
spd-say "This is a system message"
适用场景:脚本或程序调用系统语音。
# 安装
pip install paddlespeech
# 中文 TTS
paddlespeech tts --input "你好,PaddleSpeech" --output output.wav
特点:支持中英文,需较大磁盘空间下载模型。
gnome-sound-recorder
)。中文乱码或无效
espeak -v zh
或安装中文语音包)。无声音输出
aplay -l
。sudo apt install alsa-utils mpg123
。深度学习模型速度慢
--use_cuda
参数启用 GPU(如有 NVIDIA 显卡)。espeak
或 gTTS
。Mozilla TTS
或 PaddleSpeech
。PaddleSpeech
或 gTTS
。如果需要进一步定制或开发,可以结合这些工具的 API 或 Python SDK 实现更复杂的功能。