© 2025 Rocky. All rights reserved.

|浙ICP备2025179428号-3|

魔法施展中...

技术文章

技术实践

使用开源模型GPT_SoVITS训练自己的tts

2024-02-19
5 分钟
...

GPT-SoVITS 是github上开一个开源的tts模型,可以基于用户上传的声音(哪怕只是一分钟的声音)得到用户声音模型,然后根据文字来生成语音。 项目还处于活跃的开发中,我上周测试的时候使用源代码还遇到了几次出错,所以改用docker来运行。

安装ffmpeg

apt install ffmpeg

安装ffmpeg的python扩展

pip3 install ffmpeg

安装gradio

pip3 install gradio

安装docker 和相关驱动包

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

参见nvidia-docker2

使用docker 运行:

RT=`pwd`/rt
mkdir $RT/output
mkdir $RT/logs
PWD=`pwd`
WT="$PWD/GPT-SoVITS/SoVITS_weights"
mkdir $WT
sudo docker run --rm -it --gpus=all --env=is_half=False  --volume=/home/ubuntu/:/home/ubuntu/ --volume=$RT/output:/workspace/output --volume=$RT/logs:/workspace/logs --volume=$RT:/workspace/SoVITS_weights --workdir=/workspace -p 9870:9870 -p 9871:9871 -p 9872:9872 -p 9873:9873 -p 9874:9874 --shm-size="16G" -d breakstring/gpt-sovits

💡 关于技术判断: 本文反映了我在真实系统中评估技术风险的思考方式。 我现在专注于为创始人和决策者提供独立的后端与架构风险评估服务。 如果您在重大技术决策前需要第三方意见,了解评估服务或联系咨询。

感谢阅读!如果您觉得这篇文章有帮助,欢迎分享给更多的朋友。

上一篇
技术分享

Apache Drill vs. Baidu Doris: A Comparative Analysis

Apache Drill vs. Baidu Doris: A Comparative Analysis

下一篇
技术分享

Rails集成prometheus的几个经验

单纯地将prometheus集成进rails,整体上比较方便:

📮 订阅更新
每周收到最新文章推送,不错过精彩内容

💡 我们尊重您的隐私,不会将邮箱用于其他用途

加载中...

猜你喜欢

技术分享

'我的三段创业经历'

刷到了 joyqi 写的[一个小感想](https://joyqi.com/life/cry-with-laughter.html),也有点小感触。

2022-12-10
创业
职业发展

领导力模型

对于高管层,我是分成了两类,一类是专业技能型高层,一类是职业官僚。

2022-06-09
领导力
产品思考

什么是月经收入,我应该如何计算?

translate from :[https://www.zoho.com/subscriptions/guides/what-is-monthly-recurring-revenue.html](https://www.zoho.com/subscriptions/guides/what-i...

2022-05-29