中文語音克隆工具可以幫助用戶模擬自己的聲音,軟件采用先進的人工智能克隆技術,只需幾秒鐘就可以完全克隆用戶的聲音,效果非常逼真,支持音頻提取和錄制操作,功能非常強大,也可以作為變聲器,創(chuàng)所需的聲線,操作相對簡單。
使用說明
環(huán)境要求
python3.7及以上。
理論支持Windows7及以上(建議Win8+,舊版本不保證兼容性)
親測win2012,win10完美運行。
如果ERROR出現(xiàn)在pip安裝過程中:Couldnotfindaversiontistististististististististististististististiontiorch==1.9.0+cu102(fromversions:0.1.2.post1、0.1.2.post2)這個錯誤可能是python版本太低,3.9可以成功安裝。
安裝步驟
請檢查addpythontopath,否則需要手動配置環(huán)境變量。
請保持網(wǎng)絡暢通,如果斷網(wǎng)報錯,請重新執(zhí)行安裝依賴。bat使用教程。
1.browse選擇3-15秒的語音,wav格式,最好是單聲道,吐字清晰,無噪音,不宜過長。
親測網(wǎng)課直播錄音,發(fā)音,在安靜條件下錄音等音質(zhì)較好,而在舞臺、KTV等公共環(huán)境下錄音質(zhì)量較差。
并不是所有的聲音都能完美克隆,老師的聲音在網(wǎng)上課堂上是假的,但麥小兜派蒙雷米等蘿莉的聲音效果并不理想。
可使用Au等音頻編輯工具進行預處理降噪。
如圖所示,頻譜規(guī)則的音頻克隆效果較好。
2.右上角輸入文本,只支持中文,沒有阿拉伯數(shù)字。請用諧音解決英語問題。
3.選擇vocoder,推薦Griffin-lim,點擊synthesizeandvocode試聽,然后點擊export導出音頻。