語(yǔ)音轉(zhuǎn)文字工具是一款使用python寫(xiě)的小工具合集,語(yǔ)音轉(zhuǎn)文字工具包括圖片、語(yǔ)音識(shí)別、翻譯pdf等功能,能幫助用戶朋友進(jìn)行音頻轉(zhuǎn)文字,文字轉(zhuǎn)語(yǔ)音,截圖文字識(shí)別等操作。
軟件特色:
1.音頻轉(zhuǎn)文字:目前市面上的音頻轉(zhuǎn)文字大多收費(fèi)。音頻轉(zhuǎn)文字的需求是:上傳一段音頻,直接識(shí)別成文字,對(duì)于會(huì)議記錄的比較好使,注意不是實(shí)時(shí)的語(yǔ)音識(shí)別。
2.文字轉(zhuǎn)語(yǔ)音:轉(zhuǎn)的語(yǔ)音不要太生硬。
3.截圖文字識(shí)別(OCR):截屏完成即可彈出截圖所含圖片中的文字。
4.批量圖片文字識(shí)別:選擇多張圖片,直接識(shí)別出每張圖片的文字。
5.復(fù)制翻譯:看英文文獻(xiàn),有時(shí)候懶,如果能有置頂懸浮窗,實(shí)時(shí)監(jiān)測(cè)剪切板,遇到想要翻譯的段落,直接復(fù)制,即可給出多國(guó)語(yǔ)言翻譯結(jié)果也是剛需;當(dāng)然有些論文文本不能復(fù)制,所以還復(fù)用了截圖OCR的功能,對(duì)OCR結(jié)果進(jìn)行翻譯。
6.圖種制作:這個(gè)不入流,純屬個(gè)人愛(ài)好,沒(méi)啥技術(shù)含量。
功能介紹:
1、批量音頻轉(zhuǎn)文字
可批量選擇要轉(zhuǎn)換的音頻即可自動(dòng)識(shí)別,不限時(shí)長(zhǎng),免費(fèi),識(shí)別速度尚可,耐心等待。
(1)比如批量識(shí)別小學(xué)生課文
(2)比如識(shí)別長(zhǎng)達(dá)五分鐘的《荷塘月色》
2、文字轉(zhuǎn)語(yǔ)音
這個(gè)沒(méi)什么好說(shuō)的,輸入文字,選擇發(fā)音人、語(yǔ)速、音調(diào)之類(lèi)的,可試聽(tīng),可生產(chǎn)mp3格式的音頻文件
3、截圖OCR
點(diǎn)擊截圖按鈕即可截圖,自動(dòng)彈出識(shí)別文字。
4、圖片批量識(shí)別
在截圖OCR下拉按鈕有個(gè)圖片批量文字識(shí)別功能,這都屬于OCR功能,簡(jiǎn)單粗暴,批量選擇圖片,即可識(shí)別所有圖片中的文字。
5、復(fù)制翻譯
看英文文獻(xiàn),有時(shí)候懶,如果能有置頂懸浮窗,實(shí)時(shí)監(jiān)測(cè)剪切板,遇到想要翻譯的段落,直接復(fù)制,即可給出多國(guó)語(yǔ)言翻譯結(jié)果也是剛需;當(dāng)然有些論文文本不能復(fù)制,所以還復(fù)用了截圖OCR的功能,對(duì)OCR結(jié)果進(jìn)行翻譯
6、圖種制作
沒(méi)啥意思,就是將一張圖和一個(gè)壓縮文件合并成一個(gè)圖片文件,這個(gè)生成的圖片文件打開(kāi)是一張圖,如果后綴修改為zip,解壓后就能看到原先的壓縮文件