首頁 資訊 語音轉(zhuǎn)寫

語音轉(zhuǎn)寫

來源:泰然健康網(wǎng) 時間:2024年12月20日 21:11

產(chǎn)品優(yōu)勢

準(zhǔn)確率高,高效穩(wěn)定

行業(yè)先進(jìn)的語音識別技術(shù),通用語音識別率98%(注:安徽電子產(chǎn)品監(jiān)督檢驗所檢測,報告編號151209010027)

自定義個性熱詞、質(zhì)檢關(guān)鍵詞

無需算法開發(fā),直接上傳熱詞列表即可完成熱詞配置;質(zhì)檢關(guān)鍵詞支持配置默認(rèn)詞庫和上傳自定義詞庫,滿足您的多樣化需求

格式轉(zhuǎn)化,標(biāo)點預(yù)測

對數(shù)字、日期、時間等返回格式化文本,根據(jù)對話語境,智能斷句并匹配標(biāo)點

方言語種,高效識別

支持除中英文外的多方言語種識別,適應(yīng)復(fù)雜的語言環(huán)境

產(chǎn)品價格

溫馨提示:

1、 默認(rèn)支持中文、英文、中英混合識別;購買套餐三可領(lǐng)取3個方言/語種,購買套餐四、五可領(lǐng)取5個方言/語種,購買套餐六可領(lǐng)取8個方言/語種; 購買套餐后,可在控制臺領(lǐng)取所需方言/語種;購買多個套餐的情況下,贈送的方言/語種數(shù)量不疊加;

2、 后臺計量系統(tǒng)將根據(jù)使用情況,以秒為單位向上取整,進(jìn)行使用量扣除;

方言語種

語種價格購買廣東話

5000元20000元

立即購買河南話

5000元20000元

立即購買西南官話(云貴川渝)

5000元20000元

立即購買語種價格購買廣東話

5000元20000元

立即購買河南話

5000元20000元

立即購買西南官話(云貴川渝)

5000元20000元

立即購買語種價格購買廣東話

5000元20000元

立即購買河南話

5000元20000元

立即購買西南官話(云貴川渝)

5000元20000元

立即購買

類型

溫馨提示:

1、  默認(rèn)支持中文、英文、中英混合識別;中文包含普通話、天津話、河北話、東北話、甘肅話、山東話、太原話;

2、  廣東話、河南話、西南官話需購買使用,其中西南官話包含云南話、貴州話、重慶話、四川話;

3、 非實時語音轉(zhuǎn)寫結(jié)合統(tǒng)一建模的星火多語種語音識別大模型,推出英語、日語、韓語、俄語、法語、西班牙語、阿拉伯語、德語、葡萄牙語、越南語、泰語、意大利語、印地語轉(zhuǎn)寫語種識別。極大提升了語音轉(zhuǎn)寫準(zhǔn)確度,真實還原語音內(nèi)容,標(biāo)點等同步預(yù)測,帶來更流暢的體驗。后續(xù)將持續(xù)擴(kuò)增轉(zhuǎn)寫語種的支持??靵睃c擊提交工單進(jìn)行體驗吧!

4、  購買時長套餐,可在控制臺領(lǐng)取方言/語種;藏語和維語不參與套餐贈送。

應(yīng)用場景

技術(shù)規(guī)格

支持格式:

wav,flac,opus,m4a,mp3

結(jié)果:

分詞形式&完整句子形式,詞&句置信息度詞&句時間戳,詞屬性,多候選詞,文法格式智能轉(zhuǎn)換,多發(fā)音人分離

注:

1、文法格式智能轉(zhuǎn)換包括電話號碼、車牌、日期、時間以及量詞的規(guī)整,如“五點三十”引擎會識別規(guī)整為“5:30”。

2、詞屬性包括:普通詞;語氣猶豫詞,如“嗯”、“啊”、“呃”或者無意義的重復(fù)詞等;標(biāo)點符號,如“,”等。

3、語音轉(zhuǎn)寫的識別文字結(jié)果為異步獲取,最長5小時之內(nèi)獲取。

4、語音轉(zhuǎn)寫引擎是適用于5小時以內(nèi)的長音頻識別,若您有大量1分鐘以內(nèi)的短音頻需要識別,為了提高識別效率,建議使用語音聽寫服務(wù)。

5、使用本服務(wù)前請參閱實踐指南,以獲得更高的轉(zhuǎn)寫準(zhǔn)確率。

開發(fā)者資源

WebAPI

可直接調(diào)用的WebAPI接口,具備流式傳輸能力,具備輕量、跨平臺的特點

視頻教程

常見問題

1、 “語音轉(zhuǎn)寫 ”與 “語音聽寫 ”的區(qū)別是?

產(chǎn)品名稱 支持的音頻時長  使用場景 語音聽寫 一分鐘以內(nèi) 人機(jī)對話,如輸入法、語音搜索 語音轉(zhuǎn)寫 五小時以內(nèi) 更自然地貼近日常的對話、演講

2、 “已錄制音頻轉(zhuǎn)寫”和“實時音頻流轉(zhuǎn)寫”的區(qū)別是?

已錄制音頻(recorded audio)轉(zhuǎn)寫:將預(yù)先錄制完畢的完整音頻文件傳輸至云端,轉(zhuǎn)寫服務(wù)處理完成后將輸出此音頻對應(yīng)的完整文字結(jié)果。該流程為異步&非實時;

實時音頻流(real-time streaming)轉(zhuǎn)寫:在采集音頻的同時,連續(xù)上傳音頻流至云端,轉(zhuǎn)寫服務(wù)將實時返回文字結(jié)果,實現(xiàn)文字和聲音的同步展現(xiàn)。

實時語音轉(zhuǎn)寫已上線,歡迎使用。

3、語音轉(zhuǎn)寫支持什么語言?

答:默認(rèn)支持中文、英文、中英混合識別;中文包括普通話、天津話、河北話、東北話、甘肅話、山東話、太原話;其他方言/語種需購買套餐或語種授權(quán)。目前可支持:

l  方言:廣東話、河南話、西南官話(云南話、貴州話、重慶話、四川話)

l  語種:中文、英文、日語、韓語、法語、俄語、越南語、西班牙語、阿拉伯語、德語、意大利語

l  民族語言:藏語、維語

4、目前語音轉(zhuǎn)寫支持的音頻格式為:

已錄制音頻(5小時內(nèi)),wav,flac,opus,m4a,mp3,單聲道&多聲道;采樣率:8KHz,16KHz

5、語音轉(zhuǎn)寫支不支持并發(fā)?

答:支持,要保證同一個appid每秒請求接口次數(shù)最大值在20次以下。

相關(guān)知識

語音轉(zhuǎn)文字
【Android語音合成與語音識別】
語音識別
智能語音交互
智能語音識別技術(shù):賦能人工智能應(yīng)用新篇章
描寫環(huán)境氛圍詞語大全
ai語音識別聲音防沉迷
什么是智能語音服務(wù)(智能語音服務(wù)介紹)
智能語音系統(tǒng)助力醫(yī)療大健康
MaineHealth公司推出的電子健康記錄系統(tǒng)具備語音識別功能

網(wǎng)址: 語音轉(zhuǎn)寫 http://m.u1s5d6.cn/newsview681918.html

推薦資訊