首頁 資訊 語音識別輔助工具上線:音頻轉(zhuǎn)碼、拼音相似度比較

語音識別輔助工具上線:音頻轉(zhuǎn)碼、拼音相似度比較

來源:泰然健康網(wǎng) 時間:2024年12月20日 20:52

尊敬的百度AI開放平臺用戶:

語音識別正式上線輔助工具模塊【音頻轉(zhuǎn)碼】【拼音相似度比較】,方便您可以更方便地接入語音識別服務(wù),并提高語音識別效果,歡迎使用!

1.音頻文件轉(zhuǎn)碼

在使用百度語音識別接口時,建議的音頻格式為:pcm文件、16bit 位深的單聲道、采樣率16K。如果上傳其它格式,則會在服務(wù)器端轉(zhuǎn)碼成pcm,調(diào)用接口的耗時會增加。

為方便用戶對音頻文件進行轉(zhuǎn)化,我們提供了音頻文件轉(zhuǎn)碼小工具,讓用戶方便獲取合適的音頻文件,從而提高識別效率。

【開發(fā)幫助文檔】http://ai.baidu.com/docs#/ASR-Tool/1f9b114d

2.拼音相似度比較

為提高通訊錄、歌曲名稱等專有名詞的語音識別準(zhǔn)確率,我們提供了拼音相似度比較的工具。通過模糊匹配方法,在一組候選詞中找出與搜索詞讀音最為接近的詞組。

以通訊錄為例,將通訊錄中的聯(lián)系人作為一組候選詞,如:"張三",  "張散", "張丹", "張成", "李四", "李奎"等;當(dāng)用戶的搜索詞被識別為“張山”時,我們發(fā)現(xiàn)“張三”的發(fā)音與之最為相似,因此,可以將搜索結(jié)果調(diào)整為“張三”。

【開發(fā)幫助文檔】http://ai.baidu.com/docs#/ASR-Tool/e83a09f2

成功案例參考】

智能設(shè)備行業(yè)案例:智伴-語音技術(shù)讓孩子擁有"智能伙伴"

視頻行業(yè)案例:語音識別助愛奇藝優(yōu)化搜索體驗

游戲行業(yè)案例:語音識別提升逍遙西游萬家在線交流沉浸感

百度AI語音識別技術(shù)將持續(xù)為您提供優(yōu)質(zhì)服務(wù),立即使用!

語音技術(shù)社區(qū)交流平臺:http://ai.baidu.com/forum/topic/list/166

相關(guān)知識

語音識別
電話語音識別/114查號
眼部按摩儀語音控制方案:NRK3301語音識別芯片
win7語音識別安裝包
語音識別:如何識別鼾聲
ai語音識別聲音防沉迷
什么是自動語音識別(ASR)?如何使用深度學(xué)習(xí)和GPU加速ASR
【Android語音合成與語音識別】
語音識別在移動醫(yī)療app中的應(yīng)用
語音轉(zhuǎn)文字

網(wǎng)址: 語音識別輔助工具上線:音頻轉(zhuǎn)碼、拼音相似度比較 http://m.u1s5d6.cn/newsview681634.html

推薦資訊