AI應(yīng)用風(fēng)向標(biāo)(公眾號:ZhidxcomAI)作者|江宇編輯|漠影
智東西11月26日報道,近日,豆包輸入法正式上線。體驗過的網(wǎng)友紛紛好評,抱著好奇,我們也下載體驗了一番。
(資料圖)
豆包輸入法APP的圖標(biāo)依然沿用了豆包的代表性形象,是一個舉著手機(jī)說話的豆包。這個圖標(biāo)或許是在暗示,其側(cè)重點恰是在“語音轉(zhuǎn)文字”這個功能上。
▲豆包輸入法圖標(biāo)
打開豆包輸入法APP之后,上手流程非常直接,只有兩個步驟:啟用豆包輸入法、切換到豆包輸入法。在安卓端整個過程很干脆,不會有繁瑣的權(quán)限設(shè)置。
進(jìn)入設(shè)置之后,豆包輸入法的核心功能——語音轉(zhuǎn)文字的相關(guān)內(nèi)容被放在最前面。
▲豆包輸入法“語音轉(zhuǎn)文字”設(shè)置欄
在語音設(shè)置里,除了常見的語言展示方式、數(shù)字與英文處理、弱WiFi下是否切換流量、是否允許有限使用藍(lán)牙麥克風(fēng)這些基礎(chǔ)選項之外,“智能標(biāo)點”是比較新的功能點。
它給用戶提供了四種選擇:智能增加標(biāo)點、用空格替代標(biāo)點、句末不加標(biāo)點以及保留所有標(biāo)點。真實體驗下來,我們覺得“智能標(biāo)點”這個功能在使用語音輸入時較為關(guān)鍵。
如果標(biāo)點能自動處理,那么語音轉(zhuǎn)文字之后就基本不用再進(jìn)行二次編輯了。
此外,離線語音功能是我在設(shè)置里看到的另一個亮點。只要下載大約150M的離線模型,就能在弱網(wǎng)或無網(wǎng)情況下繼續(xù)使用語音識別。
▲豆包輸入法“離線語言”下載
語音不完全依賴網(wǎng)絡(luò),對輸入法來說其實非常實用。畢竟輸入法并不是一個只在網(wǎng)絡(luò)穩(wěn)定環(huán)境下才會使用的工具,把語音能力放在端側(cè)可以避免很多使用過程中的斷點。
在簡單設(shè)置完成后,可以看到豆包輸入法的整體布局與常用的幾款輸入法較為接近。
▲豆包輸入法界面
真正體驗語音識別時,我挑了一段比較有挑戰(zhàn)性的片段,選的是《甄嬛傳》里的“滴血認(rèn)親”名場面。我把播放速度直接調(diào)到兩倍,人聲語速非??欤虚g還帶有接近文言語感的對白。
▲豆包輸入法
從結(jié)果來看,豆包只在人物姓名的識別上出現(xiàn)了偏差,其余內(nèi)容與臺詞差別不大。我也用其他輸入法對比測試過同一段內(nèi)容,差異較為直觀的。
▲另一款具備AI功能的輸入法
為了進(jìn)一步測試,我換了一段粵語片段,來自《九品芝麻官》,這一段的密集對白就比較考驗?zāi)P偷淖R別能力。
▲豆包輸入法的粵語識別效果
在豆包上測試時,每行臺詞基本都是完整呈現(xiàn)的。
此外,我嘗試了一個更貼近職場溝通的場景——中英文混說。
在豆包輸入法中,這類混合語句的識別幾乎無需修正。它能準(zhǔn)確識別英語詞匯,并與中文內(nèi)容保持正確的分割,句子的標(biāo)點也能合理補(bǔ)齊。
體驗下來,可見豆包輸入法的語音識別能力是較為強(qiáng)勁的。
語音之外我也嘗試了鍵盤輸入,主要觀察聯(lián)想欄的表現(xiàn)。比較簡單的是算術(shù)題,輸入算式,它會直接在聯(lián)想?yún)^(qū)給出運算結(jié)果。
▲豆包輸入法直接輸入等式結(jié)果
如果輸入一些常識類問題,系統(tǒng)也能給出對應(yīng)答案。
▲豆包輸入法直接輸出吳承恩屬于哪個朝代
比較意外的是,當(dāng)我輸入“前OpenAI研究員”時,聯(lián)想欄直接出現(xiàn)一串名字。
▲豆包輸入法推測出伊利亞和卡帕西
然而當(dāng)我斷開網(wǎng)絡(luò)之后,這些聯(lián)想就全部消失,可見它并不是傳統(tǒng)意義上“詞庫聯(lián)想”。
當(dāng)然,這里是否“問了AI”還是簡單的聯(lián)網(wǎng)搜索,還需要以官方解釋為準(zhǔn),但從體驗角度看,它并不是簡單的靜態(tài)詞庫,能夠在很大程度提升輸入體驗。
在整個的體驗過程中,也能感受到豆包輸入法目前仍存在一些需要補(bǔ)齊的功能。
基礎(chǔ)輸入方面,它暫時沒有手寫、五筆和繁體轉(zhuǎn)換的能力。光標(biāo)移動目前只能左右,而有些輸入法已經(jīng)支持上下跨行移動。鍵盤輸入“不跟手”的反饋在社區(qū)里也有人提到。
這些問題都屬于輸入法常規(guī)能力的一部分,可以期待豆包輸入法后續(xù)的優(yōu)化。
寫在最后:從輸入法看AI時代的人機(jī)交互
從豆包輸入法的應(yīng)運而生可以看出,在AI時代,人機(jī)交互的變化已經(jīng)開始在最日常的工具層面出現(xiàn)苗頭。
人和設(shè)備的關(guān)系正在從按鍵輸入,走向更自然、更接近日常溝通的語言表達(dá)。
而在未來,借助AI,人類或許無需再刻意學(xué)習(xí)如何操作工具,只需要說出來,甚至只是“想一想”,工具就能理解、思考并執(zhí)行。
廣告
X 關(guān)閉
廣告
X 關(guān)閉