美譽(yù)度品牌管理
大模型時(shí)代需要什么樣的輸入法?
進(jìn)入21世紀(jì)第3個(gè)十年,人工智能迎來(lái)“智慧涌現(xiàn)”的大模型時(shí)代,鍵盤打字、整句聯(lián)想、斗圖……這些“傳統(tǒng)”的功能可能已經(jīng)無(wú)法滿足廣大用戶的個(gè)性化需求。
如何在產(chǎn)品形態(tài)已經(jīng)很成熟的情況下,不斷解構(gòu)用戶場(chǎng)景、挖掘用戶持續(xù)發(fā)展的需求,是頭部玩家的永恒命題。
在13周年之際,訊飛輸入法發(fā)布“面向下一代輸入法的生成式AI”,并帶來(lái)全新的13.0版本,開(kāi)啟生成式AI輸入時(shí)代。
基于大模型的AI能力,訊飛輸入法13.0支持60多款應(yīng)用,覆蓋6大表達(dá)場(chǎng)景,并率先開(kāi)啟人機(jī)交互界面革新,推出全新的卡片式推薦區(qū)“活力視界”,在屏幕與按鍵之間采用雙行顯示,支持自由組合卡片功能,將傳統(tǒng)的文字呈現(xiàn)方式升級(jí)為“Feed流”式的交互體驗(yàn)。
據(jù)悉,訊飛輸入法的“AI創(chuàng)作助手”于今年8月首次推出并開(kāi)啟內(nèi)測(cè)。據(jù)訊飛官方數(shù)據(jù),經(jīng)過(guò)兩個(gè)多月的上線驗(yàn)證,基于星火大模型的“AI創(chuàng)作助手”月累計(jì)請(qǐng)求量已超過(guò)6000萬(wàn)次,用戶點(diǎn)贊率超過(guò)85%。此次升級(jí),“AI創(chuàng)作助手”再次進(jìn)化,致力于幫助用戶“智慧表達(dá)”和“智能連接”。
那么,訊飛輸入法13.0究竟能夠?yàn)橛脩魩?lái)什么樣的生成式AI新體驗(yàn)?“生成式AI輸入法”與傳統(tǒng)輸入法相比,核心能力有哪些?大模型時(shí)代下,輸入法未來(lái)的發(fā)展趨勢(shì)是什么?
美譽(yù)度與訊飛輸入法總經(jīng)理程坤、訊飛輸入法產(chǎn)品總監(jiān)趙明路進(jìn)行了深入交流,并第一時(shí)間試用了訊飛輸入法13.0,從中尋找這些問(wèn)題的答案。
一、60+應(yīng)用覆蓋6大場(chǎng)景,把深、厚、大的能力隱藏在薄頁(yè)面中
2010年,訊飛推出第一代訊飛輸入法,開(kāi)啟了中文輸入法的語(yǔ)音輸入時(shí)代。
而現(xiàn)在,伴隨著“生成式AI”浪潮的到來(lái),各個(gè)領(lǐng)域都迎來(lái)了“智慧涌現(xiàn)”的大模型時(shí)代,輸入法領(lǐng)域自然也發(fā)生著巨變。
下一代輸入法應(yīng)該是什么樣的?具備智慧表達(dá)、智能連接兩大能力,自適應(yīng)、自進(jìn)化兩大特征的“生成式AI輸入法”,是訊飛輸入法團(tuán)隊(duì)在這個(gè)新時(shí)代交出的首份答卷。
基于這兩大能力和特征,訊飛輸入法13.0提供了20余款A(yù)I創(chuàng)作助手,覆蓋6大場(chǎng)景、60多款應(yīng)用。
訊飛輸入法13.0在人機(jī)交互上也進(jìn)行了革新,上線業(yè)界首創(chuàng)的“活力視界”交互界面,在屏幕與按鍵之間采用雙行顯示,以創(chuàng)新式的卡片設(shè)計(jì),實(shí)現(xiàn)Feed流式的交互體驗(yàn)。
▲用戶可在菜單面板開(kāi)啟“活力視界”界面
與傳統(tǒng)的文字候選欄相比,“活力視界”創(chuàng)新組合了Emoji(表情符號(hào))、花樣字、斗圖等多樣化的候選建議,甚至輸入之外的擴(kuò)展服務(wù),內(nèi)容展示更加多元。
▲“活力視界”為用戶提供斗圖、Emoji等候選建議
從產(chǎn)品設(shè)計(jì)的角度來(lái)看,趙明路認(rèn)為,一個(gè)好的產(chǎn)品應(yīng)該用簡(jiǎn)單的界面為用戶提供多維的價(jià)值。
“活力視界”作為連接傳統(tǒng)界面設(shè)計(jì)和全新AI功能服務(wù)之間的線索,通過(guò)一個(gè)簡(jiǎn)單的兩行視窗,將產(chǎn)品背后豐富的AI能力矩陣呈現(xiàn)在用戶面前。
對(duì)于用戶來(lái)說(shuō),訊飛輸入法從交互方式上看起來(lái),可能并沒(méi)有太大的變化,用戶也不需要花費(fèi)較大的學(xué)習(xí)成本去理解其中的層級(jí)結(jié)構(gòu)。只要用戶能更便捷地使用服務(wù),在使用中能感受到“更懂我”,就是訊飛想要達(dá)到的效果。
▲趙明路解讀訊飛輸入法13.0的產(chǎn)品創(chuàng)新
程坤告訴美譽(yù)度,生成式AI輸入法的意義和價(jià)值,可以從兩個(gè)層面來(lái)理解,也就是智慧表達(dá)和智慧連接這兩大能力。
1、智慧表達(dá):有大腦、有思想、有靈魂的輸入法
首先,從用戶角度來(lái)看,生成式AI技術(shù)相當(dāng)于為輸入法加上了“大腦”。
上一代輸入法只能做文字輸入,而現(xiàn)在通過(guò)生成式AI賦能,輸入法不僅能幫助用戶把靈感更好地表達(dá)出來(lái),還能激發(fā)更多創(chuàng)意。
智慧表達(dá)能力主要分為三個(gè)場(chǎng)景,在用戶輸入的各個(gè)時(shí)機(jī),即輸入前、輸入中、輸入后,以不同的方式完善用戶的表達(dá)。
一是在輸入前智能生成?;趯?duì)上下文內(nèi)容的理解,結(jié)合不同表達(dá)需求智能生成內(nèi)容,主動(dòng)替用戶表達(dá)。
例如,當(dāng)用戶處于聊天、發(fā)布、評(píng)論、評(píng)價(jià)等不同場(chǎng)景的輸入框時(shí),“活力視界”右端的推薦欄會(huì)自動(dòng)根據(jù)場(chǎng)景需求,提供不同的功能。
美譽(yù)度分別選取了朋友圈、微博、淘寶、小紅書(shū)這四個(gè)應(yīng)用場(chǎng)景體驗(yàn),訊飛輸入法均自動(dòng)提供了相應(yīng)風(fēng)格的文案。
▲訊飛輸入法在朋友圈、微博、淘寶生成不同風(fēng)格的文案
同樣的,在文案生成后,用戶可以通過(guò)下方的指令切換不同的風(fēng)格。例如訊飛輸入法生成下面這段小紅書(shū)文案后,我希望它能提供一個(gè)更簡(jiǎn)短的版本,點(diǎn)擊“語(yǔ)言簡(jiǎn)練點(diǎn)”即可重新生成更符合需求的文案。
▲使用訊飛輸入法生成小紅書(shū)文案(動(dòng)圖有加速)
二是在輸入中智能補(bǔ)全?;谟脩粢呀?jīng)輸入的內(nèi)容,訊飛輸入法13.0能幫助用戶補(bǔ)全句子或續(xù)寫(xiě)文章。
在補(bǔ)全句子后,用戶可以繼續(xù)在下方選擇第二次指令,如引用名言、增加Emoji、改變語(yǔ)氣等。
▲擴(kuò)寫(xiě)句子后,用戶可點(diǎn)擊下方指令為文字增加Emoji
三是在輸入后智能潤(rùn)色。基于用戶在聊天、評(píng)論、發(fā)布等不同場(chǎng)景中輸入的內(nèi)容,結(jié)合用戶表達(dá)習(xí)慣或需求,對(duì)用戶的表達(dá)進(jìn)行應(yīng)情應(yīng)景的智能潤(rùn)色。
▲智能潤(rùn)色后,用戶點(diǎn)擊下方指令可二次生成不同風(fēng)格文字
2、智能連接:理解用戶意圖,以用戶為中心連接萬(wàn)物
其次,從輸入法品類角度來(lái)看,生成式AI能夠幫助輸入法從工具型應(yīng)用向服務(wù)型應(yīng)用轉(zhuǎn)型,無(wú)論是輸入法App內(nèi)還是跨App應(yīng)用,都能將用戶與其輸入后想要的服務(wù)連接起來(lái)。
智能連接能力主要體現(xiàn)在連接輸入場(chǎng)景內(nèi)外多元服務(wù)上,在不同的場(chǎng)景主動(dòng)為用戶提供不同的功能選擇。
其中比較具有代表性的功能是AI剪貼板。用戶無(wú)需輸入任何內(nèi)容,只需復(fù)制想要回復(fù)的消息,“活力視界”窗口就會(huì)自動(dòng)彈出AI剪貼板功能,并提供智能回復(fù)等選項(xiàng)。
▲只需復(fù)制消息,AI剪貼板就可以提供智能回復(fù)
此外,在AI剪貼板中右滑,可以看到拆詞、翻譯、搜索等更多功能,點(diǎn)擊“翻譯”即可自動(dòng)翻譯剪貼板中的內(nèi)容。
▲AI剪貼板自動(dòng)翻譯用戶剪貼板內(nèi)容
AI剪貼板提供的翻譯功能,也是訊飛輸入法智能連接能力的體現(xiàn)——連接輸入場(chǎng)景之外的內(nèi)容與服務(wù),用戶無(wú)需切換至翻譯應(yīng)用,即可獲得文字翻譯功能。
二、推出首個(gè)輸入法認(rèn)知大模型,打造“1+N+X”生態(tài)的重要一環(huán)
10月24日,訊飛發(fā)布星火認(rèn)知大模型V3.0,與70天前剛剛發(fā)布的星火大模型V2.0相比,文本生成、語(yǔ)言理解、多模態(tài)等七大能力全面提升,全面對(duì)標(biāo)ChatGPT。
訊飛采取了“1+N(重大行業(yè))+X(細(xì)分行業(yè)及產(chǎn)品)”的生態(tài)體系戰(zhàn)略,而訊飛輸入法,則是其中的“N”環(huán)節(jié)里,“智慧輸入”這一賽道的應(yīng)用,是整個(gè)生態(tài)系統(tǒng)布局的重要一環(huán)。
在星火大模型V3.0的基礎(chǔ)上,訊飛為輸入法量身定制了首個(gè)輸入法認(rèn)知大模型,涵蓋文本生成、多語(yǔ)言語(yǔ)音、多模態(tài)生成等生成式AI能力矩陣。
首先,文本生成能力是訊飛輸入法的基礎(chǔ)與核心能力,也是智慧涌現(xiàn)開(kāi)始的地方。
在多語(yǔ)言語(yǔ)音能力上,訊飛輸入法在去年率先發(fā)布了語(yǔ)音個(gè)性化方言免切換系統(tǒng),對(duì)整個(gè)方言語(yǔ)音系統(tǒng)的使用有極大促進(jìn)。從今年6月到9月,短短三個(gè)月內(nèi),訊飛輸入法閩南話的使用率提升了1177%。
在此基礎(chǔ)上,今年,訊飛輸入法額外構(gòu)建了多語(yǔ)言語(yǔ)音大模型,將識(shí)別、翻譯、語(yǔ)種分類多任務(wù)聚合,達(dá)到信息共享互通的目的,實(shí)現(xiàn)語(yǔ)種免切換識(shí)別、語(yǔ)音到目標(biāo)語(yǔ)種自動(dòng)翻譯以及領(lǐng)域識(shí)別效果增強(qiáng)。
目前,訊飛輸入法13.0多語(yǔ)種自動(dòng)識(shí)別覆蓋了37種語(yǔ)言,端到端語(yǔ)音翻譯超過(guò)13個(gè),在多語(yǔ)言識(shí)別的通用效果上也提升了30%。
在多模態(tài)生成能力上,基于訊飛星火多模態(tài)大模型,輸入法認(rèn)知大模型將多模態(tài)對(duì)齊到統(tǒng)一語(yǔ)義空間中,通過(guò)兩種方式,即多模態(tài)理解和多模態(tài)生成兩種任務(wù)的協(xié)同訓(xùn)練,來(lái)實(shí)現(xiàn)多模態(tài)的協(xié)同。
目前,訊飛輸入法逐漸開(kāi)始落地應(yīng)用多模態(tài)生成式AI的能力,如AI皮膚、AI頭像、AI造字等,為輸入法的個(gè)性化帶來(lái)更多可能性。
▲訊飛輸入法AI皮膚、AI頭像、AI造字界面
除了最基本的生成化特點(diǎn)以外,訊飛認(rèn)為,新一代輸入法認(rèn)知大模型還應(yīng)具備個(gè)性化、場(chǎng)景化、自進(jìn)化的特點(diǎn)。
在自進(jìn)化和場(chǎng)景化方面,研發(fā)團(tuán)隊(duì)結(jié)合對(duì)比學(xué)習(xí),構(gòu)建了大量正例和負(fù)例用于訓(xùn)練Reward Model(獎(jiǎng)勵(lì)模型),并提出了4種Reward Model訓(xùn)練方法,可以在不需要外接人工干預(yù)的情況下,實(shí)現(xiàn)大模型的常態(tài)化自更新。
上一代的輸入法其實(shí)已經(jīng)具備很多功能,包括不同的輸入模式、不同的鍵位、多種外部功能等。如果對(duì)每個(gè)功能和項(xiàng)目都進(jìn)行單獨(dú)建模,整個(gè)系統(tǒng)融合起來(lái)的難度是很大的。
針對(duì)這個(gè)問(wèn)題,訊飛輸入法研發(fā)團(tuán)隊(duì)提出名為ALL-IN-ONE的統(tǒng)一模型架構(gòu),利用Prompt(提示詞)做任務(wù)引導(dǎo),將不同的任務(wù)進(jìn)行分解耦合訓(xùn)練。除了提高整個(gè)系統(tǒng)的穩(wěn)定性,對(duì)可用性、安全性也有很大的提升。
▲科大訊飛AI研究院副院長(zhǎng)丁克玉解讀統(tǒng)一建模與自進(jìn)化
在個(gè)性化方面,面向C端時(shí),大模型的個(gè)性化問(wèn)題一直是業(yè)界難題,因?yàn)槠髽I(yè)無(wú)法為每個(gè)用戶構(gòu)建一個(gè)專屬的大模型。
對(duì)此,訊飛輸入法研發(fā)團(tuán)隊(duì)提出了Low-Rank個(gè)性化定制方法,通過(guò)將模型尺寸降低到認(rèn)知大模型的十萬(wàn)分甚至百萬(wàn)分之一,來(lái)使小規(guī)模的個(gè)性化模型能夠在手機(jī)等移動(dòng)設(shè)備上順利運(yùn)行。
具體來(lái)說(shuō),Low-Rank通過(guò)使用場(chǎng)景和相關(guān)的用戶操作記錄下來(lái),在端側(cè)訓(xùn)練小模型,既實(shí)現(xiàn)了個(gè)性化,又保障了用戶信息的安全。
三、13年堅(jiān)持聚焦用戶需求,開(kāi)啟輸入法領(lǐng)域的“iPhone時(shí)刻”
今年3月,英偉達(dá)CEO黃仁勛曾在演講中說(shuō),AI的“iPhone時(shí)刻”正在到來(lái)。
而訊飛輸入法,想要開(kāi)啟輸入法領(lǐng)域的“iPhone時(shí)刻”。
13年前,訊飛推出第一代訊飛輸入法,開(kāi)創(chuàng)了中文語(yǔ)音輸入法的先河。趙明路稱,這其實(shí)就是一個(gè)小小的“iPhone時(shí)刻”。
數(shù)據(jù)顯示,與去年同期相比,訊飛輸入法日語(yǔ)音滲透率提升18%,日語(yǔ)音調(diào)用量提升35%,00后用戶占比提升17%,日活躍用戶規(guī)模提升10%,用戶規(guī)模保持高速增長(zhǎng),產(chǎn)品核心指標(biāo)蟬聯(lián)行業(yè)第一。
▲訊飛輸入法產(chǎn)品核心指標(biāo)提升數(shù)據(jù)
作為一款十幾年的“老產(chǎn)品”,尤其是在輸入法市場(chǎng)規(guī)模增長(zhǎng)緩慢的情況下,訊飛輸入法能夠做到年化10%的活躍用戶增幅,離不開(kāi)團(tuán)隊(duì)持續(xù)13年對(duì)用戶需求的深入觀察,以及對(duì)新興技術(shù)的持續(xù)跟進(jìn)。
▲訊飛輸入法內(nèi)容生態(tài)總監(jiān)盧潔解讀用戶洞察
回顧訊飛輸入法13年的發(fā)展歷程,程坤告訴美譽(yù)度,有幾個(gè)特別的節(jié)點(diǎn)對(duì)訊飛輸入法的發(fā)展非常關(guān)鍵。
首先是2010年,訊飛輸入法誕生的日子。當(dāng)時(shí),這款產(chǎn)品的名字還叫“訊飛語(yǔ)音輸入法”,是首款中文語(yǔ)音輸入法,它開(kāi)啟了上一代輸入法的“語(yǔ)音輸入時(shí)代”。
其次是2012年,訊飛輸入法率先將DNN(深度神經(jīng)網(wǎng)絡(luò))應(yīng)用到語(yǔ)音識(shí)別任務(wù)中,相對(duì)于傳統(tǒng)的模型算法使識(shí)別效果獲得大幅提升,標(biāo)志著語(yǔ)音輸入從“可用”向“好用”發(fā)展。
2016年,訊飛與錘子手機(jī)合作,首次在萬(wàn)人體育場(chǎng)演示語(yǔ)音輸入,使語(yǔ)音輸入為更多人所知,用戶量也獲得爆發(fā)式增長(zhǎng),月活突破1億,達(dá)到1.1億規(guī)模。
2018年作為一個(gè)起點(diǎn),訊飛輸入法開(kāi)始全面擁抱年輕人,先后上線了有趣的、DIY功能、交流社區(qū)以及內(nèi)容開(kāi)放平臺(tái),開(kāi)始由提升效率向表達(dá)個(gè)性的方向發(fā)展。
而如今在2023年,伴隨著新生用戶的需求增長(zhǎng)和大模型時(shí)代新技術(shù)的賦能,訊飛輸入法探索在產(chǎn)品功能、內(nèi)容生態(tài)多方面應(yīng)用生成式AI技術(shù),想要開(kāi)啟輸入法的生成式AI時(shí)代。
趙明路告訴美譽(yù)度,如果要用一句話來(lái)形容訊飛輸入法13.0與12.0相比最大的革新,那就是——全面擁抱生成式AI。
趙明路稱,用戶的需求、技術(shù)的發(fā)展,始終是訊飛輸入法團(tuán)隊(duì)不斷創(chuàng)新、不斷進(jìn)行產(chǎn)品迭代的最大驅(qū)動(dòng)力。
星火大模型提供堅(jiān)實(shí)的技術(shù)底座,對(duì)用戶需求的敏銳洞察提供產(chǎn)品創(chuàng)新的動(dòng)力,在技術(shù)和產(chǎn)品的雙向驅(qū)動(dòng)下,訊飛輸入法筑起“護(hù)城河”,成為輸入法品類中的佼佼者。
生成式AI輸入法不會(huì)是終點(diǎn)。在訊飛輸入法研發(fā)團(tuán)隊(duì)看來(lái),它更像是一個(gè)分水嶺,一個(gè)新的發(fā)展趨勢(shì)。
程坤談道,從長(zhǎng)遠(yuǎn)來(lái)看,未來(lái),每個(gè)人都會(huì)有一個(gè)智能助理。輸入法作為一個(gè)既被高頻使用,又能跨場(chǎng)景、跨應(yīng)用的品類,能夠連接不同應(yīng)用之間的“孤島”,同時(shí)又將大模型理解、推理、生成、多模態(tài)等優(yōu)勢(shì)能力發(fā)揮出來(lái)。
無(wú)論是交互界面上的重塑,還是AI功能的增加和深入,都有可能成為繼語(yǔ)音輸入后,下一個(gè)融入每個(gè)人生活中難以割舍的用戶習(xí)慣。
結(jié)語(yǔ):輸入法開(kāi)啟生成式AI輸入新時(shí)代
輸入法是智能手機(jī)、平板、電腦、智慧屏等帶屏智能終端所必備的軟件產(chǎn)品,滲透到每一位用戶的日常生活中。
在大模型時(shí)代,正如程坤所說(shuō),生成式AI在輸入法中的應(yīng)用落地是一個(gè)必然的趨勢(shì)。不僅是訊飛,市面上其他頭部輸入法廠商也都在做相關(guān)的嘗試。
不同于傳統(tǒng)的拼音、手寫(xiě)或語(yǔ)音輸入,生成式AI輸入無(wú)論是在內(nèi)容的玩法、表達(dá)的多樣性,還是在服務(wù)連接能力上,都能提供更多的想象空間。輸入法不再是一個(gè)冷冰冰的工具,而是更懂用戶、為每個(gè)用戶量身定制的個(gè)性化產(chǎn)品。