美譽(yù)度品牌管理
過去三個(gè)月,隨著“千模大戰(zhàn)”在全國爆發(fā),頭部玩家百度文心一言“大招”不斷。
昨日,百度智能云在成都舉辦的技術(shù)交流會上公布了最新成績單:過去近三個(gè)月,文心一言實(shí)現(xiàn)了推理性能提升10倍,高性能版推理性能提升50倍。這意味著,同等效果的大模型,企業(yè)獲取的成本大大降低。
同時(shí),百度文心一言大模型在應(yīng)用上“再攻一城”:繼百度搜索、百度地圖、小度音箱等應(yīng)用接入文心一言之后,昨日,基于文心大模型的AI輔助編程工具Comate啟動邀測,助開發(fā)者提高研發(fā)效率。
▲基于Comate輔助的“貪吃蛇”游戲編程
在市場和生態(tài)方面,百度智能云也公布了一組數(shù)據(jù):截至當(dāng)下,已有超15萬客戶申請接入文心一言,超300家企業(yè)成為文心一言生態(tài)伙伴,實(shí)現(xiàn)超400個(gè)具體場景落地。結(jié)合此前百度公布的10億元文心投資基金,這些數(shù)據(jù)展現(xiàn)出文心一言的強(qiáng)勁表現(xiàn)。
頭部客戶方面,包括百圖生科、長安汽車、地平線、知乎、軟通動力等在內(nèi)的多家企業(yè),都基于百度文心千帆大模型平臺取得了大模型落地進(jìn)展。
AI大模型的“百度速度”,從一定程度上代表了國產(chǎn)大模型的發(fā)展速度。而在國產(chǎn)大模型加速賽跑的同時(shí),國外的微軟、亞馬遜的AI競賽同樣愈演愈烈,為國產(chǎn)大模型施壓。
加速AI發(fā)展成為各地政策所向,如何縮短與GPT-4的差距,也一直是國內(nèi)產(chǎn)業(yè)持續(xù)關(guān)注的問題。通過對話百度智能云AI平臺副總經(jīng)理施恩,我們深入了解了百度文心一言過去三個(gè)月的迭代思路和心路歷程,同時(shí)也探討了AI大模型落地產(chǎn)業(yè)的真實(shí)挑戰(zhàn)和應(yīng)對之道。
一、從代碼助手到千行百業(yè),國產(chǎn)AI大模型加速“軟著陸”
首先來看看大模型應(yīng)用更新。在本次技術(shù)交流會上,AI代碼助手Comate是一個(gè)文心大模型應(yīng)用矩陣中的新物種。
作為一款程序員“神器”,Comate可幫程序員實(shí)現(xiàn)代碼的快速補(bǔ)齊、自然語言推薦代碼、自動查找代碼錯(cuò)誤,從而提升研發(fā)效率。根據(jù)百度官方數(shù)據(jù),在Comate輔助編寫的代碼中,近50%的建議代碼被開發(fā)者采納。
實(shí)際上,市面上已經(jīng)有一些同類AI代碼助手上線,包括微軟旗下GitHub推出的Copilot X、AWS推出的CodeWhisperer等。那么Comate的實(shí)際體驗(yàn)效果如何?
會上,施恩通過一個(gè)“貪吃蛇”小游戲的開發(fā)現(xiàn)場演示了Comate。當(dāng)開發(fā)者輸入“canvas”,以及“彈性布局,水平居中,垂直居中”等中文備注,“Comate”即自動識別語義,生成游戲畫布代碼。當(dāng)他再輸入“param color”、“l(fā)eft”、”food=”等顏色、方向、食物的簡單詞匯,“Comate”自動聯(lián)系上下文理解指令,補(bǔ)全代碼,并在多條推薦代碼之間切換,選擇合適代碼,系統(tǒng)就直接生成了可運(yùn)行的“貪吃蛇”小游戲。
據(jù)悉,百度自2021年起就基于文心大模型研發(fā)代碼輔助工具,自2022年9月起就在內(nèi)部全面測試。Comate目前已經(jīng)覆蓋了30余種編程語言,包括 C/C++、Python、Java、Go、PHP、JavaScript等。Comate支市面上主流IDE,開發(fā)者可以通過插件等形式,在不同軟件中使用Comate。同時(shí),結(jié)合飛槳深度學(xué)習(xí)框架與文心大模型,Comate可確保推理單次請求300ms左右,以極快的響應(yīng)速度保障用戶使用體驗(yàn)。
面對市面上已有大廠的編程輔助工具,百度的AI代碼助手有什么差異化價(jià)值?
施恩告訴美譽(yù)度,市面上代碼助手工具的定位都是用于輔助代碼撰寫,提升效率,Comate的一大差異化在于考慮了國內(nèi)開發(fā)者的中文注釋習(xí)慣,具備中文注釋推薦代碼能力。同時(shí),相比于市面上產(chǎn)品大多基于開源代碼訓(xùn)練,百度Comate是結(jié)合其內(nèi)部眾多業(yè)務(wù)開發(fā)代碼訓(xùn)練而來,能做到業(yè)務(wù)實(shí)用性更強(qiáng);此外,相比市面上產(chǎn)品需要基于公有云部署,Comate則支持私有化部署,從而減少安全隱患。
根據(jù)百度智能云的規(guī)劃,在第一階段,Comate的主要功能是以輔助代碼撰寫為主;在第二階段,Comate將實(shí)現(xiàn)在特定領(lǐng)域、場景的自然語言代碼生成;第三階段,將實(shí)現(xiàn)全領(lǐng)域的自然語言開發(fā)。
縱觀過去三個(gè)月里文心一言落地的應(yīng)用,已經(jīng)形成了一個(gè)矩陣。除了Comate,文心一言已落地百度搜索、新聞推薦、百度地圖、如流辦公平臺、小度智能音箱等百度自有業(yè)務(wù),同時(shí)落地了百圖生科、長安汽車、地平線、知乎、軟通動力等企業(yè)場景。
盡管很多場景還在探索之中,實(shí)際效果尚待驗(yàn)證,但大模型在行業(yè)的“軟著陸”目前來看進(jìn)展順利。
二、推理性能提升50倍,文心一言主動“瘦身”賦能行業(yè)
除了肉眼可見的應(yīng)用方面進(jìn)展,按照百度智能云公布的情況,文心一言大模型本身的迭代也達(dá)四版,效果和性能方面顯著提升。
根據(jù)百度智能云官方數(shù)據(jù),自3月16日文心一言開放測試以來,模型本身的推理性能已提升10倍。同時(shí),在企業(yè)應(yīng)用的高頻、核心場景中,文心一言的高性能模式“文心一言-Turbo”,其推理服務(wù)性能已經(jīng)提升了50倍。
文心一言-Turbo是什么意思?50倍性能提升又意味著什么?
文心一言-Turbo,簡單來說,可以理解為一個(gè)“瘦身”的文心一言大模型,能在保證實(shí)現(xiàn)文心一言相同效果的同時(shí),降低模型參數(shù)規(guī)模,從而降低企業(yè)的使用大模型的算力成本。
而在50倍這一數(shù)字背后,施恩告訴美譽(yù)度,隨著文心一言-Turbo帶來50倍性能提升,未來客戶將能感受到使用成本的降低。同時(shí),模型的響應(yīng)時(shí)長將被縮短,使得對時(shí)延要求高的場景體驗(yàn)大大提升。此外,在資源擴(kuò)展性方面,文心一言-Turbo使得私有云部署的客戶算力儲備和占用變少,取得明顯收益。
文心一言及文心一言Turbo有各自適用的場景,為不同企業(yè)提供了不同選擇。
一類是通用應(yīng)用型企業(yè),往往需要用大模型改善終端應(yīng)用效果或孵化創(chuàng)新應(yīng)用,比如WPS、石墨等,核心關(guān)注的是大模型的效果保障。由于很多企業(yè)的應(yīng)用是通用的,因此會選擇泛化性更強(qiáng)的文心一言,以解決更多問題。
一類是行業(yè)龍頭企業(yè),希望構(gòu)建行業(yè)大模型服務(wù)上下游企業(yè)。比如教育、金融、能源等方向的龍頭企業(yè),手握行業(yè)數(shù)據(jù)和場景積累,需要在專業(yè)領(lǐng)域構(gòu)建基于行業(yè)大模型的應(yīng)用。文心一言Turbo更適用于終端的應(yīng)用場景,結(jié)合企業(yè)自身數(shù)據(jù)能達(dá)到更好的場景化效果。
可以看到,經(jīng)過近3個(gè)月迭代發(fā)展,百度文心一言的行業(yè)落地正在分出兩條清晰的路線:通用大模型和行業(yè)大模型并舉。
縱觀全球AI大模型發(fā)展格局,國內(nèi)AI大模型與OpenAI旗下的GPT-4的差距難以在短時(shí)間內(nèi)趕上。但3個(gè)月的落地讓施恩對這一問題有了新認(rèn)識,他認(rèn)為,企業(yè)更關(guān)注的是大模型如何與企業(yè)場景做結(jié)合解決實(shí)際問題,而不是大模型評測情況。
“通用模型能力是一方面的,怎樣更好地跟行業(yè)數(shù)據(jù)、行業(yè)知識相結(jié)合,去解決問題是更重要實(shí)用的。”施恩說,“我們這兩個(gè)方面都會關(guān)注。通用模型的邏輯、推理等能力提升,有助于更好訓(xùn)練行業(yè)大模型;同時(shí)也不完全依賴于通用模型的全面性,不影響我們在一些特定的行業(yè)去應(yīng)用落地?!?/p>
三、文心千帆進(jìn)化10周,大模型正顛覆云計(jì)算范式
根據(jù)科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,目前中國10億以上參數(shù)規(guī)模的大模型已達(dá)79個(gè)。但這可能僅僅是冰山之上的情況,一場“千模大戰(zhàn)”在過去三個(gè)月里已經(jīng)鋪開。
市場需求在過去三個(gè)月已發(fā)生微妙變化,也影響著智能云產(chǎn)業(yè)的發(fā)展走勢。
百度集團(tuán)副總裁侯震宇在5月的閉門技術(shù)交流會上談道,在3月16日文心一言剛開放時(shí),來咨詢的客戶大多是CEO級別的一把手,從戰(zhàn)略上認(rèn)可大模型的重要性;兩個(gè)多月之后,團(tuán)隊(duì)接觸到越來越多業(yè)務(wù)負(fù)責(zé)人,他們希望更快用大模型提高業(yè)務(wù)能力,從而在競爭中獲得優(yōu)勢。
與此同時(shí),隨著AI大模型落地行業(yè),一些實(shí)際挑戰(zhàn)也顯現(xiàn)出來。施恩告訴美譽(yù)度,一是客戶使用上的困難,比如大模型需要較好的Prompt(提示詞)做觸發(fā),而一些客戶難以結(jié)合場景去編寫Prompt,就使效果打折扣;二是通用大模型與專用場景的匹配不足,專業(yè)知識庫的缺乏阻礙大模型效果發(fā)揮;另外是與企業(yè)業(yè)務(wù)系統(tǒng)集成的挑戰(zhàn),這需要與更具行業(yè)經(jīng)驗(yàn)的伙伴合作,等等。
AI大模型發(fā)展勢在必行,產(chǎn)業(yè)如何解決這些挑戰(zhàn)?
對此,百度實(shí)際上在文心一言上線之后就給出了解法——標(biāo)準(zhǔn)化平臺賦能行業(yè)。
3月27日,百度文心千帆一站式企業(yè)級大模型平臺開啟測試。這是一個(gè)包含了文心大模型及第三方模型,以及構(gòu)建大模型能力所需要的全場景工具鏈。比如行業(yè)伙伴需要的SFT大模型效果調(diào)優(yōu)、Prompt工程等,都可以從這個(gè)平臺上獲取。
而經(jīng)過近10周的迭代,文心千帆平臺雖然還不能說取得成績,但已經(jīng)在生態(tài)方面有一些進(jìn)展。除了文心一言大模型本身已迭代4個(gè)版本,還包括15萬企業(yè)申請內(nèi)測、推出五大行業(yè)樣板間、400多場景測試取成效等,包括長安汽車、百圖生科等伙伴都已經(jīng)公布了成果。
如下圖所示,文心千帆平臺大目標(biāo)是能夠覆蓋AI研發(fā)的全生命周期,包括數(shù)據(jù)管理、模型訓(xùn)練、模型評估、預(yù)測部署和插件服務(wù)等多項(xiàng)能力,支持公有云服務(wù)和私有化部署多樣化部署方式,從而實(shí)現(xiàn)更易用、更全面、更安全、更高效、更開放、更集成。
據(jù)悉,文心千帆的核心迭代思路可以歸結(jié)為兩個(gè)核心關(guān)鍵點(diǎn):一是效果,推理能力如何,與業(yè)務(wù)結(jié)合能否解決問題,是企業(yè)第一關(guān)心的。二是性能,要持續(xù)降本,對百度智能云的要求就是要在技術(shù)架構(gòu)上持續(xù)提升性能。為此,大模型落地需要由算力、框架、模型、應(yīng)用構(gòu)筑的四層架構(gòu)相互配合提供支撐。百度智能云正通過AI大底座,從芯片層、操作系統(tǒng)層、框架層、應(yīng)用層4層架構(gòu)占據(jù)先發(fā)優(yōu)勢。
可以看到,隨著AI大模型展開落地,云計(jì)算行業(yè)的產(chǎn)業(yè)規(guī)則正在被AI改變。主流商業(yè)模式正從強(qiáng)調(diào)規(guī)模的IaaS(基礎(chǔ)設(shè)施即服務(wù)),向強(qiáng)調(diào)多層技術(shù)棧協(xié)同的MaaS(模型即服務(wù))發(fā)展,為云計(jì)算產(chǎn)業(yè)帶來進(jìn)化升級的新機(jī)遇。
結(jié)語:“千模大戰(zhàn)”100天,頭部企業(yè)服務(wù)版圖基本成形
隨著AI大模型加速產(chǎn)業(yè)落地,打頭陣的百度文心一言已實(shí)現(xiàn)多次進(jìn)化迭代。
3月16日,百度大語言模型產(chǎn)品文心一言邀請測試;3月27日,百度智能云文心千帆大模型平臺面向首批企業(yè)客戶啟動內(nèi)測,在智能辦公、旅行服務(wù)、電商直播、政務(wù)服務(wù)、金融服務(wù)五大領(lǐng)域打造行業(yè)樣板間。
4月25日,百度智能云宣布六大智能產(chǎn)品系列將基于文心一言升級,未來將在安全評估完成后上線。4月26日,百度智能云宣布文心一言大模型推理成本降到原來的1/10。
5月9日、5月23日百度智能云在北京、深圳舉辦技術(shù)交流會,首次演示用“文心千帆”大模型平臺可視化微調(diào)大模型的全過程。5月31日,百度將設(shè)立10億元人民幣的百度文心投資基金。
6月6日,百度智能云推出文心一言高性能模式(文心一言-Turbo)、開放代碼助手Comate邀測。
可以看到,百度文心一言企業(yè)服務(wù)版圖成形。追溯到其升級思路,則是主要沿著效果和性能兩條主干線,以助各行各業(yè)的企業(yè)更快地通過大模型,滿足業(yè)務(wù)的實(shí)際需求。
當(dāng)我們提到AI大模型時(shí),很自然地想到的是算力。而實(shí)際上,隨著大模型在產(chǎn)業(yè)場景中找到更多的結(jié)合點(diǎn),能否解決客戶問題成為最關(guān)鍵的問題。因此,更智能的算力、靈活的框架平臺、豐富的大模型體系以及優(yōu)質(zhì)的應(yīng)用方案,都將成為企業(yè)決勝“千模大戰(zhàn)”的關(guān)鍵。