美譽度6月10日報道,昨天,訊飛星火大模型V1.5亮相,升級了開放式知識問答、邏輯推理和數(shù)學能力、多輪對話三大綜合能力,并發(fā)布了支持純語音輸入、多模態(tài)輸入的星火APP。同時,科大訊飛還公布了星火大模型在辦公、教育、醫(yī)療、工業(yè)領域的應用新進展。
星火大模型的文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力均在持續(xù)提升,其中知識問答能力提升高達24%,邏輯推理能力提升10%。
事實上,星火大模型與教育、辦公場景的結合成果已經顯現(xiàn)出來。5月6日,訊飛星火大模型發(fā)布并集成到教育、辦公場景中,科大訊飛總裁吳曉如透露,今年6月1日到8日,擁有口語陪練、寫作助手、作文批改等功能的訊飛AI學習機激活數(shù)量同比增長214%,搭載語篇規(guī)整、一鍵成稿等功能的訊飛辦公本、訊飛聽見,用戶激活提升了176%和205%。
可以看出,新的用戶體驗正在極大激活用戶的需求。
值得一提的是,6月9日正是全國高考最后一天,訊飛研究院院長劉聰也現(xiàn)場演示了星火大模型答高考卷的能力,做數(shù)學函數(shù)題、語文閱讀理解題,都能給出邏輯清晰的分析過程。
在星火大模型發(fā)布之際,科大訊飛董事長劉慶峰就曾公布了星火年內的三次升級時間點,同時將在10月底整體趕超ChatGPT。這也是國內大模型廠商唯一明確給出升級時間的?,F(xiàn)在正是其迭代升級的關鍵節(jié)點,劉慶峰談道,因為長期主義的夢想需要一個又一個階段里程碑來實現(xiàn)。
一、三大綜合能力升級,用戶能定制200+“私人”助手
訊飛星火大模型V1.5對于用戶最需要的開放式知識問答、邏輯推理和數(shù)學能力、多輪對話三項綜合能力實現(xiàn)了升級。
同時,訊飛發(fā)布了星火APP和小程序,支持全語音對話、多模態(tài)輸入等,同步上線了“星火助手創(chuàng)作中心”,用戶可以基于自己的需求打造大大小小的智能助手。
用戶想要從0到1構建助手需要在后臺輸入相應的助手指令。如果想豐富文本的內容,用戶還可以在助手指令里添加關鍵詞,如“歡快幽默”、“引經據(jù)典”等。并且新生成的助手也會同步到PC、移動設備上。
目前,星火助手創(chuàng)作中心已經發(fā)布200多個助手。
1、開放式知識問答,文本內容能引經據(jù)典、補充分析見解
當下大模型在解決新知識更新上較為困難,回答一些事實類問題時容易發(fā)生張冠李戴的現(xiàn)象。而大模型可以基于其強大的語言理解能力,深度理解用戶需求后,從實時的數(shù)據(jù)庫、信息庫中進行知識提取,再通過概括表達能力將答案提供給用戶,從而保證結果的及時性和準確性。
吳曉如談道,其實開放式知識問答最終拼的還是大模型的自然語言理解能力。
6月9日是全國高考最后一天,借這一契機,訊飛研究院院長現(xiàn)場向星火大模型提問,“2023年全國高考甲卷的作文題是什么?并分析一下它傳遞的意義”。星火大模型不僅給出了作文題目,還描述出題面背后想傳遞的內容。
在長文本生成能力上,星火大模型也實現(xiàn)進一步提升。當問到“高考剛剛結束,孩子即將開始新的起點,請給你的孩子寫一封暖心的信”,星火生成的文本框架很清晰,并且還引經據(jù)典使得文章更加豐富。
還有關于通用人工智能產業(yè)的情況,“中國關于通用人工智能有什么新動向,并分析一下中國的基礎和優(yōu)勢”。星火羅列了國內新動向后,還進一步分析了人才、數(shù)據(jù)、政策等方面的優(yōu)勢,最后還補充了當下面臨的挑戰(zhàn)。劉聰說,星火可以自己檢索到今年6月發(fā)生的新信息,并從這些內容中抽取出共性知識,補充見解。
在司法領域,星火大模型還能幫助用戶生成起訴狀。當問到“我有個朋友叫張三,他在2023年1月5日晚上被李明家的狗咬傷了,前期治療花了2000元,耽誤上班損失了大概1500元。張三想讓李明賠償他的全部損失,但是好幾次溝通無果,想要起訴他,請列出需要準備的材料”,星火生成了包括溝通記錄、證人證言等材料,再次提問它還能直接生成起訴狀。
大模型開放式問答展現(xiàn)了更強大的想象力,再加上其自然語言處理能力和專業(yè)知識庫相融合,能為各個行業(yè)提供助力。
2、邏輯推理和數(shù)學能力升級,綜合應用數(shù)學方法解答
大模型基于思維鏈的場景式邏輯推理和數(shù)學十分緊密,因此,邏輯推理能力提升也是數(shù)學能力提升的基礎。
當問到“農夫需要帶著狼、羊、菜一起過河,只有農夫能夠劃船,而且船比較小,農夫每次只能帶一樣東西過河,如果農夫不在,羊會偷吃菜,狼會吃羊,請設計一種方法,讓農夫能夠安全地將所有東西帶過河”,星火不僅能給出方案,還會解釋每一步驟的用意。
經典謎題星火也能輕松應對,如“一條船上有三個人,但是有兩個父親、兩個兒子,請問是怎么回事?”
還有考察排列組合和空間想象力的初中數(shù)學題,當問到“六條直線相交,最多能有多少個交點?”星火會列出思考的過程,找到最終答案。
數(shù)學問題中,如三角函數(shù)等很多會包含大量的圖片等,無法通過語音或者文字輸入。訊飛星火APP基于OCR能力實現(xiàn)了圖片輸入。
例如一道考察多項式的數(shù)學問題,基于訊飛APP中的數(shù)學解題助手,就能給出完整的解題步驟。
星火大模型不僅能理清一些很繞的邏輯現(xiàn)象,還能綜合應用方程、配列組合等數(shù)學方法來解決問題。
值得一提的是,此前搜狐科技選取了百度文心一言、阿里通義千問、訊飛星火大模型、360智腦、ChatGPT對2023高考上海數(shù)學卷前10道填空題進行了測試。結果顯示,星火大模型的正確率最高為50%。
▲五大AI大模型高考數(shù)學題回答情況(圖源:搜狐科技)
3、多輪對話能力升級,化身面試官、兒童作家
一般情況下,人和人協(xié)同完成任務需要多次交互,很少能通過一次性交互就完成復雜的任務,在人機交互中同樣如此。
星火APP中的“訊飛智聘面試官”可以模擬面試現(xiàn)場,支持全語音交互。剛畢業(yè)的大學生如果沒有面試經驗,可進行模擬演練。例如說“我想面試產品經理的崗位”,助手就會詢問用戶此前的工作經歷等,最后還會基于回答內容給出整體評價和建議。
還有一個更有趣的助手是故事創(chuàng)作助手,當用戶輸入一個標題就能生成一篇故事,如“小兔子去黃山旅游探險的故事”。如果小朋友對故事不滿意,還可以補充需求,比如增加“小兔子遇到了一個伙伴皮卡丘”。
這樣的話,星火大模型生成的故事就可以基于用戶的需求不斷豐富更新。
還有一個幫助用戶生成故事的助手叫故事對話共創(chuàng),用戶輸入標題后,星火小助手不會生成整篇文章,而是先給出一段話引入,用戶再輸入下一步的故事走向,以此類推去續(xù)寫故事。
二、教育、辦公場景設備再升級,工業(yè)、醫(yī)療服務次數(shù)大幅提升
在教育行業(yè),訊飛此前發(fā)布的星火AI口語助手升級為了星火語伴APP,使得用戶使用更為便捷。該APP面向的是中小學、大學生、商務人士等所有英語學習愛好者,除一般性交流外,還能發(fā)現(xiàn)用戶發(fā)音、語法的問題,幫助糾錯,支持語音、圖片的翻譯軟件。
如果遇到不會用英語回復的問題,用戶可以切換到中文,并且中英文混合輸入星火語伴APP也能準確識別,同時,用戶還可以在設置界面調整語伴的難度。
為了打造真人面對面的對話場景,星火語伴還支持虛擬人對話。
辦公領域下,星火認知大模型搭載于訊飛聽見智慧屏,該設備的拾音范圍能達到10米,還能一線接入聲音、視頻等。錄音完成后訊飛聽見智慧屏支持快速轉寫錄音,還能基于大模型的能力整理成稿,并生成會議紀要。
同時,用戶想要離開辦公環(huán)境,還能一鍵掃碼將記錄的內容轉到手機上,同時自動生成工作待辦、自定義關鍵詞、提煉核心內容等,滿足不同領域、不同風格的文本創(chuàng)作需求。
面向B端場景,星火大模型已經在工業(yè)、醫(yī)療行業(yè)實現(xiàn)應用。
此前,科大訊飛發(fā)布了羚羊工業(yè)互聯(lián)網平臺,貫穿工業(yè)領域企業(yè)的研產供銷服管場景。工業(yè)場景的企業(yè)服務中,需要人工來對接企業(yè)需求的服務供應,但依靠人工所完成的需求和供應對接量十分有限。當下,AI+大數(shù)據(jù)的精準理解、分析、推薦在工業(yè)場景的融合應用,使得需求和供應的對接效率大幅提升。目前,羚羊平臺用戶總量達到32.2萬人次,平臺服務企業(yè)次數(shù)超72.1萬次。
基于星火大模型,訊飛推出羚機一動,能將產業(yè)的商機、政策等推薦給用戶。
例如問道“我們是一個家電生產企業(yè),車間有大小設備20多臺,正在尋求能進一步節(jié)能降耗的解決方案”,羚機一動會根據(jù)產業(yè)特點,為用戶提出建議,同時給出一些解決方案案例、資源以及相應的技術專家。
劉聰稱,基于星火大模型能力,訊飛開發(fā)了面向企業(yè)的產品介紹、新聞撰寫等工具,下一步,訊飛也將會將這一工具的能力開放出來。
星火大模型可以和工業(yè)領域的知識結合企業(yè),形成工業(yè)大腦,再和企業(yè)的知識庫結合形成企業(yè)的知識大腦,企業(yè)的生產、研發(fā)、服務、營銷各個環(huán)節(jié),可以和企業(yè)大腦進行交互,更加精準的定位問題,找到針對性的解決方案。
此外,在車間場景中,一些新員工如果遇到設備故障,也可以詢問羚機一動,“在總裝車間進行整機調試的過程中,出現(xiàn)了觸摸屏不靈的問題,有哪些原因導致”。當用戶將周邊工作環(huán)境的信息輸入,羚機一動也會再次分析并給出建議。之后,羚機一動還會為用戶提供觸摸屏替代品建議,先從公司內部庫存檢索,然后再去外部尋找合適的觸摸屏,實現(xiàn)了完成了故障查詢、購買建議、測試驗證的全流程
在醫(yī)療行業(yè)里,科大訊飛的智醫(yī)助理可以應用到診前導醫(yī)、導診,診中幫助醫(yī)生防止誤診、漏診,診后康復環(huán)節(jié)。吳曉如透露,智醫(yī)助理系統(tǒng)已經應用到全國31個省,完成6.29億次輔助診斷,修正了127份醫(yī)生的首次診斷。并且智醫(yī)助理和語音外呼相結合,已經完成了11億次電話隨訪。
一般情況下,患者出院后服務的延續(xù)性會缺失,絕大部分患者面臨出院即托管,醫(yī)患人數(shù)不匹配使得醫(yī)生不能對患者用藥、飲食安全及時指導。吳曉如舉了一個例子,腦卒中患者中有12%的人出院后30天內會再次出院,而這部分人中50%的患者其實可以通過診后康復管理避免再次入院。
基于上述現(xiàn)象,星火大模型可以對病案進行全過程分析快速生成康復計劃,同時這份計劃會實時同步到醫(yī)生、患者面前。
這一診后管理平臺的醫(yī)生端界面有患者入院、出院、會診單、檢驗記錄、住院病歷等,會基于這些數(shù)據(jù)為用戶生成包含醫(yī)生提醒、用藥指導、康復運動、飲食建議等六個維度90天的康復計劃。
經醫(yī)生審核通過后,這份計劃會同步到患者手機中,同時患者復查后上傳檢查單,醫(yī)生端的數(shù)據(jù)也會同步變化,基于患者身體數(shù)據(jù)的變化調整健康管理計劃,形成了復診、隨訪,跟蹤閉環(huán)患者康復情況的過程。
除了康復計劃制定外,智醫(yī)助理還能回答患者更加開放性的問題,同樣基于患者的病歷給出答案,如患者發(fā)燒吃退燒藥能否與長期服用藥物一起服用。
吳曉如稱,康復管理醫(yī)生診后效果康復效率提升10倍以上,即時的管理使得患者對醫(yī)生的依存性提升2.4倍,由于患者得到即時醫(yī)院隨訪,問題及時回應、指導,其對醫(yī)院的滿意度從近90%提升到98%以上。
三、開放大模型七大能力、200+助手開發(fā)接口
星火大模型發(fā)布初期,科大訊飛就要聯(lián)合行業(yè)合作伙伴共建大模型“星火”生態(tài)。劉慶峰透露,目前訊飛人工智能開放平臺上的開發(fā)團隊已經超過400萬家。
他宣布要開放星火大模型的開發(fā)接口,包括七大維度能力和200個星火小助手,并且支持多端接入快速集成,對于數(shù)據(jù)安全有更高要求的企業(yè)還支持私有化部署。
5月6日發(fā)布星火大模型時,科大訊飛就劃定了6月9日升級到V1.5,今年1024對標ChatGPT,實現(xiàn)中文超越、英文相當?shù)臅r間表。劉慶峰談道,這是因為科大訊飛在通用人工智能研究中,每一個關鍵模塊都堅持自主研發(fā),其“1+3+1”的創(chuàng)新體系,包含自主研發(fā)的安全可控大模型訓練基座、軟硬一體化的高性能大模型推理平臺,以及數(shù)據(jù)、建模和強化學習等關鍵模塊。
這也是科大訊飛能給出明確時間迭代節(jié)奏的關鍵。
未來,科大訊飛將在類腦智能、神經網絡大模型的新算法和博弈智能等領域布局,探索更多的潛在路徑,以前這些領域的交叉研究。
在人才培養(yǎng)方面,科大訊飛已經與首批全國22所重點高校聯(lián)手,開展星火大模型場景創(chuàng)新賽、訊飛高校AI星火營,讓更多學生參與到通用人工智能產業(yè)中來。
結語:圍繞技術、應用、生態(tài),“星火”再升級
點點“星火”,已成燎原之勢。訊飛星火大模型與行業(yè)應用的結合愈加緊密,其能力展現(xiàn)的也更加充分,不僅包括用戶感知度更高的教育、辦公等場景的設備,還有工業(yè)、醫(yī)療行業(yè)的應用升級。
有AI國家隊之稱的科大訊飛,憑借其技術積累為大模型研發(fā)劃定了時間表,其以大模型為核心的技術研發(fā)、應用落地、生態(tài)建設藍圖正徐徐展開。技術的發(fā)展并不難一蹴而就,需要綜合考慮多方因素,包括技術研發(fā)進展、應用落地情況等,但科大訊飛基于其自主研發(fā)的大模型底座,以及在數(shù)據(jù)安全、建模、強化學習實現(xiàn)安全可控,都使得其在大模型浪潮中更加從容。
隨著星火大模型的不斷升級,星火大模型正在趕超ChatGPT的道路上勇往直前。