AI技術領先 率先應用落地 訊飛星火認知大模型何以“燎原”?
2023-05-11 10:32:07 來源: 貝殼財經(jīng)

5月6日,科大訊飛“星火”認知大模型“千呼萬喚始出來”,董事長劉慶峰現(xiàn)場演示了“星火”大模型包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)能力在內(nèi)的七個維度的能力,充分展示了科大訊飛在大模型研發(fā)領域中的“硬實力”。

此外,劉慶峰向在場觀眾開放了星火大模型的體驗測試鏈接,并演示了“星火”接入科大訊飛旗下學習機、智能辦公本、錄音筆等產(chǎn)品后展現(xiàn)的智能功能,這意味著“星火”不僅率先面向公眾大規(guī)模開放,還是率先應用落地的AI大模型。

“如果說大模型的滿分是5分,ChatGPT在4.48分,而目前‘星火’在英文領域已經(jīng)達到4.29分,領先于國內(nèi)同行。”劉慶峰說。他還當場給出了“星火”大模型年內(nèi)的發(fā)展給出了確切的時間表:“星火”將在6月9日、8月15日再度“能力升級”,并在10月24日對標ChatGPT。


(資料圖片僅供參考)

科大訊飛現(xiàn)場實測“星火”認知大模型 理解能力出色,可用性較高

此次發(fā)布會上,測試者和現(xiàn)場觀眾對“星火”在七個維度上的能力進行了全面考核。

如在語言理解、邏輯推理等諸多考驗大模型“智商”和“情商”的測試中,“星火”表現(xiàn)亮眼,科大訊飛研究院院長劉聰現(xiàn)場問道:“俗話說男子漢大丈夫寧死不屈,但是俗話又說男子漢大丈夫要能屈能伸,請問這兩句話怎么理解?”以及“如果一個小伙子跟女朋友吵架了,他應該寧死不屈還是能屈能伸呢?”對此,“星火”表示前一個問題需要根據(jù)特定場景選擇,而對后一個涉及女朋友的問題,“星火”的回答則是“這種情況下,這個小伙子應該能屈能伸。一味堅持原則可能會加劇矛盾,冷靜下來才能尋找解決方案……”這一“高情商”答案讓現(xiàn)場觀眾報以喝彩和熱烈掌聲。

而在數(shù)學能力中,訊飛星火大模型展現(xiàn)出“學霸”氣質。除了常規(guī)計算、幾何、情景應用等,如對于復雜的計算題:“花壇里有三種花,一共88朵,其中月季花的數(shù)量是菊花的4倍,牡丹花的數(shù)量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”星火大模型很快準確給出了答案,并給出了解題步驟。

值得注意的是,多年以來,科大訊飛在教育及醫(yī)療方面擁有深厚的知識積累,而此次“星火”大模型也展示了豐富的通識知識,能夠對生活常識、科學知識、工作技巧、醫(yī)學知識等應對自如。

“目前,我們并未發(fā)布專用的醫(yī)療大模型,不過我們的智醫(yī)助理比ChatGPT強,以后這些能力會慢慢進入星火大模型,而醫(yī)療專用模型會在今年的1024會議上發(fā)布?!眲c峰表示。

作為人工智能“國家隊”之一,劉慶峰說:“我們要向OpenAI致敬和學習,同時也要快速追趕并努力超越,而這需要一套科學系統(tǒng)的評測體系?!翱拼笥嶏w通過認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系,并與中科院人工智能產(chǎn)學研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個細分任務類型。在科學的評測體系中,推動大模型的發(fā)展。

劉慶峰強調,“今天要看一個大模型系統(tǒng)到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試。”

率先應用落地 “1+N”深度賦能教育、辦公、汽車、數(shù)字員工領域

科大訊飛的“星火”還是國內(nèi)率先實現(xiàn)應用落地的AI大模型。圍繞“星火”認知大模型“1+N”架構中“N”個領域的內(nèi)容,科大訊飛發(fā)布了大模型在教育、辦公、汽車、數(shù)字員工等多個方向的行業(yè)應用成果,值得注意的是,這些成果均為“即時上線”,擁有科大訊飛學習機、智能辦公本等相關產(chǎn)品的用戶升級后即可立即體驗“星火”的魅力。

如在英語學習和作文批改上,搭載了“星火”的科大訊飛AI學習機T20系列精通中英雙語,可以實現(xiàn)和學習者的一對一英英自由對話,對用戶發(fā)音進行評分,還可對中英文作文像老師一樣層層批改點評

而在辦公場景,搭載了“星火”的訊飛智能辦公本升級了會議紀要、語篇規(guī)整兩大功能。在會議紀要方面,將語音實時轉寫與墨水屏紙感書寫相結合,并且可以對會議記錄內(nèi)容形成一份精簡的會議紀要,有助于快速回溯會議內(nèi)容。在語篇規(guī)整方面,可以去除語音轉寫文稿中的口語化詞匯、過濾冗余詞匯,對文本進行潤色等,輕松將錄音中發(fā)音者的口頭表述轉換為規(guī)整的文案。

而在科大訊飛領跑市場的語音轉寫場景,訊飛錄音筆以及訊飛聽見通過AI分析文字內(nèi)容,可以一鍵生成包括全文摘要、工作待辦、工作計劃、新聞稿件、宣傳文案、多語種翻譯等多種文本,還可以根據(jù)原文件內(nèi)容,進行AI對話并對原文內(nèi)容進行提問追溯。在實機演示中,“一建成稿”功能令人驚艷,用戶可以直接將錄音筆中的錄音轉換為一篇新聞稿,并可以自行標注稿件重點進行重復生成。

在“星火”的能力下,汽車語音市場占有率第一的科大訊飛還有望推出搭載大模型的智能座艙,實現(xiàn)車內(nèi)跨業(yè)務、跨場景人車自由交流。據(jù)了解,科大訊飛已為數(shù)千個車型提供業(yè)界領先的智能語音交互服務,提供多輪、多人、多區(qū)域、多模態(tài)的語音交互,累計服務用戶已經(jīng)超過4610萬,在國內(nèi)汽車智能語音應用市場保持占有率第一。這一次認知大模型技術會讓車載人機交互再上一個新的臺階。

此外,“星火”大模型還能直接賦能數(shù)字員工領域,科大訊飛基于自然語言生成業(yè)務流程和 RPA,可幫助企業(yè)員工完成大量重復性工作。在現(xiàn)場演示的公司招聘事項為例,輸入指令后,系統(tǒng)即可自動按照事先設計的RPA腳本,操作計算機中的相應軟件,實現(xiàn)業(yè)務流程的自動化操作并輸出結果,還能進行數(shù)據(jù)分析,大幅減輕一線工作人員的壓力。

除了上述領域外,訊飛星火認知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),滿足更多專業(yè)領域的需求,向更廣闊的產(chǎn)業(yè)領域延伸。

與其他國內(nèi)大模型、ChatGPT相比有何差異?星星之火可以燎原

在各類國內(nèi)版“GPT”上線之際,科大訊飛此次官宣發(fā)布的大模型“星火”有何不同之處?

首先,此次發(fā)布會對“星火”的所有測試均為現(xiàn)場實機演示,而非發(fā)布Demo,“星火”經(jīng)受住了測試人員和現(xiàn)場觀眾的問題考驗。其次,本次現(xiàn)場演示除了向“星火”提問外,還展示了商用場景。最后,科大訊飛提出了“星火”升級的確切時間表。

事實上,作為國內(nèi)AI行業(yè)的領軍企業(yè)之一,科大訊飛在啟動“星火”認知大模型之初,就和中國科技大學共同承建的認知智能全國重點實驗室牽頭,與中國科學院人工智能產(chǎn)學研產(chǎn)業(yè)聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟的眾多的專家、合作伙伴進行共同探討,達成廣泛共識,設計形成了覆蓋7大類、481個細分任務類型的通用認知大模型評測體系。

“當我們向Open AI致敬和學習、同時要快速追趕并努力超越時,我認為我們首先需要一套科學、系統(tǒng)的評測體系。”劉慶峰說,“在我們剛剛給出來的7個維度的481項測評體系中,科大訊飛的星火大模型針對文本生成一共有181個細分任務測試。在這里我非常自豪地跟大家分享,星火在國內(nèi)目前已經(jīng)推出來、能夠測試到的認知大模型中,是明顯領先的?!?/p>

劉慶峰表示,文本生成和數(shù)理能力一定程度代表了一個大模型的聰明程度,“星火”大模型不僅在國內(nèi)系統(tǒng)中顯著領先,相比ChatGPT也具有一定優(yōu)勢;而在語言理解和知識問答方面也達到接近ChatGPT水平,處于國內(nèi)領先水平;邏輯推理和代碼能力已經(jīng)是國內(nèi)領先。

事實上,“星火”大模型的優(yōu)良表現(xiàn),一定程度上繼承了科大訊飛面對困境時“奮力一搏”的精神。正如1999年科大訊飛剛剛創(chuàng)業(yè)之時,國內(nèi)語音市場全部被國際巨頭控制,但這個由6位中國科技大學在校大學生創(chuàng)辦“草臺班子”在融到第一筆資金之后,全力以赴地投入到了研發(fā)之中,最終現(xiàn)在占領了中文語音主流市場的70%。

“最初我們是‘壓強式地投入’,整合了國內(nèi)可以整合的源頭技術資源,但連年虧損。那個時候我們在巢湖的半湯會議上特別提出來一句話,叫“燃燒最亮的火把,要么率先燎原,要么最先熄滅”,既表達了我們的緊迫感,也表達了我們會率先燎原的信心和勇氣。訊飛星火大模型起名之前,我們是經(jīng)過了千千萬萬的比較,最終一致認為我們喜歡“星火”這個名字。”劉慶峰說,“星星之火,可以燎原?!?/p>

文/羅亦丹

編輯/岳彩周

校對/柳寶慶

關鍵詞:
責任編輯:zN_1154