中信所報告:國內(nèi)大模型數(shù)量已達79個 超半數(shù)已開源
2023-05-29 17:31:01 來源: 貝殼財經(jīng)

中國科學(xué)技術(shù)信息研究所所長,科技部新一代人工智能發(fā)展研究中心主任趙志耕圖/主辦方供圖


(資料圖)

5月28日,中國科學(xué)技術(shù)信息研究所所長,科技部新一代人工智能發(fā)展研究中心主任趙志耕在中關(guān)村論壇平行論壇“人工智能大模型發(fā)展論壇”上發(fā)布了《中國人工智能大模型地圖研究報告》。據(jù)她披露,據(jù)不完全統(tǒng)計目前國內(nèi)已經(jīng)發(fā)布了79個大模型,從地區(qū)來看北京和廣東最多,自然語言處理是大模型研發(fā)最活躍的領(lǐng)域。

全球已發(fā)布認知大模型 中美共占80% 國內(nèi)已有79個大模型

趙志耕介紹,在全球大模型發(fā)展趨勢上,美國的谷歌和open AI等機構(gòu)是領(lǐng)先的技術(shù)方向。歐洲、俄羅斯、以色列等國家和地區(qū)都有多個團隊和技術(shù)人員致力于大模型的最新開發(fā)方向。從全球已發(fā)布的認知大模型中,美國和中國占據(jù)了大頭,超過了80%,美國模型數(shù)量位居全球之首。自2020年開始,中國大模型進入快速發(fā)展期,整體增長態(tài)勢與美國保持同步,從2017年發(fā)布人工智能發(fā)展規(guī)劃以來,各領(lǐng)域的布局為大模型發(fā)展奠定了非常好的基礎(chǔ)。

政產(chǎn)學(xué)研協(xié)力合作使中國大模型已經(jīng)呈現(xiàn)出良好發(fā)展態(tài)勢,無論是理論方法還是軟硬件技術(shù)的體系化研究能力,都已形成了技術(shù)迭代趨勢。近年來,中國大模型各種技術(shù)路線都在并行突破,特別是自然語言理解、機器視覺和多模態(tài)方面,出現(xiàn)了盤古、悟道、文心一言、通義千問、星火認知等多個在行業(yè)具有影響力的大模型。同時,我們可以看到中國大模型在地域、領(lǐng)域以及研發(fā)主體方面,呈現(xiàn)出明顯的發(fā)展趨勢。

趙志耕表示,據(jù)不完全統(tǒng)計,目前中國已發(fā)布79個大模型,“我們注意到地域分布明顯特點,14個省市地區(qū)都有大模型研究,但北京和廣東非常突出。北京有38個大模型,廣東有20個大模型。在模型領(lǐng)域分布上,自然語言處理仍是目前大模型研發(fā)最活躍的重點領(lǐng)域,其次是多模態(tài)領(lǐng)域。計算機視覺和智能語音等領(lǐng)域仍有待進一步突破,目前模型較少。”

大模型快速發(fā)展但合作開發(fā)力量不足 北上廣AI論文數(shù)量最多

“研發(fā)主體分布上,大學(xué)及研究機構(gòu)和企業(yè)都投入大模型研發(fā),但單獨研究現(xiàn)象較多。產(chǎn)業(yè)界和學(xué)術(shù)界合作開發(fā)的力量不足。今年以來,大模型呈現(xiàn)快速發(fā)展的態(tài)勢,我們觀察到合作收縮趨勢,這是接下來需要注意的。”趙志耕說。

在她看來,算力是重要的要素資源,對人工智能發(fā)展很重要。同時,人工智能大模型與算力之間存在強相關(guān)性和正相關(guān)性,“我們注意到北京、廣東、浙江、上海等地的大型模型數(shù)量眾多,但近3年來,我們發(fā)現(xiàn)同樣的現(xiàn)象,這4個地區(qū)的人工智能服務(wù)器采購數(shù)量非常巨大。因此,各地在加快公共算力部署推動人工智能發(fā)展的同時,也加速了大型模型基礎(chǔ)設(shè)施的建設(shè)。”

趙志耕表示,人才是人工智能的重要支撐。在大型模型發(fā)展上,人才呈正相關(guān)關(guān)系。例如,北京、江蘇、廣東和上海等地的大型模型人才相對集中,同時也是人工智能人才的高地。從區(qū)域影響力來看,北京、廣東、上海三地在論文的發(fā)表量和引用量上居國內(nèi)最高。其中清華大學(xué)和阿里、百度聯(lián)合開發(fā)的CogView模型論文引用數(shù)量最高,華為的FILP、百度的ERNIE 3.0以及阿里的M6-OFA引用數(shù)在國內(nèi)也名列前茅。然而,這些大模型的學(xué)術(shù)影響與國際相比仍有一定差距。

強調(diào)開源開放 國內(nèi)超半數(shù)大模型實現(xiàn)開源

趙志耕表示,在人工智能發(fā)展方面,中國強調(diào)開源開放這一基本原則,大多數(shù)人工智能大模型的發(fā)展也堅持開源創(chuàng)新和生態(tài)引導(dǎo)。目前,超過一半國內(nèi)發(fā)布的大模型已經(jīng)實現(xiàn)了開源,其中開源的主力是高校和科研機構(gòu),如清華大學(xué)的ChatGLM-68、復(fù)旦大學(xué)的MOSS以及百度的文心系列大模型。

“目前,中國大模型的產(chǎn)業(yè)化應(yīng)用沿著兩條技術(shù)路線發(fā)展,第一條路線是通用類大模型,正不斷打造跨行業(yè)的通用化人工智能能力平臺,其行業(yè)應(yīng)用正在從辦公、生活、娛樂等方向向醫(yī)療、工業(yè)、教育等領(lǐng)域加速拓展。另一條路線是針對垂直領(lǐng)域的專業(yè)類大模型,有大批針對生物制藥、遙感、氣象等垂直領(lǐng)域的專業(yè)大模型,正發(fā)揮其在領(lǐng)域內(nèi)的縱深應(yīng)用效果。同時,我們也看到許多企業(yè)提供針對特定業(yè)務(wù)場景的高質(zhì)量專業(yè)化解決方案,不斷擴大大模型產(chǎn)業(yè)化應(yīng)用的市場空間和水平?!壁w志耕說。

趙志耕也對國內(nèi)大模型的發(fā)展提出了建議,她表示,要加強資源和研發(fā)力量的統(tǒng)籌,促進大模型的有序發(fā)展;加快基礎(chǔ)研究和技術(shù)創(chuàng)新,提升學(xué)術(shù)和開源影響力;強化大模型發(fā)展中的場景牽引作用,打造大模型標桿項目;強化國際合作,積極參與全球人工智能治理。

“中國在人工智能健康可持續(xù)發(fā)展方面一直秉承高技術(shù)和向善發(fā)展,以人為本的理念,我們推出了人工智能的自律原則和倫理規(guī)范。我們希望這些治理原則和倫理規(guī)范能夠在大模型的全鏈條中落地生根。在增進共識的基礎(chǔ)上,加強人工治理的全球合作,創(chuàng)造中國的智慧和治理方案?!壁w志耕說。

記者聯(lián)系郵箱:luoyidan@xjbnews.com

編輯 宋鈺婷

校對 王心

關(guān)鍵詞:
責任編輯:zN_2954