《中國經(jīng)濟(jì)周刊》 記者 孫冰 | 北京報(bào)道
誰是當(dāng)下中國乃至全球的“科技頂流”?AI大模型幾乎毫無爭(zhēng)議。
5月28日,科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國,目前中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。而從大模型區(qū)域分布來看,中國已有14個(gè)地區(qū)在開展大模型研發(fā),其中,北京、廣東、浙江、上海處于第一梯隊(duì),數(shù)量最多的北京有38個(gè)大模型,第二位的廣東有20個(gè)。
在全球大模型競(jìng)賽中,中國科學(xué)院院士、中國計(jì)算機(jī)學(xué)會(huì)開源發(fā)展委員會(huì)主任王懷民表示,過去5年世界上參數(shù)量超過百億的大模型大約有45個(gè),其中有32個(gè)出現(xiàn)在美國,9個(gè)出現(xiàn)在中國,4個(gè)出現(xiàn)在歐洲。
但是,發(fā)展迅猛、一路“狂飆”的中國AI大模型們,仍然需要一些冷靜的思考。
大模型“智能涌現(xiàn)”令人興奮,
AI能力開始不可預(yù)測(cè)
人工智能技術(shù)已經(jīng)發(fā)展了很多年,為什么大模型出現(xiàn)后,學(xué)界、產(chǎn)業(yè)界乃至社會(huì)大眾會(huì)如此興奮甚至害怕呢?北京智源人工智能研究院院長(zhǎng)黃鐵軍教授告訴《中國經(jīng)濟(jì)周刊》記者,AI之前更像是人類的助手,根據(jù)人類的指令做著人類能夠確定結(jié)果的工作,比如你設(shè)計(jì)AI打開電燈,AI就只會(huì)打開電燈。
“但是,大模型之所以現(xiàn)在如此受關(guān)注,是因?yàn)楫?dāng)人工智能的參數(shù)量達(dá)到了百億級(jí)別之后,出現(xiàn)了拐點(diǎn)或者說突變,人工智能的能力開始不可預(yù)測(cè)了,就是所謂的‘智能涌現(xiàn)’現(xiàn)象,人工智能一些沒有被預(yù)期到的能力開始出現(xiàn),這種不可預(yù)知讓大家都很興奮。”黃鐵軍說。
黃鐵軍介紹,這一波人工智能浪潮的核心任務(wù)就是訓(xùn)練模型,所謂模型,在人工智能領(lǐng)域的意思很明確,就是一個(gè)神經(jīng)網(wǎng)絡(luò),而神經(jīng)網(wǎng)絡(luò)并沒有什么特別的地方,我們?nèi)四X就是個(gè)神經(jīng)網(wǎng)絡(luò)。
“但人腦是一個(gè)很龐大的神經(jīng)網(wǎng)絡(luò),大約有800多億個(gè)神經(jīng)元通過100萬億個(gè)神經(jīng)突觸進(jìn)行連接,所以人腦的能力非常強(qiáng)。對(duì)比一下,最接近人類的猩猩,其腦部神經(jīng)元的數(shù)量和連接的數(shù)量差不多是人腦的1/3,猴子是人類的1/10,而一條蟲子大概有300多個(gè)神經(jīng)元,但其實(shí)也可以有很多生命活動(dòng)了。”黃鐵軍解釋說。
當(dāng)然,目前人工智能模型的神經(jīng)網(wǎng)絡(luò)比人腦要簡(jiǎn)單很多。但是,隨著數(shù)據(jù)規(guī)模的增長(zhǎng)和算力的增加,模型的參數(shù)量也在不斷增加,能力也就不斷隨之提高,于是就有了“大模型”,即參數(shù)量巨大的神經(jīng)網(wǎng)絡(luò),當(dāng)然其智能程度就更高。
大模型是有史以來最大平臺(tái)革命,將10倍于移動(dòng)互聯(lián)網(wǎng)
“AI大模型是絕對(duì)不能錯(cuò)過的歷史機(jī)遇。因?yàn)檫@將是有史以來最大的平臺(tái)革命,它將比Windows、安卓要大10倍甚至更多,它會(huì)讓每個(gè)應(yīng)用改寫,會(huì)重構(gòu)人類的工作,會(huì)讓有創(chuàng)意的那些人的聰明才智被放大10倍或者更多。”創(chuàng)新工場(chǎng)董事長(zhǎng)兼CEO李開復(fù)說。
李開復(fù)還表示,他非常認(rèn)同美國著名VC機(jī)構(gòu)投資人安德里森·霍羅維茲(Andreessen Horowitz)的觀點(diǎn):大模型的市場(chǎng)未來到底多大很難把握,它最小將是所有軟件,最大可能將代表著人類所有的努力。
“人類歷史上可能也就只有三四次這樣的機(jī)會(huì)。大模型賽道是未來的兵家必爭(zhēng)之地,因此,自主創(chuàng)新將是中國企業(yè)的必經(jīng)之路和重大責(zé)任。”李開復(fù)告訴《中國經(jīng)濟(jì)周刊》記者。
李開復(fù)已經(jīng)投身人工智能超過40年,他戲稱自己是“投資人中最懂AI的,AI科學(xué)家中最懂投資的”。他從投資和產(chǎn)業(yè)發(fā)展的角度認(rèn)為,隨著大模型的崛起,人工智能的發(fā)展已經(jīng)從AI 1.0時(shí)代進(jìn)入AI 2.0時(shí)代。
李開復(fù)認(rèn)為,在AI 1.0時(shí)代,單領(lǐng)域的數(shù)據(jù)集、數(shù)據(jù)集和模型各成孤島,且數(shù)據(jù)標(biāo)記工作量和成本非常可觀;但AI 2.0時(shí)代大模型的出現(xiàn)可以解決這些瓶頸障礙,人們用超級(jí)巨量數(shù)據(jù)訓(xùn)練具有跨領(lǐng)域知識(shí)的單一大模型,微調(diào)后就可以執(zhí)行五花八門的任務(wù)。這是一個(gè)全新且巨大的平臺(tái)機(jī)會(huì),所有的應(yīng)用和界面都要重寫,AI 2.0應(yīng)用會(huì)進(jìn)入爆發(fā)期。
“雖然目前大模型還是非完美的,但它已經(jīng)擁有相當(dāng)大的商業(yè)價(jià)值,甚至幾十萬億規(guī)模的商業(yè)價(jià)值。”李開復(fù)預(yù)測(cè)。他表示,大模型目前還有“一本正經(jīng)地胡說八道”的問題,因?yàn)锳I的推理能力也來自同一個(gè)技術(shù)引擎,如果你把它的胡說八道降到接近零,它的推理能力也幾乎沒有了。也就是說,那些讓它聰明的理由,也是讓它胡說八道的理由。
“我們相信未來這是可以解決的問題。比如可以讓AI與人類協(xié)作,我們不是把AI拿來作為一個(gè)終極的應(yīng)用,而是把它當(dāng)作一個(gè)人類‘助理’。比如可以先讓AI起草法律文件或者新聞稿件的初稿,最后由人類的律師和記者進(jìn)行把關(guān)和調(diào)整,這樣就能夠在享受AI強(qiáng)大能力的同時(shí),又避免了AI會(huì)犯的錯(cuò)誤。”李開復(fù)表示。
《中國經(jīng)濟(jì)周刊》記者 馬銘悅I攝
大模型競(jìng)爭(zhēng)沒有絕對(duì)壁壘,但平臺(tái)席位不會(huì)太多,成敗關(guān)鍵在生態(tài)
黃鐵軍表示,大模型最終會(huì)成為未來社會(huì)的一種新型基礎(chǔ)設(shè)施,其提供“智力”能力,輸送給千行百業(yè)和千家萬戶。因此,人工智能進(jìn)入大模型時(shí)代之后,會(huì)形成一個(gè)體系化的產(chǎn)業(yè)生態(tài)。
簡(jiǎn)單來說,就像電力時(shí)代的電網(wǎng)一樣,千行百業(yè)、千家萬戶都在用電,但并不是自己發(fā)電,而是有專門的發(fā)電廠,發(fā)電方式也是多種多樣,如煤電、火電、風(fēng)電、核電……也有企業(yè)去生產(chǎn)各種各樣的電器。
“有了大模型就像人類學(xué)會(huì)發(fā)電了,目前可能是一種技術(shù)路徑走通了,但后續(xù)一定還會(huì)有各種各樣‘發(fā)電手段’不斷演進(jìn)迭代、降本增效。這意味著,就像不會(huì)有國家或企業(yè)壟斷發(fā)電一樣,大模型也沒有絕對(duì)壁壘和門檻,大家比拼的是成本和效率,競(jìng)爭(zhēng)的是應(yīng)用和生態(tài)。”黃鐵軍說。
李開復(fù)也表示,未來的AI 2.0時(shí)代會(huì)有三大生態(tài)層:基礎(chǔ)模型層、中間層和應(yīng)用層。“以大模型為代表的AI 2.0市場(chǎng)規(guī)模巨大,足以容納巨頭、中小企業(yè)和初創(chuàng)公司在里面‘賽馬’。”他說。
至于創(chuàng)業(yè)者和投資人如何選擇自己在這個(gè)龐大生態(tài)中的地位和角色,李開復(fù)認(rèn)為,需要基于不同的判斷。
比如,基礎(chǔ)模型層的大模型平臺(tái)公司當(dāng)然機(jī)會(huì)巨大,天花板會(huì)非常高,就像PC互聯(lián)網(wǎng)時(shí)代的微軟和移動(dòng)互聯(lián)網(wǎng)時(shí)代的谷歌,但風(fēng)險(xiǎn)也是最大的,因?yàn)槠脚_(tái)公司一定是少數(shù);如果是做應(yīng)用層,風(fēng)險(xiǎn)就沒有那么大,而且每一個(gè)生產(chǎn)力領(lǐng)域都可能成長(zhǎng)出垂直領(lǐng)域的領(lǐng)先公司,但規(guī)??赡軣o法與平臺(tái)公司相比。對(duì)于投資人來說,則永遠(yuǎn)是在風(fēng)險(xiǎn)和回報(bào)之間尋求平衡。
人工智能、智能制造業(yè)崗位頗受歡迎
中國大模型在“狂飆”,但“平臺(tái)席位”不會(huì)太多,安全威脅也要警惕
聚焦到中國,李開復(fù)認(rèn)為,大模型和AI 2.0也是中國不容錯(cuò)過的歷史機(jī)遇,而且中國也有自身的優(yōu)勢(shì)。
“中國擁有豐富的中文語料和龐大的市場(chǎng),通過發(fā)展AI大模型,中國可以推動(dòng)創(chuàng)新產(chǎn)業(yè)的發(fā)展,實(shí)現(xiàn)科技與經(jīng)濟(jì)的雙重紅利。而且中國擁有龐大基數(shù)的年輕工程師和最堅(jiān)韌的企業(yè)家,為發(fā)展AI大模型提供了強(qiáng)大的人才支持,技術(shù)領(lǐng)先、策略靈活、市場(chǎng)反應(yīng)快、能打硬仗、落地執(zhí)行力強(qiáng),將是中國大模型公司的成功關(guān)鍵。”李開復(fù)表示。
黃鐵軍也對(duì)中國在大模型領(lǐng)域的發(fā)展充滿信心。但也有一些現(xiàn)象需要格外關(guān)注。比如,大模型火了之后,還是出現(xiàn)了一哄而上、同質(zhì)化競(jìng)爭(zhēng)加劇的現(xiàn)象。
“數(shù)據(jù)就是這些數(shù)據(jù),算力也就這么多,如果大家都去訓(xùn)練模型,一定很多工作是重復(fù)的,這其實(shí)也消耗了大量社會(huì)資源,不利于大模型生態(tài)的發(fā)展。”黃鐵軍說。
“如果類比PC互聯(lián)網(wǎng)時(shí)代和移動(dòng)互聯(lián)網(wǎng)時(shí)代,全球范圍內(nèi)的大模型底層平臺(tái)很有可能不會(huì)超過三個(gè)。就像移動(dòng)互聯(lián)網(wǎng)初期也曾有很多操作系統(tǒng),但最后只剩下iOS和安卓。很多企業(yè)想要成為第三個(gè),投入巨大但最終都鎩羽而歸。”黃鐵軍說。
黃鐵軍認(rèn)為,中國甚至全世界大模型的運(yùn)營體系都會(huì)是屈指可數(shù)的,雖然還不能預(yù)判是幾個(gè),但肯定不可能是十幾個(gè)或幾十個(gè),根本沒有市場(chǎng)可能性。“更多企業(yè)參與進(jìn)來,不是運(yùn)營平臺(tái),而是做應(yīng)用。類似于蘋果生態(tài)和安卓生態(tài),會(huì)生發(fā)出很多應(yīng)用。”他說。
因此,黃鐵軍建議,一方面要依靠“市場(chǎng)的手”,讓市場(chǎng)的“大浪淘沙”發(fā)揮主要作用;但同時(shí)也需要“政策的手”予以引導(dǎo)和調(diào)節(jié),推動(dòng)、鼓勵(lì)和統(tǒng)籌產(chǎn)學(xué)研進(jìn)行合作,共建大模型的產(chǎn)業(yè)生態(tài)。
縱觀全球,打造人工智能生態(tài),有開源和閉源兩種路線。王懷民表示,大模型因其不確定性形成開源模式和預(yù)研模式同時(shí)推進(jìn)的基本格局。在美國32個(gè)大模型中,有15個(gè)開源。中國的9個(gè)大模型中,有5個(gè)開源。
但一位人工智能領(lǐng)域的資深投資人告訴《中國經(jīng)濟(jì)周刊》,現(xiàn)在國內(nèi)確實(shí)有一些大模型就是把國外的開源代碼進(jìn)行“套殼”和微調(diào),“GPT3.5人家可能還會(huì)開源給你,但GPT4.0短期內(nèi)人家是不可能會(huì)給你用的”。所以,中國要發(fā)展大模型,還是要自主創(chuàng)新。而且因?yàn)榇竽P偷陌l(fā)展涉及數(shù)據(jù)問題,從監(jiān)管的角度,這幾乎意味著中美一定是“平行宇宙”。
大模型越來越強(qiáng)大,擔(dān)心安全風(fēng)險(xiǎn)和被AI替代不如學(xué)習(xí)與AI合作
隨著人工智能技術(shù),尤其是大模型的快速發(fā)展,安全問題也被提高到新的維度。“AI一定會(huì)給數(shù)字世界帶來新的安全威脅。”奇安信集團(tuán)董事長(zhǎng)齊向東告訴《中國經(jīng)濟(jì)周刊》記者。
“這個(gè)安全威脅主要來自兩個(gè)方面:一是AI可以模仿,甚至以假亂真地實(shí)施詐騙;二是AI能夠幫助黑客提高攻擊水平,幫助一些黑客寫程序、寫代碼、制定攻擊方案和提供攻擊策略。這些都給數(shù)字世界帶來新的威脅。”齊向東說。
齊向東表示,網(wǎng)絡(luò)安全技術(shù)是一個(gè)伴生型技術(shù),一定是先有數(shù)字化技術(shù)的創(chuàng)新,再有安全技術(shù)的創(chuàng)新,這是矛和盾的關(guān)系,就像沒有一種特殊材料的矛出現(xiàn),就不會(huì)出現(xiàn)特殊材料的盾?,F(xiàn)在大模型等AI新技術(shù)還處在萌芽狀態(tài),應(yīng)用還只是試探性的,發(fā)展還是第一要?jiǎng)?wù)。
但齊向東表示,他相信網(wǎng)絡(luò)安全的技術(shù)和產(chǎn)品的創(chuàng)新,一定能夠解決新時(shí)代AI帶來的這些網(wǎng)絡(luò)安全問題和風(fēng)險(xiǎn)。“奇安信正在抓緊跟進(jìn)AI的各種場(chǎng)景,探索解決AI給我們帶來的新的網(wǎng)絡(luò)風(fēng)險(xiǎn)所需要的新技術(shù)和新的安全解決方案,我相信,未來安全不會(huì)拖AI發(fā)展的后腿。”他說。
至于大模型何時(shí)會(huì)影響到普通人的生活,黃鐵軍表示,其實(shí)已經(jīng)在發(fā)生了。比如現(xiàn)在人工智能已經(jīng)在替代人類的某些工作,尤其是不具備原創(chuàng)性的部分。
以繪畫為例,黃鐵軍認(rèn)為,像畢加索、齊白石這種開創(chuàng)性的創(chuàng)作,人工智能還無法替代,但如果只是模仿和組合之前的創(chuàng)作,那人工智能肯定是效率更高的。再比如像愛因斯坦、牛頓這種原創(chuàng)性的理論創(chuàng)新,人工智能也無法做到,但如果是常規(guī)編程和做數(shù)學(xué)題,那人工智能確實(shí)可以做得更好。
但黃鐵軍強(qiáng)調(diào),AI和人類之間并不是簡(jiǎn)單替代,而是需要合作。“比如,一個(gè)企業(yè)原來需要1000名程序員,但接入了AI大模型能力之后,可能只需要幾十個(gè)就夠了,通過人和AI的合作來獲得更高的效率和產(chǎn)生更好的效果。”
而且黃鐵軍認(rèn)為,這種影響力會(huì)很快傳遞到教育領(lǐng)域。
“現(xiàn)在很多學(xué)生有疑問,不是先問老師,而是先問AI,因?yàn)锳I掌握的知識(shí)和信息可能更全面、更豐富,然后自己根據(jù)AI給出的資料就可以學(xué)習(xí)了。這個(gè)會(huì)是非常大的沖擊,未來教師在學(xué)生的成長(zhǎng)過程中到底發(fā)揮什么作用?扮演什么角色?AI在不停學(xué)習(xí),人自然也是要不停學(xué)習(xí),教育肯定是會(huì)長(zhǎng)期存在下去的,只不過我們教育的目的是什么?教育的方式是什么?都需要重新思考。”黃鐵軍說。
更為“可怕”的是,我們常說:讀書破萬卷,下筆如有神。“一個(gè)人一生能讀完一萬本書已經(jīng)非常厲害了,但AI一天就能讀100萬本書,而全人類共有書籍約1億部,AI再讀3年左右就全讀完了,那AI的能力提升速度可想而知,和人類完全不在一個(gè)尺度上。”黃鐵軍說。
科大訊飛副總裁章繼東告訴《中國經(jīng)濟(jì)周刊》記者,AI技術(shù)尤其是大模型的發(fā)展,會(huì)對(duì)中國的教育帶來巨大挑戰(zhàn)。
“中國教育的核心在于知識(shí)的傳遞和知識(shí)的獲取,尤其是考試的考核目標(biāo)主要是以知識(shí)為主,那些記憶好、訓(xùn)練多的孩子就能得高分,而這些是最容易被AI替代的能力。未來,我們將更需要具有創(chuàng)造力、有批判思維和創(chuàng)新思維的人才。但我相信,隨著大模型成為各行各業(yè)的好助手,其也會(huì)成為教育的好助手。”章繼東說。
(本文刊發(fā)于《中國經(jīng)濟(jì)周刊》2023年第11期)
2023年第11期《中國經(jīng)濟(jì)周刊》封面