近日,廣東省電子信息行業(yè)協(xié)會(huì)于2024年8月29日發(fā)布國內(nèi)首個(gè)AI大模型中間件團(tuán)體標(biāo)準(zhǔn) ——《大模型應(yīng)用中間件通用技術(shù)要求》(以下簡(jiǎn)稱“團(tuán)體標(biāo)準(zhǔn)”)。該團(tuán)體標(biāo)準(zhǔn)由南方電網(wǎng)電力科技股份有限公司和廣州運(yùn)通鏈達(dá)金服科技有限公司聯(lián)合發(fā)起,具體執(zhí)筆編寫者有鄒均、張曉曄、陳皓、羅鉅文、牟松、梁添才、楊峰、相里朋等人。
當(dāng)前,基于大模型的生成式人工智能技術(shù)發(fā)展迅猛。中國信息通信研究院于2024年7月發(fā)布了《全球數(shù)字經(jīng)濟(jì)白皮書》(以下簡(jiǎn)稱“白皮書”)。根據(jù)該白皮書,截至目前,全球人工智能大模型有1328個(gè)。其中美國占比44%,中國占比36%。根據(jù)各地網(wǎng)信辦發(fā)布的公告,截至2024年7月30日,全國范圍內(nèi)已有197個(gè)生成式人工智能服務(wù)通過網(wǎng)信辦備案。
但目前業(yè)界上與大模型相關(guān)標(biāo)準(zhǔn)還非常鮮見。據(jù)了解,目前全國團(tuán)體標(biāo)準(zhǔn)信息平臺(tái)上,已經(jīng)發(fā)布的與大模型相關(guān)的團(tuán)體標(biāo)準(zhǔn)只有六個(gè),這個(gè)與大模型數(shù)量相比不成比例。標(biāo)準(zhǔn)的缺失對(duì)大模型技術(shù)應(yīng)用落地和行業(yè)發(fā)展帶來很大的挑戰(zhàn)。
2024年6月,國家工業(yè)和信息化部、中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、國家發(fā)展和改革委員會(huì)、國家標(biāo)準(zhǔn)化管理委員會(huì)公布關(guān)于印發(fā)《國家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》(以下簡(jiǎn)稱“指南”)的通知。該通知要求各地工業(yè)和信息化主管部門、網(wǎng)信辦、發(fā)展改革委、市場(chǎng)監(jiān)管局(廳、委),有關(guān)行業(yè)協(xié)會(huì)、標(biāo)準(zhǔn)化技術(shù)組織、標(biāo)準(zhǔn)化專業(yè)機(jī)構(gòu)加強(qiáng)人工智能標(biāo)準(zhǔn)化工作系統(tǒng)謀劃,加快構(gòu)建滿足人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展和“人工智能+”高水平賦能需求的標(biāo)準(zhǔn)體系,夯實(shí)標(biāo)準(zhǔn)對(duì)推動(dòng)技術(shù)進(jìn)步、促進(jìn)企業(yè)發(fā)展、引領(lǐng)產(chǎn)業(yè)升級(jí)、保障產(chǎn)業(yè)安全的支撐作用,更好推進(jìn)人工智能賦能新型工業(yè)化。
鄒博士指出:“《大模型應(yīng)用中間件通用技術(shù)要求》規(guī)定了大模型應(yīng)用中間件產(chǎn)品的通用技術(shù)要求,包括以下幾個(gè)方面內(nèi)容:功能要求、架構(gòu)設(shè)計(jì)、接口標(biāo)準(zhǔn)、性能要求和安全性要求。本標(biāo)準(zhǔn)適用于企業(yè)構(gòu)建垂類大模型應(yīng)用,包括微調(diào)訓(xùn)練垂類模型,開發(fā)大模型驅(qū)動(dòng)的AI應(yīng)用,集成大模型與企業(yè)內(nèi)、外部信息系統(tǒng),賦能企業(yè)數(shù)字化轉(zhuǎn)型。”
鄒博士說:“自2017年以來,基于Transformer架構(gòu)的預(yù)訓(xùn)練大模型在自然語言處理、圖像、視覺等多個(gè)AI領(lǐng)域取得了比傳統(tǒng)AI技術(shù)更先進(jìn)的水平。特別是在一些下游任務(wù)中大模型展現(xiàn)出強(qiáng)大的泛化能力,尤其是在一些大型參數(shù)模型中甚至涌現(xiàn)出強(qiáng)大的學(xué)習(xí)能力、理解能力和推理能力。在這個(gè)背景下,主流人工智能技術(shù)也從傳統(tǒng)的判別式AI向生成式AI技術(shù)轉(zhuǎn)變,并朝著通用人工智能方向發(fā)展。當(dāng)前,市場(chǎng)上已經(jīng)出現(xiàn)幾百家通用大模型。這些大模型功能和性能各異,有些是廠商開發(fā)商用大模型,有些是開源社區(qū)開發(fā)的大模型。另一方面,企業(yè)也開始探索在預(yù)訓(xùn)練通用大模型基礎(chǔ)上建立和業(yè)務(wù)相關(guān)的垂類大模型,落地行業(yè)大模型應(yīng)用。但企業(yè)在落地大模型應(yīng)用的過程中,面臨高昂的技術(shù)門檻和成本門檻、缺少技術(shù)標(biāo)準(zhǔn)可供參考的挑戰(zhàn)。“
鄒博士接著解釋: ”大模型應(yīng)用中間件是介于通用大模型和大模型應(yīng)用之間的軟件系統(tǒng)。它的作用是隔離底層通用多模態(tài)大模型的技術(shù)復(fù)雜性,面向應(yīng)用層提供包括集成整合開源或商用多模態(tài)大模型、基于大模型的智能體規(guī)劃、工作流引擎、提示工程、反思評(píng)估、數(shù)據(jù)處理、垂類模型訓(xùn)練及微調(diào)、安全審計(jì)、大模型運(yùn)維監(jiān)控、性能評(píng)測(cè)等功能服務(wù)。大模型應(yīng)用中間件可以有效降低企業(yè)應(yīng)用大模型的技術(shù)和成本門檻,提升垂類大模型開發(fā)效率,支持大模型的私有化部署,保護(hù)企業(yè)數(shù)據(jù)安全和數(shù)據(jù)資產(chǎn)?!?/p>
在談到該團(tuán)體標(biāo)準(zhǔn)與四部委發(fā)布的指南關(guān)系時(shí),鄒均強(qiáng)調(diào)該團(tuán)體標(biāo)準(zhǔn)是響應(yīng)四部委號(hào)召,從團(tuán)體標(biāo)準(zhǔn)建設(shè)開始,逐步完善大模型中間件的標(biāo)準(zhǔn)體系建設(shè)。團(tuán)體標(biāo)準(zhǔn)的內(nèi)容部分涵蓋了指南里人工智能標(biāo)準(zhǔn)體系框架中關(guān)于“參考架構(gòu)“、“系統(tǒng)軟件”、“大模型”和“智能體”等重點(diǎn)方向的內(nèi)容。
最后,鄒博士也談到編制該團(tuán)體標(biāo)準(zhǔn)的目的,是“旨在制定大模型應(yīng)用中間件標(biāo)準(zhǔn),促進(jìn)各類開源和商業(yè)的多模態(tài)大模型的開放和互聯(lián),為企業(yè)集成大模型與企業(yè)內(nèi)外的信息系統(tǒng)、更好的將大模型的能力與企業(yè)業(yè)務(wù)結(jié)合提供便利?!?/p>
據(jù)了解,鄒均博士曾經(jīng)擔(dān)任IBM大中華全球咨詢服務(wù)的首席架構(gòu)師,對(duì)中間件幫助企業(yè)落地應(yīng)用有深刻的理解和豐富的經(jīng)驗(yàn)。鄒博士于2018年和國企上市公司廣電運(yùn)通集團(tuán)共同創(chuàng)立廣州運(yùn)通鏈達(dá)金服科技有限公司,賦能企業(yè)數(shù)字化轉(zhuǎn)型。 針對(duì)企業(yè)普遍面臨的大模型應(yīng)用落地技術(shù)門檻高、成本門檻高的問題,運(yùn)通鏈達(dá)于2023年8月發(fā)布了業(yè)內(nèi)第一個(gè)大模型中間件InterGPT。 InterGPT旨在幫助企業(yè)訓(xùn)練垂類模型,降低企業(yè)大模型應(yīng)用開發(fā)成本,提升效率,同時(shí)促進(jìn)大模型的互聯(lián)互通。2024年初,運(yùn)通鏈達(dá)攜手南網(wǎng)科技積極推動(dòng)此次標(biāo)準(zhǔn)的起草工作。憑借著豐富的經(jīng)驗(yàn)和深入的技術(shù)理解,運(yùn)通鏈達(dá)和南網(wǎng)科技等機(jī)構(gòu)和企業(yè)為標(biāo)準(zhǔn)的制定貢獻(xiàn)了寶貴的智慧和力量。
這一團(tuán)體標(biāo)準(zhǔn)的發(fā)布,將為大模型的應(yīng)用提供更加規(guī)范、高效的技術(shù)指導(dǎo)。它也是大模型標(biāo)準(zhǔn)領(lǐng)域的重大突破。大模型應(yīng)用中間件作為連接大模型與實(shí)際應(yīng)用的關(guān)鍵環(huán)節(jié),其通用技術(shù)要求的明確對(duì)于推動(dòng)整個(gè)行業(yè)的發(fā)展具有至關(guān)重要的意義。將有助于提高大模型應(yīng)用的質(zhì)量和穩(wěn)定性,促進(jìn)大模型技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用。