半月談?dòng)浾?張漫子
ChatGPT剛誕生的2022年底,就算我們把AI當(dāng)回事,AI卻沒(méi)我們什么事——大廠之間的角力、大國(guó)之間的博弈,離大眾還很遠(yuǎn)。但時(shí)間來(lái)到2024年,日常生活已被AI占據(jù):AI電腦、AI手機(jī)、AI軟件、AI游戲、AI陪伴,我們真真實(shí)實(shí)觸摸到了AI之軀,它的應(yīng)用比它的名字還要普及。
一個(gè)更為強(qiáng)烈的感受是,AI變了。它的“智”和“能”不斷進(jìn)化、迭代,不斷引我們到未曾想象的新世界?;赝斯ぶ悄茱L(fēng)起云涌的一年,“AI革命”的進(jìn)度條,走到哪兒了?
瘦身
大模型,“瘦身”了。今年的大模型“武林”依然精彩,只是簡(jiǎn)單粗暴的追參數(shù)、比大小已成明日黃花?!靶×耍獜?qiáng)”,成為國(guó)產(chǎn)大模型廠商的追求。
有研究者測(cè)算,如果大模型保持現(xiàn)在的發(fā)展勢(shì)頭,到2028年左右,現(xiàn)有的數(shù)據(jù)儲(chǔ)量就將全部用完。還有3年,就要撞上南墻了嗎?大模型向何處去?也許,我們需要新的參照系。
面壁智能首席科學(xué)家、清華大學(xué)副教授劉知遠(yuǎn)拿出一把新標(biāo)尺:能力密度?!按竽P筒⒉皇菂?shù)越大越好。同樣的模型能力可以放入一個(gè)更小的參數(shù)規(guī)模,這表明模型的能力密度不斷增強(qiáng)。達(dá)到同等性能模型所需參數(shù)數(shù)量越小,意味著模型性價(jià)比越高,效率越高,能力越強(qiáng)?!眲⒅h(yuǎn)說(shuō)。
新的認(rèn)知,發(fā)散出新的思路:煉大模型,不如煉優(yōu)模型。不是大模型不給力,而是小模型更具性價(jià)比。這一年,越來(lái)越多的模型廠商將目光聚焦在小模型身上,更注重AI算法的調(diào)優(yōu)。一邊降參數(shù)、一邊提性能,以最小的資源釋放最大的能量,大模型、小模型不再因訓(xùn)練數(shù)據(jù)量的差異而出現(xiàn)性能代差。
AI處理的重心也不再依賴云端智能算力,開(kāi)始向端側(cè)轉(zhuǎn)移。這催生了設(shè)備單元大模型的新需求。借助一系列優(yōu)化措施,單元大模型在特定任務(wù)上的表現(xiàn),甚至優(yōu)于預(yù)訓(xùn)練大模型。它可以廣泛適配不同類型終端,并通過(guò)合理連接,激發(fā)群體智能。
“我們?cè)谑謾C(jī)和PC端體驗(yàn)到的端側(cè)AI,大部分是通過(guò)適配器、分類器挑選的微調(diào)小模型,以及經(jīng)過(guò)自定義開(kāi)發(fā)的智能體,操作中無(wú)需調(diào)用全部模型參數(shù),無(wú)疑更具性價(jià)比、更具效率?!泵姹谥悄苈?lián)合創(chuàng)始人、CEO李大海說(shuō)。
破壁
第二個(gè)強(qiáng)烈感受,大模型變“勤快”了。除了越來(lái)越瘦、越來(lái)越輕盈之外,它越來(lái)越實(shí)干,不再是那個(gè)只說(shuō)不干的“口嗨派”。
2024年11月底,智譜AI開(kāi)放日上最新亮相的AI智能體已經(jīng)化“chat”為“act”,身體力行替人類點(diǎn)外賣。更驚喜的是,這款國(guó)產(chǎn)AI智能體已初步實(shí)現(xiàn)跨App、多步驟解決真實(shí)任務(wù)。
安裝AutoGLM、點(diǎn)擊“綠色手機(jī)”圖標(biāo),對(duì)著智能體說(shuō)出“幫我查詢一頓火鍋需要的食材,然后下單送到家里”的指令,AI就會(huì)自動(dòng)打開(kāi)小紅書App頁(yè)面、搜索火鍋食譜,找到需要的食材,然后關(guān)閉小紅書App,打開(kāi)美團(tuán)App進(jìn)入超市頻道,勾選食材下單——在無(wú)需人工干預(yù)的條件下,一口氣完成54個(gè)步驟。
盡管目前剛剛滿月的它并不比人類的操作要敏捷多少,但這至少意味著AI終于能跳出“對(duì)話框”,幫人類做點(diǎn)什么了?!敖衲辏珹I實(shí)現(xiàn)從技術(shù)驅(qū)動(dòng)到需求驅(qū)動(dòng)的轉(zhuǎn)變。從業(yè)者深入思考如何讓大模型進(jìn)入真實(shí)的物理世界,真正行動(dòng)起來(lái)。”智譜CEO張鵬說(shuō)。
規(guī)模效應(yīng)時(shí)代的AI,值得關(guān)注的就3件事:算力、算法、數(shù)據(jù)。而今,在“致用”大方向上尋找價(jià)值的AI亟須打通3件事:感知、思維、行為。
物理空間與認(rèn)知空間的交互,激發(fā)了人類的想象力與創(chuàng)造力,是抽象思維的起點(diǎn),對(duì)于進(jìn)化中的AI而言,也就分外重要。
當(dāng)然,現(xiàn)在的AI“感知”到的可能僅僅是事物不完整的、甚至碎片化的特征,如何在這樣的基礎(chǔ)上讓AI“靈光乍現(xiàn)”,有所領(lǐng)悟,甚至產(chǎn)生思維的萌芽?正如2024世界人工智能大會(huì)上諸多專家所言,“AI智能體才是未來(lái)的真正挑戰(zhàn)”。由“知”到“行”,跨越非易。
“智能體改變的是人與機(jī)器的互動(dòng)方式,基于理解需求、規(guī)劃與決策、執(zhí)行行動(dòng)和自我反思,它將帶來(lái)符合直覺(jué)的人機(jī)交互——從人適應(yīng)機(jī)器,到讓機(jī)器適應(yīng)人。”張鵬說(shuō)。
生長(zhǎng)
進(jìn)入“青春期”的大模型,還在蓬勃“發(fā)育”之中。它將長(zhǎng)成什么樣子?我們不妨回到人工智能的本質(zhì):模仿人類智能,完成復(fù)雜任務(wù)。這意味著它不僅僅是一名吸收人類已有知識(shí)庫(kù)的學(xué)生、一個(gè)可以與人交談的智能設(shè)備,更不是被動(dòng)回答人類問(wèn)題的反饋機(jī)器。人工智能的未來(lái),應(yīng)該是“有靈且美”的類生命體。AI的感知能力、交互能力,必將不斷豐富和拓展。
拓展,要從哪幾方面展開(kāi)?
一是行動(dòng)。過(guò)去24個(gè)月,大模型主要增強(qiáng)的是人工智能“智”的維度,也就是作為一位參謀,讀懂問(wèn)題、搜索答案、形成回復(fù)。對(duì)于人工智能“能”的維度,也就是在拆解目標(biāo)、做出決策、執(zhí)行任務(wù)的層面,它的增益并不顯著,遠(yuǎn)沒(méi)有趕上“智”的進(jìn)化。
二是自主。也就是變被動(dòng)響應(yīng)為主動(dòng)思考,根據(jù)感知到的具體情境做出靈活的有針對(duì)性的決定和行動(dòng),主動(dòng)規(guī)劃、主動(dòng)推理、主動(dòng)在現(xiàn)實(shí)世界采取行動(dòng)。
三是預(yù)測(cè)。收到“把水杯放在桌上”的指令后,為什么人類能把裝著水的水杯正面朝上,平放在桌面而不是有起伏的書堆之上,是因?yàn)槿祟惸軌蝾A(yù)測(cè)當(dāng)水杯放在“斜坡”上會(huì)失去平衡而滑落到地上。機(jī)器“擬”人,就需要掌握預(yù)測(cè)能力。這就要求AI不僅可以理解物理世界的規(guī)律,還能對(duì)這些規(guī)律產(chǎn)生記憶,在合適的時(shí)候調(diào)出這些記憶。
可以預(yù)見(jiàn),當(dāng)主動(dòng)行動(dòng)、快速預(yù)測(cè)的AI智能體“煉”成后,我們的手機(jī)、電腦、軟件、機(jī)器人,就可以自己“跑”了。而如何能讓人工智能的“能”追上“智”的發(fā)育,如何能獲得行動(dòng)、自主、預(yù)測(cè)這三種能力,尚無(wú)現(xiàn)成方案可依,不僅需要新的范式,也需要開(kāi)拓新的路徑。