?明略科技CEO吳明輝:大模型落地企業(yè)方法論
2023-11-23
明略科技長期致力于提供基于大數(shù)據(jù)和人工智能的產(chǎn)品與服務(wù),推動組織高效運轉(zhuǎn)、加速創(chuàng)新,創(chuàng)造人機協(xié)同的美好世界。2023年8月,明略科技推出一站式大模型AI智能助理——小明助理Copilot,經(jīng)過內(nèi)部的試水與打磨,95%的員工已在日常工作中高頻應(yīng)用,周活達到70%以上,初步實現(xiàn)“與大模型同頻”。近日,作為企業(yè)級大模型應(yīng)用的開發(fā)者與早期使用者,明略科技創(chuàng)始人、CEO吳明輝受邀蒞臨混沌學(xué)園,結(jié)合企業(yè)自身實踐與行業(yè)觀察,就大模型落地企業(yè)的方法論,展開深度分享。
在同其它企業(yè)CEO、CIO、CMO聊天時,我發(fā)現(xiàn)大家對于大模型的出現(xiàn)都感到很興奮,很多公司都建立了人工智能小分隊,但嘗試幾次后發(fā)現(xiàn)效果并不理想。
現(xiàn)在,OpenAI已經(jīng)把參數(shù)做得非常高,它擁有的是互聯(lián)網(wǎng)上的通識知識。如果訓(xùn)練得足夠好,它可以擁有優(yōu)秀本科畢業(yè)生同等的認知能力。但即使擁有了這種認知能力,就能確保大數(shù)據(jù)在企業(yè)中做好很多工作嗎?答案是否定的。
值得注意的是,大量的模型參數(shù)并不能確保在工作中有效轉(zhuǎn)化成生產(chǎn)力。有些任務(wù),即使用很小參數(shù)的模型也能解決。
在無法判斷一個大模型效果好壞時,我建議大家可以向大模型提出一個問題進行檢測,“美國的哪一個州跟其他的州不接壤”,這個問題的正確答案是阿拉斯加和夏威夷,它需要大數(shù)據(jù)知道美國的地理情況以及州和州之間的關(guān)系。
我們講大模型的迭代能力,就是要提高它的推理能力,而推理的過程需要信息。
現(xiàn)在,參數(shù)在不斷提高的過程中并沒有增加信息,不斷提高參數(shù)只是讓模型的推理能力變強大了。做個類比,模型是f,信息是x,只有把正確的x給到強大的模型f,才有可能算出正確的y,才有可能輔助企業(yè)的理性決策和下一步行動,這是部分企業(yè)認為大模型不好用的核心原因。
今天人們想將大模型應(yīng)用到公司當中,但是大模型并不知道公司原有的生產(chǎn)資料和信息系統(tǒng)。一個好的大模型,需要人們將信息找過來。
管理大師野中郁次郎在《創(chuàng)造知識的企業(yè)》一書中提到,每個企業(yè)有暗默的知識,也有顯性的知識,企業(yè)最核心的就是要把這些知識管理好。
在大模型時代,這些知識不僅存在于每位員工的大腦中,存在于企業(yè)的文檔庫中,甚至存在于每次會議的錄音當中。有一天,大語言模型可以直接執(zhí)行錄音里面的知識。這就如同一個優(yōu)秀的高校畢業(yè)生在你身邊當助手,你需要做的就是每天用資料同它交互,就可以大幅提升效率。未來,企業(yè)的知識管理邏輯也將發(fā)生巨大的變化。
企業(yè)迎接大模型時代的第一個命題,就是要解決知識工程問題。
現(xiàn)代認知心理學(xué)將知識分為兩類,一類是陳述性知識,一類是程序性知識。例如,大象是一種動物,這是陳述性知識。把大象放到冰箱里面分幾步,這是程序性知識。編程知識也屬于程序性知識。
當人們問大模型提問,“湖南和湖北的兩個省會,哪個人口更多?”一些大模型往往會卡住,因為它根本沒有理解這句話的意思。但如果通過操作把它的CoT(思維鏈)能力調(diào)出來,大模型就有能力將答案推理出來。如同一名剛?cè)肼毜男聠T工,只要公司把任務(wù)拆得足夠細,他就能做好。大模型的學(xué)習(xí)、發(fā)展和應(yīng)用的過程,同人類從小的學(xué)習(xí)發(fā)展過程非常相像,兩者是完全可以類比的。
Prompt(提示詞工程)和CoT(思維鏈)技術(shù)是大模型能力發(fā)現(xiàn)的重要組成部分,其革命性意義可以媲美人類文字和印刷術(shù)的發(fā)明。CoT的重點是把程序?qū)懬宄T谛∶髦鞢opilot中,只要簡要地表明你的目標,它就可以將Prompt模板寫出來,非常方便。
Prompt和CoT的出現(xiàn),實現(xiàn)了大模型和大模型之間互相學(xué)習(xí)的設(shè)想,只要讀懂了你的指令,大模型就可以將這些指令執(zhí)行得非常好,并且下一個人可以立足于訓(xùn)練成熟的AI繼續(xù)發(fā)展,每個人都站在巨人的肩膀之上。
除此之外,還有更高級的用法,比如Agent。Agent的本質(zhì)就是模型和信息,好的Agent可以把大語言模型和Memory、Tools、Planning的能力有機地組織起來。
在整理數(shù)據(jù)和知識時,企業(yè)不僅要考慮如何規(guī)劃數(shù)據(jù)、知識,同時也要考慮權(quán)限問題。我的建議是按照兩個維度四象限的邏輯進行分析,包括數(shù)據(jù)的公開程度、執(zhí)行任務(wù)的推理復(fù)雜性等。對于低密集又需要高難度推理能力的,可以直接使用在線大模型;對于高密集且推理能力不高的,例如財務(wù)信息、HR信息、研發(fā)產(chǎn)品信息等,可以部署一個私有化模型。企業(yè)要做的,就是把對應(yīng)的密集問題想明白、分好級。
在企業(yè)中,真正想把信息系統(tǒng)整理好,并且和大模型連接起來,需要解決諸多難題。最簡單的方法就是使用Copilot。
Copilot是什么?pilot的意思是駕駛員,Co-pilot的意思是聯(lián)合駕駛或副駕駛。舉個例子,人們最理想的狀態(tài)是讓汽車變成無人駕駛,但成本和代價很大。在Copilot模式中,主駕駛還是人,副駕駛的職能是協(xié)助人做一些決策和操作,甚至完成主駕托管的任務(wù),但最后的決定權(quán)仍在人類手中。明略開發(fā)小明助理Copilot的意義就在于此。
通過小明助理Copilot,今年公司員工已經(jīng)做到了廣泛使用大模型,平均每個員工一天使用10次以上,大家不僅可以用GPT解決工作生活中遇到的一些問題,還可以應(yīng)用到自己的生產(chǎn)環(huán)境中,用于提升生產(chǎn)效率,公司團隊絕大多數(shù)的同學(xué)都已經(jīng)拿到了大模型的船票。
如同《異類》一書中提出的1萬小時定律,只要比別人多花一些時間做某件事情,未來就有機會享受到某個領(lǐng)域的競爭紅利。每一項新技術(shù)的出現(xiàn)都是有紅利的,最終大家也一定都會使用到,但更早接觸的人會比別人多一些機會和時間。
彭博社是全球最大的金融信息服務(wù)商,明略科技旗下的秒針系統(tǒng)是中國最大的廣告領(lǐng)域信息服務(wù)商,兩者有著一定的共通之處。彭博社的創(chuàng)始人邁克爾·布隆伯格創(chuàng)業(yè)初期,立志將終端機賣給每一個金融機構(gòu),希望幫助大家快速獲取互聯(lián)網(wǎng)上的金融信息,這也成就了彭博社今天在全球金融信息服務(wù)領(lǐng)域的霸主地位。很多公司都在擁抱新技術(shù),它們可能是將某一項新技術(shù)用到了極致,或者是第一個使用新技術(shù)從而顛覆了上一代產(chǎn)品,最終走出了新的曲線。
信息填寫