人工智能是新一輪科技革命和產業(yè)變革的重要驅動力量,深度學習作為人工智能的核心技術,具有很強的通用性,并具備標準化、自動化和模塊化的工業(yè)大生產特征,而大模型的興起,使得人工智能應用的深度和廣度進一步拓展。人工智能已進入工業(yè)大生產階段。
例如,標準化方面,框架和模型聯合優(yōu)化,多硬件統一適配,應用模式簡潔高效,大幅降低人工智能應用門檻;自動化方面,從訓練、適配到推理部署,提升人工智能研發(fā)全流程效率;模塊化方面,豐富的產業(yè)級模型庫,支撐人工智能在廣泛場景的便捷應用。人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的基礎能力,這4項能力越強,越接近通用人工智能。而大語言模型具備了這4項能力,且越來越強,為通用人工智能帶來了曙光。
百度在3月16日發(fā)布新一代知識增強大語言模型“文心一言”,目前文心一言的基礎模型已迭代到文心大模型4.0。知識增強大語言模型從數萬億數據和數千億知識中融合學習,得到預訓練大模型,在此基礎上采用有監(jiān)督精調、人類反饋強化學習、提示等技術,具備知識增強、檢索增強和對話增強的技術優(yōu)勢。此外,文心大模型4.0在輸入和輸出階段都進行知識點增強。在邏輯增強方面,通過大規(guī)模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡,提升邏輯能力。而在插件方面,通過數據驅動、提示構建,以及插件增強進行場景適配,協同優(yōu)化。文心一言已上線百度搜索、覽卷文檔、E言易圖、說圖解畫、一鏡流影等原生插件,擴展了大模型能力邊界,更適應場景需要。
正是通過飛槳與文心的協同優(yōu)化,文心大模型周均訓練有效率超過98%,訓練效率提升到3月發(fā)布時的3.6倍,推理性能提升50倍。文心4.0的理解、生成、邏輯、記憶4大能力顯著提升,其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到理解的2倍多。
文心一言自今年8月31日面向全社會開放,用戶規(guī)模達到7000萬,場景4300個。飛槳和文心生態(tài)已凝聚800萬開發(fā)者,服務22萬家企事業(yè)單位,創(chuàng)建了80萬個模型。面對大模型產業(yè)化的挑戰(zhàn),類似芯片代工廠模式,可以采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數據綜合優(yōu)勢的企業(yè)將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業(yè)提供大模型服務。
目前,這一產業(yè)化路徑已在文心大模型產業(yè)實踐中得到驗證,百度與合作伙伴共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等10余個行業(yè)大模型,正加速大模型產業(yè)化落地。
(作者系百度首席技術官、深度學習技術及應用國家工程研究中心主任)