網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 中國品牌 > 品牌智庫 > 正文

自然語言大模型重塑數(shù)據(jù)全球化大生產(chǎn)格局

隨著生成式人工智能技術(shù)取得突破性進(jìn)展,自然語言大模型可以根據(jù)人類指令,迅速完成寫文章、繪畫、作曲甚至制作視頻和動(dòng)畫等任務(wù),其“創(chuàng)作”涉獵的范圍幾乎可以媲美人類,而且水平隨著訓(xùn)練量增加還在不斷提升。ChatGPT、文心一言等生成式AI技術(shù)自然語言大模型的蓬勃發(fā)展標(biāo)志著數(shù)據(jù)生產(chǎn)的創(chuàng)造性、便捷性、泛在性程度提升到前所未有的高度,將有力推動(dòng)“從全球獲取數(shù)據(jù),加工數(shù)據(jù)服務(wù)全球”的數(shù)據(jù)全球化大生產(chǎn)進(jìn)程。

自然語言大模型加速形成全球參與、全球分工、全球享有的數(shù)據(jù)全球化大生產(chǎn)格局

推動(dòng)數(shù)據(jù)全球化大生產(chǎn)從“無意識(shí)”到“有意識(shí)”轉(zhuǎn)變。隨著網(wǎng)絡(luò)化、規(guī)?;皆絹碓礁?,數(shù)據(jù)協(xié)同生產(chǎn)覆蓋到每個(gè)數(shù)據(jù)生產(chǎn)主體,且每個(gè)數(shù)據(jù)生產(chǎn)單位都與外部保持著高密度聯(lián)接。然而,絕大多數(shù)的數(shù)據(jù)是用戶無意識(shí)、無目的制造出來的,如用戶消費(fèi)、出行、醫(yī)療等被有關(guān)設(shè)備終端監(jiān)測到的數(shù)據(jù),或者某一區(qū)域企業(yè)用電量、采購貨物量的數(shù)據(jù)。這些數(shù)據(jù)往往伴隨自然或社會(huì)行為而產(chǎn)生,并且持續(xù)于海量用戶及經(jīng)營主體的全生命周期,使得數(shù)據(jù)生產(chǎn)具備持久的內(nèi)生動(dòng)力,取之不盡、用之不竭。進(jìn)入AI時(shí)代,特別是以ChatGPT為代表的生成式AI對(duì)傳統(tǒng)AI交互方式進(jìn)行了重要?jiǎng)?chuàng)新,AI不再是工程師的專屬工具,推動(dòng)“低代碼革命”走進(jìn)人們的日常工作生活,引發(fā)AI的全面普及?;诖耍覀兛梢灶A(yù)測生成式AI的低門檻使用將極大程度激發(fā)人們主觀能動(dòng)性,“有意識(shí)”地開展數(shù)據(jù)生產(chǎn)。

推動(dòng)數(shù)據(jù)全球化大生產(chǎn)從“自發(fā)性”到“自覺性”轉(zhuǎn)變。全球化具有自發(fā)性。自從人類走入信息時(shí)代,內(nèi)容生產(chǎn),即生成數(shù)字化的文本、圖形、音樂等就成為重要生產(chǎn)活動(dòng)。內(nèi)容生產(chǎn)中,數(shù)據(jù)加工方式經(jīng)歷了專家生成內(nèi)容(PGC)、用戶生成內(nèi)容(UGC)到AI生成內(nèi)容(AIGC)三個(gè)階段。專家生成內(nèi)容的生產(chǎn)者數(shù)量有限,產(chǎn)能不足;用戶生成內(nèi)容雖然生產(chǎn)者數(shù)量龐大,但缺乏標(biāo)準(zhǔn)化,質(zhì)量有限。這種低質(zhì)低效冗余數(shù)據(jù)生產(chǎn),只能說是自發(fā)的數(shù)據(jù)生產(chǎn)。進(jìn)入生成式AI階段,生產(chǎn)效率顯著提升,人們可自動(dòng)、批量、標(biāo)準(zhǔn)化生成低成本、大數(shù)量、高質(zhì)量的數(shù)據(jù)產(chǎn)品,數(shù)據(jù)全球化大生產(chǎn)將從一個(gè)自發(fā)的過程向一個(gè)更加自覺的過程發(fā)展。

推動(dòng)數(shù)據(jù)全球化生產(chǎn)從“單領(lǐng)域”向“多場景”轉(zhuǎn)變。傳統(tǒng)的人工智能模型具有高度專用性,即需要針對(duì)特定任務(wù)對(duì)模型進(jìn)行專門訓(xùn)練和設(shè)計(jì),一個(gè)模型往往只能完成一種任務(wù),無法交叉使用。ChatGPT的基礎(chǔ)大模型“變形金剛”(Transformer)則不同,網(wǎng)絡(luò)深度達(dá)到1750億個(gè)參數(shù),不僅能根據(jù)用戶輸入的文本生成文字序列,從而與用戶聊天、幫用戶寫作翻譯,還可以生成序列化的數(shù)學(xué)符號(hào)、圖形像素、電腦程序等,實(shí)現(xiàn)在用戶語言指導(dǎo)下做題、繪圖、編程等多種任務(wù),用統(tǒng)一的“文本序列生成”核心功能實(shí)現(xiàn)“一專多能”的泛在化應(yīng)用。據(jù)業(yè)內(nèi)人士預(yù)測,ChatGPT相關(guān)模型還可能應(yīng)用到醫(yī)療健康建議、生成3D打印設(shè)計(jì)圖等場景,甚至可能在AI領(lǐng)域形成跨越模型形態(tài),單一模型解決所有問題的“大統(tǒng)一模型”,為每個(gè)行業(yè)帶來AI再造機(jī)會(huì)。

總的來看,隨著生成式AI快速發(fā)展,全球各類數(shù)據(jù)都將更加便捷、深入地參與到數(shù)字經(jīng)濟(jì)中,并以標(biāo)準(zhǔn)化、自動(dòng)化的方式,針對(duì)不同領(lǐng)域、不同功能批量生產(chǎn)海量數(shù)據(jù)產(chǎn)品和服務(wù),加速形成全球參與、全球分工、全球享有的數(shù)據(jù)全球化大生產(chǎn)格局。數(shù)據(jù)全球化大生產(chǎn)成為全新的要素配置和生產(chǎn)方式,將重構(gòu)全球創(chuàng)新版圖、重組全球經(jīng)濟(jì)結(jié)構(gòu)、重建社會(huì)生產(chǎn)模式、重塑人類生活方式。

積極培育數(shù)據(jù)產(chǎn)業(yè)體系,努力推動(dòng)實(shí)現(xiàn)“三中心一引領(lǐng)”

以數(shù)據(jù)為主要內(nèi)容的新一輪全球化,機(jī)遇挑戰(zhàn)都將前所未有。建議依托國家數(shù)據(jù)局的成立,加強(qiáng)頂層設(shè)計(jì),積極培育數(shù)據(jù)產(chǎn)業(yè)體系,推動(dòng)高水平數(shù)據(jù)開放,努力推動(dòng)實(shí)現(xiàn)“三中心一引領(lǐng)”,在新一輪全球化進(jìn)程中爭取主導(dǎo)地位。

充分發(fā)揮海量數(shù)據(jù)比較優(yōu)勢,建設(shè)全球數(shù)據(jù)獲取中心。積極推進(jìn)數(shù)據(jù)資源開發(fā)利用,加強(qiáng)公共數(shù)據(jù)資源共享,推動(dòng)打破政企間數(shù)據(jù)壁壘,降低數(shù)據(jù)獲取成本。在確保數(shù)據(jù)安全的前提下,適度放寬數(shù)據(jù)產(chǎn)業(yè)準(zhǔn)入門檻,持續(xù)引進(jìn)全球人工智能和數(shù)據(jù)產(chǎn)業(yè)跨國公司在華設(shè)立總部、研發(fā)中心、數(shù)據(jù)采購中心。大力發(fā)展新型存儲(chǔ)器產(chǎn)品,布局支持多樣性算力、高通量算力、多協(xié)議接口的數(shù)據(jù)存儲(chǔ)系統(tǒng)。推動(dòng)實(shí)現(xiàn)跨地域、跨數(shù)據(jù)源的端、邊、云數(shù)據(jù)協(xié)同,以及存儲(chǔ)與計(jì)算、網(wǎng)絡(luò)基礎(chǔ)設(shè)施的高效協(xié)同,形成數(shù)據(jù)存儲(chǔ)全球服務(wù)能力。

補(bǔ)齊算力短板,發(fā)展全球數(shù)據(jù)生產(chǎn)中心。AI發(fā)展的三要素是算法、算力、數(shù)據(jù)。其中算力是數(shù)字時(shí)代的“石油”,自2012年開啟黃金時(shí)代后,AI對(duì)算力的需求開始呈現(xiàn)指數(shù)級(jí)增長。從2012年的AlexNet,到2017年的AlphaGoZero,算力消耗足足翻了30萬倍。特別是進(jìn)行AI大模型訓(xùn)練,需要專門的GPU集群,傳統(tǒng)數(shù)據(jù)中心的用場不大。充分發(fā)揮新型舉國體制作用,“揭榜掛帥”攻堅(jiān)AI大模型技術(shù)瓶頸。著力突破高端通用芯片技術(shù),升級(jí)AI框架、芯片等。推動(dòng)公共算力泛在應(yīng)用,持續(xù)降低算力成本,形成全球智能計(jì)算成本洼地。

健全數(shù)據(jù)交易配套制度,打造全球數(shù)據(jù)融通中心。建立數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)和數(shù)據(jù)產(chǎn)品經(jīng)營權(quán)“三權(quán)分置”的數(shù)據(jù)產(chǎn)權(quán)制度框架,構(gòu)建中國特色數(shù)據(jù)產(chǎn)權(quán)制度體系。鼓勵(lì)國內(nèi)外經(jīng)營主體探索數(shù)據(jù)資產(chǎn)定價(jià)機(jī)制,推動(dòng)形成全球數(shù)據(jù)資產(chǎn)目錄,逐步完善數(shù)據(jù)定價(jià)體系。規(guī)范數(shù)據(jù)交易管理,建立面向全球的數(shù)據(jù)資產(chǎn)評(píng)估、登記結(jié)算、交易撮合、爭議仲裁等市場運(yùn)營體系,降低數(shù)據(jù)交易成本。培育發(fā)展全球數(shù)據(jù)交易平臺(tái),健全平臺(tái)報(bào)價(jià)、詢價(jià)、競價(jià)、定價(jià)機(jī)制,探索協(xié)議轉(zhuǎn)讓、掛牌、拍賣等多種數(shù)據(jù)交易模式。

完善數(shù)據(jù)規(guī)則標(biāo)準(zhǔn),積極引領(lǐng)全球數(shù)據(jù)治理。積極對(duì)接、主動(dòng)引領(lǐng)國際規(guī)則,發(fā)起成立全球性的數(shù)據(jù)合作組織,有效參與數(shù)據(jù)全球化規(guī)則制定。加快數(shù)據(jù)行業(yè)標(biāo)準(zhǔn)化發(fā)展,積極參與全球數(shù)據(jù)產(chǎn)業(yè)標(biāo)準(zhǔn)制定。發(fā)展新型國際數(shù)據(jù)貿(mào)易,在具有條件的自貿(mào)區(qū)、開發(fā)區(qū)試點(diǎn)探索高標(biāo)準(zhǔn)的數(shù)據(jù)流動(dòng)、隱私保護(hù)等規(guī)則,推動(dòng)試點(diǎn)地區(qū)與歐盟、日本等地區(qū)標(biāo)準(zhǔn)互認(rèn)。促進(jìn)我國和其他國家先進(jìn)技術(shù)互相兼容認(rèn)證。在數(shù)據(jù)跨境流動(dòng)、數(shù)據(jù)保護(hù)、數(shù)字監(jiān)管等領(lǐng)域加強(qiáng)國際合作,著力拓展數(shù)據(jù)全球化大生產(chǎn)“朋友圈”,提高“中國方案”“中國標(biāo)準(zhǔn)”影響力。

[責(zé)任編輯:潘旺旺]
標(biāo)簽: 大模型   全球化   ChatGPT   數(shù)據(jù)要素