【文/觀察者網(wǎng)專欄作者 熊節(jié)】 DeepSeek-R1模型的開源發(fā)布,引發(fā)了全世界對(duì)大語言模型(LLM)人工智能的又一輪關(guān)注熱潮。DeepSeek以遠(yuǎn)低于OpenAI的成本,訓(xùn)練出了效果接近甚至部分優(yōu)于OpenAI-o1的模型,并且用“蒸餾”(distillation)技術(shù)提供了一系列參數(shù)規(guī)模相對(duì)很小、效果劣化程度不太嚴(yán)重、有一定實(shí)用價(jià)值的衍生模型,例如國家超算互聯(lián)網(wǎng)平臺(tái)SCNet部署并免費(fèi)向公眾開放的Qwen-7B和Qwen-32B等。 根據(jù)筆者的實(shí)驗(yàn)和估算,部署運(yùn)行DeepSeek-R1 671B模型(即大家經(jīng)常口頭說的“滿血模型”)用于內(nèi)部研究實(shí)驗(yàn),大致需要每小時(shí)300元以上或每月十幾萬元的成本;如果采用有監(jiān)督微調(diào)(SFT)方法對(duì)其進(jìn)行訓(xùn)練,成本還要再增加好幾倍。這個(gè)成本仍然超出大部分個(gè)人和小微企業(yè)的承受能力,但對(duì)于大型企業(yè)和國家來說已經(jīng)完全可以接受。 華為超算中心 網(wǎng)絡(luò) 這就意味著大語言模型被DeepSeek高度“民主化”了:任何國家都能訓(xùn)練并部署一個(gè)很大程度上自主可控、基本體現(xiàn)本國價(jià)值觀、能結(jié)合本國實(shí)際情況的,接近或達(dá)到世界最先進(jìn)水平的大模型AI——僅僅幾個(gè)月之前,這件事基本上只有美國和中國能做到。 一些國家的政府已經(jīng)意識(shí)到了這一轉(zhuǎn)變的重要性。印度政府將投入“計(jì)算基礎(chǔ)設(shè)施、數(shù)據(jù)和資本支持,以在農(nóng)業(yè)和氣候變化等領(lǐng)域構(gòu)建與人工智能(AI)相關(guān)的應(yīng)用”,據(jù)說印度的大模型將在DeepSeek-R1的基礎(chǔ)上構(gòu)建。韓國宣布加快國家級(jí)人工智能(AI)計(jì)算基礎(chǔ)設(shè)施的建設(shè),目標(biāo)是成為“全球第三大AI強(qiáng)國”。韓國政府于2023年提出的這一目標(biāo)定義,明顯是意識(shí)到各國都有可能在短期內(nèi)建成自己的“主權(quán)AI”,而DeepSeek的開源大大加速了這一進(jìn)程。 巴西UFABC大學(xué)教授、前巴西總統(tǒng)府國家信息技術(shù)研究所(ITI)所長Sergio Amadeu指出,DeepSeek的開源“使那些在技術(shù)上依賴美國發(fā)展的國家能夠制定有利于自身發(fā)展的戰(zhàn)略……使[大模型]這項(xiàng)技術(shù)實(shí)現(xiàn)了民主化,為全球南方國家在這一領(lǐng)域開辟了新的可能性”,但同時(shí)“開源并不能解決建設(shè)對(duì)地方和國家發(fā)展至關(guān)重要的主權(quán)基礎(chǔ)設(shè)施的問題”。Amadeu的這一洞察指出數(shù)字主權(quán)領(lǐng)域的一個(gè)重大問題:數(shù)字主權(quán)是系統(tǒng)工程,僅靠一兩項(xiàng)立法或“殺手應(yīng)用”的突破僅靠一兩項(xiàng)立法或‘殺手應(yīng)用’的突破,無法實(shí)現(xiàn)數(shù)字主權(quán)水平的全面提升。 受歐盟GDPR的影響,目前各國在討論數(shù)字主權(quán)問題時(shí)經(jīng)常聚焦于數(shù)據(jù)所有權(quán)問題,即國家有權(quán)使用和管理本國生成的數(shù)據(jù)、并防止本國生成的數(shù)據(jù)被別國濫用。與之對(duì)應(yīng)的方案是以立法形式對(duì)數(shù)據(jù)的本地存儲(chǔ)和跨境傳輸加以約束,例如在本國產(chǎn)生的數(shù)據(jù)應(yīng)當(dāng)存儲(chǔ)在本國、數(shù)據(jù)跨境傳輸需要受本國法律管轄等。 另一些研究者則從傳播學(xué)角度關(guān)注美國互聯(lián)網(wǎng)大公司對(duì)信息的壟斷以及進(jìn)而對(duì)政治和國家安全的影響。與之對(duì)應(yīng)的方案是倡導(dǎo)獨(dú)立于美國大公司的替代性互聯(lián)網(wǎng)平臺(tái),開源、去中心化等概念也經(jīng)常在這類方案中被提及。 但事實(shí)證明,數(shù)據(jù)所有權(quán)只是數(shù)字主權(quán)的一個(gè)部分,而且它很大程度上只是國家掌握數(shù)字主權(quán)進(jìn)程中相對(duì)靠后的部分、是數(shù)字主權(quán)的成果而非原因。歐盟在實(shí)施GDPR幾年后發(fā)現(xiàn),盡管GDPR對(duì)數(shù)據(jù)所有權(quán)做了相當(dāng)嚴(yán)格的規(guī)定,但畢竟芯片、服務(wù)器、操作系統(tǒng)、云平臺(tái)等數(shù)字基礎(chǔ)設(shè)施都掌握在美國大公司手里。 于是歐盟只能一次次地調(diào)查、處罰美國大公司的壟斷行為,卻改變不了數(shù)據(jù)源源不斷地單向流入美國、并被CIA和NSA全面監(jiān)控的現(xiàn)實(shí)。正是因?yàn)橐庾R(shí)到這一點(diǎn),歐盟已經(jīng)開始發(fā)展與AWS競爭的云計(jì)算平臺(tái)Gaia-X。當(dāng)然這個(gè)項(xiàng)目是否能達(dá)成預(yù)期,又是另一回事。 筆者提出的數(shù)字主權(quán)指數(shù)(Digital Sovereignty Index,DSI)框架認(rèn)為,數(shù)據(jù)所有權(quán)的獨(dú)立自主是國家整體數(shù)字主權(quán)的集中體現(xiàn)。如果國家沒有對(duì)數(shù)字基礎(chǔ)設(shè)施(即支撐數(shù)字空間運(yùn)行的硬件和軟件)的獨(dú)立自主,那么對(duì)數(shù)據(jù)所有權(quán)的限制實(shí)際上無法落地(歐盟和巴西的例子都體現(xiàn)了這一現(xiàn)象);如果國家沒有數(shù)字治理的獨(dú)立自主,那么數(shù)字空間的規(guī)則必然被美國科技巨頭企業(yè)主導(dǎo)。 數(shù)字基礎(chǔ)設(shè)施和數(shù)字治理的獨(dú)立自主,都依賴于從事數(shù)字化產(chǎn)業(yè)的科研機(jī)構(gòu)、企業(yè)和人才的能力。數(shù)據(jù)所有權(quán)的獨(dú)立自主、數(shù)字基礎(chǔ)設(shè)施的獨(dú)立自主、數(shù)字治理的獨(dú)立自主、數(shù)字化能力的獨(dú)立自主,這四個(gè)維度共同構(gòu)成了數(shù)字主權(quán)的整個(gè)體系。 正因?yàn)閿?shù)字主權(quán)是如此龐大的一個(gè)體系,想單純通過立法約束數(shù)據(jù)所有權(quán),或者建設(shè)一兩個(gè)“殺手應(yīng)用”就從美國的數(shù)字霸權(quán)手中奪回?cái)?shù)字主權(quán),是鏡花水月的幻想。同時(shí),這一現(xiàn)實(shí)也對(duì)數(shù)字主權(quán)研究領(lǐng)域相當(dāng)流行的“多利益相關(guān)方”理論提出了重大挑戰(zhàn)——這一理論認(rèn)為,除了國家以外,企業(yè)、社群乃至個(gè)人都是數(shù)字主權(quán)的“利益相關(guān)方”,他們各方的利益與國家的利益未必一致,在數(shù)字主權(quán)的討論中都需要受到同等重視。 看看數(shù)字主權(quán)指數(shù)的四個(gè)維度就不難明白:數(shù)字基礎(chǔ)設(shè)施、數(shù)字治理和數(shù)字化能力的建設(shè),超出了任何個(gè)人或社群的能力范圍,只有主權(quán)國家或超級(jí)大企業(yè)有可能進(jìn)行這些基礎(chǔ)工作。在幾家與美國政府緊密合作的美國大企業(yè)壟斷(除中國之外的)絕大部分?jǐn)?shù)字空間的現(xiàn)實(shí)情況下,在全球南方強(qiáng)調(diào)主權(quán)國家之外的“多利益相關(guān)方”實(shí)際上的效果就是削弱甚至批評(píng)對(duì)國家數(shù)字主權(quán)的關(guān)注,從而間接地維護(hù)了美國數(shù)字霸權(quán)現(xiàn)狀。 具體到大語言模型AI這個(gè)領(lǐng)域,DeepSeek的開源已經(jīng)讓眾多全球南方國家開始想象此前他們無法想象的數(shù)字主權(quán)問題:主權(quán)AI。隨著大眾越來越多地依賴大語言模型來獲取和生成信息,對(duì)大語言模型的掌控相當(dāng)程度上就意味著對(duì)意識(shí)形態(tài)、對(duì)價(jià)值觀的掌控。 如果全球南方國家不自主訓(xùn)練并運(yùn)營自己的主權(quán)AI,就意味著其國民自動(dòng)地依賴OpenAI或其他美國大公司提供的AI產(chǎn)品,也就意味著這個(gè)國家需要不斷地向美國大公司付費(fèi)、數(shù)據(jù)不斷流向美國大公司,并且對(duì)美國大公司的AI產(chǎn)品中內(nèi)嵌的意識(shí)形態(tài)偏見毫無辦法。 但正如Amadeu所指出的,一旦全球南方國家(包括其中經(jīng)濟(jì)和科技能力較為領(lǐng)先的國家,例如巴西)開始嘗試建設(shè)自己的主權(quán)AI,數(shù)字主權(quán)其他方面的挑戰(zhàn)將接踵而至。舉例來說,現(xiàn)在絕大多數(shù)全球南方國家如果想基于DeepSeek的開源模型訓(xùn)練和部署自己的主權(quán)AI,他們大概率只能選擇AWS或Azure的云服務(wù)。一旦美國決定禁止美國企業(yè)提供DeepSeek相關(guān)服務(wù),這些全球南方國家的主權(quán)AI計(jì)劃就將受阻。這就是數(shù)字基礎(chǔ)設(shè)施不能自主帶來的約束。 對(duì)于大部分全球南方國家而言,在目前的科研、產(chǎn)業(yè)和教育基礎(chǔ)上構(gòu)建相對(duì)獨(dú)立自主的數(shù)字基礎(chǔ)設(shè)施和數(shù)字化能力體系已經(jīng)相當(dāng)困難。即便是其中的大國巴西,其數(shù)字基礎(chǔ)設(shè)施仍然高度依賴美國。自20世紀(jì)90年代以來的政策轉(zhuǎn)向破壞了數(shù)字化產(chǎn)業(yè)持續(xù)發(fā)展的根基,這是該國目前數(shù)字主權(quán)水平較低的主要肇因。其他大部分全球南方國家的情況比巴西更糟糕。 全球南方國家如何才能擺脫美國數(shù)字霸權(quán)的掌控、獲得相對(duì)獨(dú)立的數(shù)字主權(quán)?與中國的合作是否可能助力這一進(jìn)程?這些都是擺在各國面前的現(xiàn)實(shí)挑戰(zhàn)。 今年(2025年)巴西擔(dān)任金磚國家主席國,其提出的六項(xiàng)“優(yōu)先工作議題”中就包括了“鼓勵(lì)包容性和負(fù)責(zé)任的人工智能治理促進(jìn)發(fā)展”一項(xiàng)。在巴西提出這項(xiàng)優(yōu)先工作議題時(shí),DeepSeek-R1尚未發(fā)布,“主權(quán)AI”對(duì)于絕大多數(shù)全球南方國家而言似乎還是遙不可及。 而現(xiàn)在,DeepSeek-R1的開源發(fā)布、及其周邊開源項(xiàng)目的活躍,巴西等金磚國家看待人工智能治理的視角可能需要一個(gè)根本性的轉(zhuǎn)變:從過去必須依賴美國企業(yè)提供的AI來討論治理問題,轉(zhuǎn)向主權(quán)AI和多邊主義AI治理的可能性。今年7月的金磚國家峰會(huì)將在巴西舉行,金磚各國將如何看待DeepSeek給世界帶來的改變,主權(quán)AI、乃至更廣泛意義上的數(shù)字主權(quán)是否會(huì)成為金磚國家的明確訴求,將是今年金磚峰會(huì)值得關(guān)注的一個(gè)看點(diǎn)。 鑒于DeepSeek帶來的大語言模型人工智能民主化趨勢,筆者建議巴西等全球南方國家立即開始采取行動(dòng),逐步形成自己的主權(quán)AI、乃至數(shù)字主權(quán)戰(zhàn)略: 1.組織力量對(duì)DeepSeek開展研究,尤其是了解如何通過后訓(xùn)練增強(qiáng)或修正大模型在特定領(lǐng)域、特定議題上的表現(xiàn),以及如何圍繞大模型定制周邊的輔助軟件(例如聊天機(jī)器人、智能代理等),并制定切實(shí)可行的計(jì)劃,實(shí)施部署自主可控的主權(quán)AI。 2.以主權(quán)AI的迭代演進(jìn)作為牽引,識(shí)別本國數(shù)字空間產(chǎn)生的所有數(shù)據(jù)的重要性,對(duì)其中最重要的數(shù)據(jù)落實(shí)所有權(quán),例如通過立法和執(zhí)法保障這些重要數(shù)據(jù)保存在本國、對(duì)重要數(shù)據(jù)的跨境傳輸加強(qiáng)管制。 3.在掌控?cái)?shù)據(jù)所有權(quán)的過程中,加強(qiáng)與華為等中國ICT企業(yè)的交流協(xié)作,逐漸降低本國數(shù)字基礎(chǔ)設(shè)施對(duì)美國科技巨頭的依賴程度,逐步加強(qiáng)對(duì)本國數(shù)字基礎(chǔ)設(shè)施的掌控能力。 4.在金磚國家平臺(tái)上與中國共同倡導(dǎo)多邊主義的AI治理國際秩序:在尊重各國主權(quán)獨(dú)立自主的前提下,鼓勵(lì)技術(shù)和經(jīng)驗(yàn)開放交流,促進(jìn)各國在AI領(lǐng)域平等互助、互利共贏的多邊協(xié)商與合作。 本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。 |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽