熊節(jié)：“主權(quán)AI”對(duì)大多數(shù)南方國家遙不可及，DeepSeek改變了這一切

2025-2-18 13:53| 發(fā)布者: admin| 查看: 107| 評(píng)論: 0

摘要: 【文/觀察者網(wǎng)專欄作者熊節(jié)】 DeepSeek-R1模型的開源發(fā)布，引發(fā)了全世界對(duì)大語言模型（LLM）人工智能的又一輪關(guān)注熱潮。DeepSeek以遠(yuǎn)低于OpenAI的成本，訓(xùn)練出了效果接近甚至部分優(yōu)于OpenAI-o1的模型，并且用“蒸餾 ...

【文/觀察者網(wǎng)專欄作者熊節(jié)】

DeepSeek-R1模型的開源發(fā)布，引發(fā)了全世界對(duì)大語言模型（LLM）人工智能的又一輪關(guān)注熱潮。DeepSeek以遠(yuǎn)低于OpenAI的成本，訓(xùn)練出了效果接近甚至部分優(yōu)于OpenAI-o1的模型，并且用“蒸餾”（distillation）技術(shù)提供了一系列參數(shù)規(guī)模相對(duì)很小、效果劣化程度不太嚴(yán)重、有一定實(shí)用價(jià)值的衍生模型，例如國家超算互聯(lián)網(wǎng)平臺(tái)SCNet部署并免費(fèi)向公眾開放的Qwen-7B和Qwen-32B等。

根據(jù)筆者的實(shí)驗(yàn)和估算，部署運(yùn)行DeepSeek-R1 671B模型（即大家經(jīng)常口頭說的“滿血模型”）用于內(nèi)部研究實(shí)驗(yàn)，大致需要每小時(shí)300元以上或每月十幾萬元的成本；如果采用有監(jiān)督微調(diào)（SFT）方法對(duì)其進(jìn)行訓(xùn)練，成本還要再增加好幾倍。這個(gè)成本仍然超出大部分個(gè)人和小微企業(yè)的承受能力，但對(duì)于大型企業(yè)和國家來說已經(jīng)完全可以接受。

華為超算中心網(wǎng)絡(luò)

這就意味著大語言模型被DeepSeek高度“民主化”了：任何國家都能訓(xùn)練并部署一個(gè)很大程度上自主可控、基本體現(xiàn)本國價(jià)值觀、能結(jié)合本國實(shí)際情況的，接近或達(dá)到世界最先進(jìn)水平的大模型AI——僅僅幾個(gè)月之前，這件事基本上只有美國和中國能做到。

一些國家的政府已經(jīng)意識(shí)到了這一轉(zhuǎn)變的重要性。印度政府將投入“計(jì)算基礎(chǔ)設(shè)施、數(shù)據(jù)和資本支持，以在農(nóng)業(yè)和氣候變化等領(lǐng)域構(gòu)建與人工智能（AI）相關(guān)的應(yīng)用”，據(jù)說印度的大模型將在DeepSeek-R1的基礎(chǔ)上構(gòu)建。韓國宣布加快國家級(jí)人工智能（AI）計(jì)算基礎(chǔ)設(shè)施的建設(shè)，目標(biāo)是成為“全球第三大AI強(qiáng)國”。韓國政府于2023年提出的這一目標(biāo)定義，明顯是意識(shí)到各國都有可能在短期內(nèi)建成自己的“主權(quán)AI”，而DeepSeek的開源大大加速了這一進(jìn)程。

巴西UFABC大學(xué)教授、前巴西總統(tǒng)府國家信息技術(shù)研究所（ITI）所長Sergio Amadeu指出，DeepSeek的開源“使那些在技術(shù)上依賴美國發(fā)展的國家能夠制定有利于自身發(fā)展的戰(zhàn)略……使[大模型]這項(xiàng)技術(shù)實(shí)現(xiàn)了民主化，為全球南方國家在這一領(lǐng)域開辟了新的可能性”，但同時(shí)“開源并不能解決建設(shè)對(duì)地方和國家發(fā)展至關(guān)重要的主權(quán)基礎(chǔ)設(shè)施的問題”。Amadeu的這一洞察指出數(shù)字主權(quán)領(lǐng)域的一個(gè)重大問題：數(shù)字主權(quán)是系統(tǒng)工程，僅靠一兩項(xiàng)立法或“殺手應(yīng)用”的突破僅靠一兩項(xiàng)立法或‘殺手應(yīng)用’的突破，無法實(shí)現(xiàn)數(shù)字主權(quán)水平的全面提升。

受歐盟GDPR的影響，目前各國在討論數(shù)字主權(quán)問題時(shí)經(jīng)常聚焦于數(shù)據(jù)所有權(quán)問題，即國家有權(quán)使用和管理本國生成的數(shù)據(jù)、并防止本國生成的數(shù)據(jù)被別國濫用。與之對(duì)應(yīng)的方案是以立法形式對(duì)數(shù)據(jù)的本地存儲(chǔ)和跨境傳輸加以約束，例如在本國產(chǎn)生的數(shù)據(jù)應(yīng)當(dāng)存儲(chǔ)在本國、數(shù)據(jù)跨境傳輸需要受本國法律管轄等。

另一些研究者則從傳播學(xué)角度關(guān)注美國互聯(lián)網(wǎng)大公司對(duì)信息的壟斷以及進(jìn)而對(duì)政治和國家安全的影響。與之對(duì)應(yīng)的方案是倡導(dǎo)獨(dú)立于美國大公司的替代性互聯(lián)網(wǎng)平臺(tái)，開源、去中心化等概念也經(jīng)常在這類方案中被提及。

但事實(shí)證明，數(shù)據(jù)所有權(quán)只是數(shù)字主權(quán)的一個(gè)部分，而且它很大程度上只是國家掌握數(shù)字主權(quán)進(jìn)程中相對(duì)靠后的部分、是數(shù)字主權(quán)的成果而非原因。歐盟在實(shí)施GDPR幾年后發(fā)現(xiàn)，盡管GDPR對(duì)數(shù)據(jù)所有權(quán)做了相當(dāng)嚴(yán)格的規(guī)定，但畢竟芯片、服務(wù)器、操作系統(tǒng)、云平臺(tái)等數(shù)字基礎(chǔ)設(shè)施都掌握在美國大公司手里。

于是歐盟只能一次次地調(diào)查、處罰美國大公司的壟斷行為，卻改變不了數(shù)據(jù)源源不斷地單向流入美國、并被CIA和NSA全面監(jiān)控的現(xiàn)實(shí)。正是因?yàn)橐庾R(shí)到這一點(diǎn)，歐盟已經(jīng)開始發(fā)展與AWS競爭的云計(jì)算平臺(tái)Gaia-X。當(dāng)然這個(gè)項(xiàng)目是否能達(dá)成預(yù)期，又是另一回事。

筆者提出的數(shù)字主權(quán)指數(shù)（Digital Sovereignty Index，DSI）框架認(rèn)為，數(shù)據(jù)所有權(quán)的獨(dú)立自主是國家整體數(shù)字主權(quán)的集中體現(xiàn)。如果國家沒有對(duì)數(shù)字基礎(chǔ)設(shè)施（即支撐數(shù)字空間運(yùn)行的硬件和軟件）的獨(dú)立自主，那么對(duì)數(shù)據(jù)所有權(quán)的限制實(shí)際上無法落地（歐盟和巴西的例子都體現(xiàn)了這一現(xiàn)象）；如果國家沒有數(shù)字治理的獨(dú)立自主，那么數(shù)字空間的規(guī)則必然被美國科技巨頭企業(yè)主導(dǎo)。

數(shù)字基礎(chǔ)設(shè)施和數(shù)字治理的獨(dú)立自主，都依賴于從事數(shù)字化產(chǎn)業(yè)的科研機(jī)構(gòu)、企業(yè)和人才的能力。數(shù)據(jù)所有權(quán)的獨(dú)立自主、數(shù)字基礎(chǔ)設(shè)施的獨(dú)立自主、數(shù)字治理的獨(dú)立自主、數(shù)字化能力的獨(dú)立自主，這四個(gè)維度共同構(gòu)成了數(shù)字主權(quán)的整個(gè)體系。

熊節(jié)：“主權(quán)AI”對(duì)大多數(shù)南方國家遙不可及，DeepSeek改變了這一切

正因?yàn)閿?shù)字主權(quán)是如此龐大的一個(gè)體系，想單純通過立法約束數(shù)據(jù)所有權(quán)，或者建設(shè)一兩個(gè)“殺手應(yīng)用”就從美國的數(shù)字霸權(quán)手中奪回?cái)?shù)字主權(quán)，是鏡花水月的幻想。同時(shí)，這一現(xiàn)實(shí)也對(duì)數(shù)字主權(quán)研究領(lǐng)域相當(dāng)流行的“多利益相關(guān)方”理論提出了重大挑戰(zhàn)——這一理論認(rèn)為，除了國家以外，企業(yè)、社群乃至個(gè)人都是數(shù)字主權(quán)的“利益相關(guān)方”，他們各方的利益與國家的利益未必一致，在數(shù)字主權(quán)的討論中都需要受到同等重視。

看看數(shù)字主權(quán)指數(shù)的四個(gè)維度就不難明白：數(shù)字基礎(chǔ)設(shè)施、數(shù)字治理和數(shù)字化能力的建設(shè)，超出了任何個(gè)人或社群的能力范圍，只有主權(quán)國家或超級(jí)大企業(yè)有可能進(jìn)行這些基礎(chǔ)工作。在幾家與美國政府緊密合作的美國大企業(yè)壟斷（除中國之外的）絕大部分?jǐn)?shù)字空間的現(xiàn)實(shí)情況下，在全球南方強(qiáng)調(diào)主權(quán)國家之外的“多利益相關(guān)方”實(shí)際上的效果就是削弱甚至批評(píng)對(duì)國家數(shù)字主權(quán)的關(guān)注，從而間接地維護(hù)了美國數(shù)字霸權(quán)現(xiàn)狀。

具體到大語言模型AI這個(gè)領(lǐng)域，DeepSeek的開源已經(jīng)讓眾多全球南方國家開始想象此前他們無法想象的數(shù)字主權(quán)問題：主權(quán)AI。隨著大眾越來越多地依賴大語言模型來獲取和生成信息，對(duì)大語言模型的掌控相當(dāng)程度上就意味著對(duì)意識(shí)形態(tài)、對(duì)價(jià)值觀的掌控。

如果全球南方國家不自主訓(xùn)練并運(yùn)營自己的主權(quán)AI，就意味著其國民自動(dòng)地依賴OpenAI或其他美國大公司提供的AI產(chǎn)品，也就意味著這個(gè)國家需要不斷地向美國大公司付費(fèi)、數(shù)據(jù)不斷流向美國大公司，并且對(duì)美國大公司的AI產(chǎn)品中內(nèi)嵌的意識(shí)形態(tài)偏見毫無辦法。

但正如Amadeu所指出的，一旦全球南方國家（包括其中經(jīng)濟(jì)和科技能力較為領(lǐng)先的國家，例如巴西）開始嘗試建設(shè)自己的主權(quán)AI，數(shù)字主權(quán)其他方面的挑戰(zhàn)將接踵而至。舉例來說，現(xiàn)在絕大多數(shù)全球南方國家如果想基于DeepSeek的開源模型訓(xùn)練和部署自己的主權(quán)AI，他們大概率只能選擇AWS或Azure的云服務(wù)。一旦美國決定禁止美國企業(yè)提供DeepSeek相關(guān)服務(wù)，這些全球南方國家的主權(quán)AI計(jì)劃就將受阻。這就是數(shù)字基礎(chǔ)設(shè)施不能自主帶來的約束。

熊節(jié)：“主權(quán)AI”對(duì)大多數(shù)南方國家遙不可及，DeepSeek改變了這一切

對(duì)于大部分全球南方國家而言，在目前的科研、產(chǎn)業(yè)和教育基礎(chǔ)上構(gòu)建相對(duì)獨(dú)立自主的數(shù)字基礎(chǔ)設(shè)施和數(shù)字化能力體系已經(jīng)相當(dāng)困難。即便是其中的大國巴西，其數(shù)字基礎(chǔ)設(shè)施仍然高度依賴美國。自20世紀(jì)90年代以來的政策轉(zhuǎn)向破壞了數(shù)字化產(chǎn)業(yè)持續(xù)發(fā)展的根基，這是該國目前數(shù)字主權(quán)水平較低的主要肇因。其他大部分全球南方國家的情況比巴西更糟糕。

全球南方國家如何才能擺脫美國數(shù)字霸權(quán)的掌控、獲得相對(duì)獨(dú)立的數(shù)字主權(quán)？與中國的合作是否可能助力這一進(jìn)程？這些都是擺在各國面前的現(xiàn)實(shí)挑戰(zhàn)。

今年（2025年）巴西擔(dān)任金磚國家主席國，其提出的六項(xiàng)“優(yōu)先工作議題”中就包括了“鼓勵(lì)包容性和負(fù)責(zé)任的人工智能治理促進(jìn)發(fā)展”一項(xiàng)。在巴西提出這項(xiàng)優(yōu)先工作議題時(shí)，DeepSeek-R1尚未發(fā)布，“主權(quán)AI”對(duì)于絕大多數(shù)全球南方國家而言似乎還是遙不可及。

而現(xiàn)在，DeepSeek-R1的開源發(fā)布、及其周邊開源項(xiàng)目的活躍，巴西等金磚國家看待人工智能治理的視角可能需要一個(gè)根本性的轉(zhuǎn)變：從過去必須依賴美國企業(yè)提供的AI來討論治理問題，轉(zhuǎn)向主權(quán)AI和多邊主義AI治理的可能性。今年7月的金磚國家峰會(huì)將在巴西舉行，金磚各國將如何看待DeepSeek給世界帶來的改變，主權(quán)AI、乃至更廣泛意義上的數(shù)字主權(quán)是否會(huì)成為金磚國家的明確訴求，將是今年金磚峰會(huì)值得關(guān)注的一個(gè)看點(diǎn)。

鑒于DeepSeek帶來的大語言模型人工智能民主化趨勢，筆者建議巴西等全球南方國家立即開始采取行動(dòng)，逐步形成自己的主權(quán)AI、乃至數(shù)字主權(quán)戰(zhàn)略：

1.組織力量對(duì)DeepSeek開展研究，尤其是了解如何通過后訓(xùn)練增強(qiáng)或修正大模型在特定領(lǐng)域、特定議題上的表現(xiàn)，以及如何圍繞大模型定制周邊的輔助軟件（例如聊天機(jī)器人、智能代理等），并制定切實(shí)可行的計(jì)劃，實(shí)施部署自主可控的主權(quán)AI。

2.以主權(quán)AI的迭代演進(jìn)作為牽引，識(shí)別本國數(shù)字空間產(chǎn)生的所有數(shù)據(jù)的重要性，對(duì)其中最重要的數(shù)據(jù)落實(shí)所有權(quán)，例如通過立法和執(zhí)法保障這些重要數(shù)據(jù)保存在本國、對(duì)重要數(shù)據(jù)的跨境傳輸加強(qiáng)管制。

3.在掌控?cái)?shù)據(jù)所有權(quán)的過程中，加強(qiáng)與華為等中國ICT企業(yè)的交流協(xié)作，逐漸降低本國數(shù)字基礎(chǔ)設(shè)施對(duì)美國科技巨頭的依賴程度，逐步加強(qiáng)對(duì)本國數(shù)字基礎(chǔ)設(shè)施的掌控能力。

4.在金磚國家平臺(tái)上與中國共同倡導(dǎo)多邊主義的AI治理國際秩序：在尊重各國主權(quán)獨(dú)立自主的前提下，鼓勵(lì)技術(shù)和經(jīng)驗(yàn)開放交流，促進(jìn)各國在AI領(lǐng)域平等互助、互利共贏的多邊協(xié)商與合作。

熊節(jié)：“主權(quán)AI”對(duì)大多數(shù)南方國家遙不可及，DeepSeek改變了這一切

本文系觀察者網(wǎng)獨(dú)家稿件，文章內(nèi)容純屬作者個(gè)人觀點(diǎn)，不代表平臺(tái)觀點(diǎn)，未經(jīng)授權(quán)，不得轉(zhuǎn)載，否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn，每日閱讀趣味文章。