委員長(zhǎng)、各位副委員長(zhǎng)、秘書長(zhǎng)、各位委員:
人工智能領(lǐng)域近年來正在迎來一場(chǎng)由生成式人工智能大模型引領(lǐng)的爆發(fā)式發(fā)展。2022年11月30日,OpenAI公司推出一款人工智能對(duì)話聊天機(jī)器人ChatGPT,其出色的自然語言生成能力引起了全世界范圍的廣泛關(guān)注,2個(gè)月突破1億用戶,國(guó)內(nèi)外隨即掀起了一場(chǎng)大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨后春筍般涌現(xiàn),2022年也被譽(yù)為大模型元年。當(dāng)前信息時(shí)代正加快進(jìn)入智能計(jì)算的發(fā)展階段,人工智能技術(shù)上的突破層出不窮,逐漸深入地賦能千行百業(yè),推動(dòng)人工智能與數(shù)據(jù)要素成為新質(zhì)生產(chǎn)力的典型代表。習(xí)近平總書記指出,把新一代人工智能作為推動(dòng)科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級(jí)、生產(chǎn)力整體躍升的驅(qū)動(dòng)力量,努力實(shí)現(xiàn)高質(zhì)量發(fā)展。黨的十八大以來,以習(xí)近平同志為核心的黨中央高度重視智能經(jīng)濟(jì)發(fā)展,促進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合,為高質(zhì)量發(fā)展注入強(qiáng)勁動(dòng)力。
一、計(jì)算技術(shù)發(fā)展簡(jiǎn)介
計(jì)算技術(shù)的發(fā)展歷史大致可分為四個(gè)階段,算盤的出現(xiàn)標(biāo)志著人類進(jìn)入第一代——機(jī)械計(jì)算時(shí)代,第二代——電子計(jì)算的標(biāo)志是出現(xiàn)電子器件與電子計(jì)算機(jī),互聯(lián)網(wǎng)的出現(xiàn)使我們進(jìn)入第三代——網(wǎng)絡(luò)計(jì)算,當(dāng)前人類社會(huì)正在進(jìn)入第四階段——智能計(jì)算。
早期的計(jì)算裝置是手動(dòng)輔助計(jì)算裝置和半自動(dòng)計(jì)算裝置,人類計(jì)算工具的歷史是從公元1200年的中國(guó)算盤開始,隨后出現(xiàn)了納皮爾籌(1612年)和滾輪式加法器(1642年),到1672年第一臺(tái)自動(dòng)完成四則運(yùn)算的計(jì)算裝置——步進(jìn)計(jì)算器誕生了。
機(jī)械計(jì)算時(shí)期已經(jīng)出現(xiàn)了現(xiàn)代計(jì)算機(jī)的一些基本概念。查爾斯?巴貝奇(Charles Babbage)提出了差分機(jī)(1822年)與分析機(jī)(1834年)的設(shè)計(jì)構(gòu)想,支持自動(dòng)機(jī)械計(jì)算。這一時(shí)期,編程與程序的概念基本形成,編程的概念起源于雅卡爾提花機(jī),通過打孔卡片控制印花圖案,最終演變?yōu)橥ㄟ^計(jì)算指令的形式來存儲(chǔ)所有數(shù)學(xué)計(jì)算步驟;人類歷史的第一個(gè)程序員是詩人拜倫之女艾達(dá)(Ada),她為巴貝奇差分機(jī)編寫了一組求解伯努利數(shù)列的計(jì)算指令,這套指令也是人類歷史上第一套計(jì)算機(jī)算法程序,它將硬件和軟件分離,第一次出現(xiàn)程序的概念。
直到在二十世紀(jì)上半葉,出現(xiàn)了布爾代數(shù)(數(shù)學(xué))、圖靈機(jī)(計(jì)算模型) 、馮諾依曼體系結(jié)構(gòu)(架構(gòu)) 、晶體管(器件)這四個(gè)現(xiàn)代計(jì)算技術(shù)的科學(xué)基礎(chǔ)。其中,布爾代數(shù)用來描述程序和硬件如CPU的底層邏輯;圖靈機(jī)是一種通用的計(jì)算模型,將復(fù)雜任務(wù)轉(zhuǎn)化為自動(dòng)計(jì)算、不需人工干預(yù)的自動(dòng)化過程;馮諾依曼體系結(jié)構(gòu)提出了構(gòu)造計(jì)算機(jī)的三個(gè)基本原則:采用二進(jìn)制邏輯、程序存儲(chǔ)執(zhí)行、以及計(jì)算機(jī)由運(yùn)算器、控制器、存儲(chǔ)器、輸入設(shè)備、輸出設(shè)備這五個(gè)基本單元組成;晶體管是構(gòu)成基本的邏輯電路和存儲(chǔ)電路的半導(dǎo)體器件,是建造現(xiàn)代計(jì)算機(jī)之塔的“磚塊”。基于以上科學(xué)基礎(chǔ),計(jì)算技術(shù)得以高速發(fā)展,形成規(guī)模龐大的產(chǎn)業(yè)。
從1946年世界上第一臺(tái)電子計(jì)算機(jī)ENIAC誕生到二十一世紀(jì)的今天,已經(jīng)形成了五類成功的平臺(tái)型計(jì)算系統(tǒng)。當(dāng)前各領(lǐng)域各種類型的應(yīng)用,都可以由這五類平臺(tái)型計(jì)算裝置支撐。第一類是高性能計(jì)算平臺(tái),解決了國(guó)家核心部門的科學(xué)與工程計(jì)算問題;第二類是企業(yè)計(jì)算平臺(tái),又稱服務(wù)器,用于企業(yè)級(jí)的數(shù)據(jù)管理、事務(wù)處理,當(dāng)前像百度、阿里和騰訊這些互聯(lián)網(wǎng)公司的計(jì)算平臺(tái)都屬于這一類;第三類是個(gè)人電腦平臺(tái),以桌面應(yīng)用的形式出現(xiàn),人們通過桌面應(yīng)用與個(gè)人電腦交互;第四類是智能手機(jī),主要特點(diǎn)是移動(dòng)便攜,手機(jī)通過網(wǎng)絡(luò)連接數(shù)據(jù)中心,以互聯(lián)網(wǎng)應(yīng)用為主,它們分布式地部署在數(shù)據(jù)中心和手機(jī)終端;第五類是嵌入式計(jì)算機(jī),嵌入到工業(yè)裝備和軍事設(shè)備,通過實(shí)時(shí)的控制,保障在確定時(shí)間內(nèi)完成特定任務(wù)。這五類裝置幾乎覆蓋了我們信息社會(huì)的方方面面,長(zhǎng)期以來人們追求的以智能計(jì)算應(yīng)用為中心的第六類平臺(tái)型計(jì)算系統(tǒng)尚未形成。
現(xiàn)代計(jì)算技術(shù)的發(fā)展大致可以劃分為三個(gè)時(shí)代。IT1.0又稱電子計(jì)算時(shí)代(1950-1970),基本特征是以“機(jī)”為中心。計(jì)算技術(shù)的基本架構(gòu)形成,隨著集成電路工藝的進(jìn)步,基本計(jì)算單元的尺度快速微縮,晶體管密度、計(jì)算性能和可靠性不斷提升,計(jì)算機(jī)在科學(xué)工程計(jì)算、企業(yè)數(shù)據(jù)處理中得到了廣泛應(yīng)用。
IT2.0又稱網(wǎng)絡(luò)計(jì)算時(shí)代(1980-2020),以“人”為中心。互聯(lián)網(wǎng)將人使用的終端與后臺(tái)的數(shù)據(jù)中心連接,互聯(lián)網(wǎng)應(yīng)用通過智能終端與人進(jìn)行交互。以亞馬遜等為代表的互聯(lián)網(wǎng)公司提出了云計(jì)算的思想,將后臺(tái)的算力封裝成一個(gè)公共服務(wù)租借給第三方用戶,形成了云計(jì)算與大數(shù)據(jù)產(chǎn)業(yè)。
IT3.0又稱智能計(jì)算時(shí)代,始于2020年,與IT2.0相比增加了“物”的概念,即物理世界的各種端側(cè)設(shè)備,被數(shù)字化、網(wǎng)絡(luò)化和智能化,實(shí)現(xiàn)“人-機(jī)-物”三元融合。智能計(jì)算時(shí)代,除了互聯(lián)網(wǎng)以外,還有數(shù)據(jù)基礎(chǔ)設(shè)施,支撐各類終端通過端邊云實(shí)現(xiàn)萬物互聯(lián),終端、物端、邊緣、云都嵌入AI,提供與ChatGPT類似的大模型智能服務(wù),最終實(shí)現(xiàn)有計(jì)算的地方就有AI智能。智能計(jì)算帶來了巨量的數(shù)據(jù)、人工智能算法的突破和對(duì)算力的爆發(fā)性需求。
二、智能計(jì)算發(fā)展簡(jiǎn)介
智能計(jì)算包括人工智能技術(shù)與它的計(jì)算載體,大致歷經(jīng)了四個(gè)階段,分別為通用計(jì)算裝置、邏輯推理專家系統(tǒng)、深度學(xué)習(xí)計(jì)算系統(tǒng)、大模型計(jì)算系統(tǒng)。
智能計(jì)算的起點(diǎn)是通用自動(dòng)計(jì)算裝置(1946年)。艾倫·圖靈(Alan Turing)和馮·諾依曼(John von Neumann)等科學(xué)家,一開始都希望能夠模擬人腦處理知識(shí)的過程,發(fā)明像人腦一樣思考的機(jī)器,雖未能實(shí)現(xiàn),但卻解決了計(jì)算的自動(dòng)化問題。通用自動(dòng)計(jì)算裝置的出現(xiàn),也推動(dòng)了1956年人工智能(AI)概念的誕生,此后所有人工智能技術(shù)的發(fā)展都是建立在新一代計(jì)算設(shè)備與更強(qiáng)的計(jì)算能力之上的。
智能計(jì)算發(fā)展的第二階段是邏輯推理專家系統(tǒng)(1990年)。E.A.費(fèi)根鮑姆(Edward Albert Feigenbaum)等符號(hào)智能學(xué)派的科學(xué)家以邏輯和推理能力自動(dòng)化為主要目標(biāo),提出了能夠?qū)⒅R(shí)符號(hào)進(jìn)行邏輯推理的專家系統(tǒng)。人的先驗(yàn)知識(shí)以知識(shí)符號(hào)的形式進(jìn)入計(jì)算機(jī),使計(jì)算機(jī)能夠在特定領(lǐng)域輔助人類進(jìn)行一定的邏輯判斷和決策,但專家系統(tǒng)嚴(yán)重依賴于手工生成的知識(shí)庫(kù)或規(guī)則庫(kù)。這類專家系統(tǒng)的典型代表是日本的五代機(jī)和我國(guó)863計(jì)劃支持的306智能計(jì)算機(jī)主題,日本在邏輯專家系統(tǒng)中采取專用計(jì)算平臺(tái)和Prolog這樣的知識(shí)推理語言完成應(yīng)用級(jí)推理任務(wù);我國(guó)采取了與日本不同的技術(shù)路線,以通用計(jì)算平臺(tái)為基礎(chǔ),將智能任務(wù)變成人工智能算法,將硬件和系統(tǒng)軟件都接入通用計(jì)算平臺(tái),并催生了曙光、漢王、科大訊飛等一批骨干企業(yè)。
符號(hào)計(jì)算系統(tǒng)的局限性在于其爆炸的計(jì)算時(shí)空復(fù)雜度,即符號(hào)計(jì)算系統(tǒng)只能解決線性增長(zhǎng)問題,對(duì)于高維復(fù)雜空間問題是無法求解的,從而限制了能夠處理問題的大小。同時(shí)因?yàn)榉?hào)計(jì)算系統(tǒng)是基于知識(shí)規(guī)則建立的,我們又無法對(duì)所有的常識(shí)用窮舉法來進(jìn)行枚舉,它的應(yīng)用范圍就受到了很大的限制。隨著第二次AI寒冬的到來,第一代智能計(jì)算機(jī)逐漸退出歷史舞臺(tái)。
直到2014年左右,智能計(jì)算進(jìn)階到第三階段——深度學(xué)習(xí)計(jì)算系統(tǒng)。以杰弗里·辛頓(Geoffrey Hinton)等為代表的連接智能學(xué)派,以學(xué)習(xí)能力自動(dòng)化為目標(biāo),發(fā)明了深度學(xué)習(xí)等新AI算法。通過深度神經(jīng)元網(wǎng)絡(luò)的自動(dòng)學(xué)習(xí),大幅提升了模型統(tǒng)計(jì)歸納的能力,在模式識(shí)別①等應(yīng)用效果上取得了巨大突破,某些場(chǎng)景的識(shí)別精度甚至超越了人類。以人臉識(shí)別為例,整個(gè)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程相當(dāng)于一個(gè)網(wǎng)絡(luò)參數(shù)調(diào)整的過程,將大量的經(jīng)過標(biāo)注的人臉圖片數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),然后進(jìn)行網(wǎng)絡(luò)間參數(shù)調(diào)整,讓神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果的概率無限逼近真實(shí)結(jié)果。神經(jīng)網(wǎng)絡(luò)輸出真實(shí)情況的概率越大,參數(shù)就越大,從而將知識(shí)和規(guī)則編碼到網(wǎng)絡(luò)參數(shù)中,這樣只要數(shù)據(jù)足夠多,就可以對(duì)各種大量的常識(shí)進(jìn)行學(xué)習(xí),通用性得到極大的提升。連接智能的應(yīng)用更加廣泛,包括語音識(shí)別、人臉識(shí)別、自動(dòng)駕駛等。在計(jì)算載體方面,中國(guó)科學(xué)院計(jì)算技術(shù)研究所2013年提出了國(guó)際首個(gè)深度學(xué)習(xí)處理器架構(gòu),國(guó)際知名的硬件廠商英偉達(dá)(NVIDIA)持續(xù)發(fā)布了多款性能領(lǐng)先的通用GPU芯片,都是深度學(xué)習(xí)計(jì)算系統(tǒng)的典型代表。
智能計(jì)算發(fā)展的第四階段是大模型計(jì)算系統(tǒng)(2020年)。在人工智能大模型技術(shù)的推動(dòng)下,智能計(jì)算邁向新的高度。2020年,AI從“小模型+判別式”轉(zhuǎn)向“大模型+生成式”,從傳統(tǒng)的人臉識(shí)別、目標(biāo)檢測(cè)、文本分類,升級(jí)到如今的文本生成、3D數(shù)字人生成、圖像生成、語音生成、視頻生成。大語言模型在對(duì)話系統(tǒng)領(lǐng)域的一個(gè)典型應(yīng)用是OpenAI公司的ChatGPT,它采用預(yù)訓(xùn)練基座大語言模型GPT-3,引入3000億單詞的訓(xùn)練語料,相當(dāng)于互聯(lián)網(wǎng)上所有英語文字的總和。其基本原理是:通過給它一個(gè)輸入,讓它預(yù)測(cè)下一個(gè)單詞來訓(xùn)練模型,通過大量訓(xùn)練提升預(yù)測(cè)精確度,最終達(dá)到向它詢問一個(gè)問題,大模型產(chǎn)生一個(gè)答案,與人即時(shí)對(duì)話。在基座大模型的基礎(chǔ)上,再給它一些提示詞進(jìn)行有監(jiān)督的指令微調(diào),通過人類的<指令,回復(fù)>對(duì)逐漸讓模型學(xué)會(huì)如何與人進(jìn)行多輪對(duì)話;最后,通過人為設(shè)計(jì)和自動(dòng)生成的獎(jiǎng)勵(lì)函數(shù)來進(jìn)行強(qiáng)化學(xué)習(xí)迭代,逐步實(shí)現(xiàn)大模型與人類價(jià)值觀的對(duì)齊。
大模型的特點(diǎn)是以“大”取勝,其中有三層含義,(1)參數(shù)大,GPT-3就有1700億個(gè)參數(shù);(2)訓(xùn)練數(shù)據(jù)大,ChatGPT大約用了3000億個(gè)單詞,570GB訓(xùn)練數(shù)據(jù);(3)算力需求大,GPT-3大約用了上萬塊V100 GPU進(jìn)行訓(xùn)練。為滿足大模型對(duì)智能算力爆炸式增加的需求,國(guó)內(nèi)外都在大規(guī)模建設(shè)耗資巨大的新型智算中心,英偉達(dá)公司也推出了采用256個(gè)H100芯片,150TB海量GPU內(nèi)存等構(gòu)成的大模型智能計(jì)算系統(tǒng)。
大模型的出現(xiàn)帶來了三個(gè)變革。一是技術(shù)上的規(guī)模定律(Scaling Law),即很多AI模型的精度在參數(shù)規(guī)模超過某個(gè)閾值后模型能力快速提升,其原因在科學(xué)界還不是非常清楚,有很大的爭(zhēng)議。AI模型的性能與模型參數(shù)規(guī)模、數(shù)據(jù)集大小、算力總量三個(gè)變量成“對(duì)數(shù)線性關(guān)系”,因此可以通過增大模型的規(guī)模來不斷提高模型的性能。目前最前沿的大模型GPT-4參數(shù)量已經(jīng)達(dá)到了萬億到十萬億量級(jí),并且仍在不斷增長(zhǎng)中;二是產(chǎn)業(yè)上算力需求爆炸式增長(zhǎng),千億參數(shù)規(guī)模大模型的訓(xùn)練通常需要在數(shù)千乃至數(shù)萬GPU卡上訓(xùn)練2-3個(gè)月時(shí)間,急劇增加的算力需求帶動(dòng)相關(guān)算力企業(yè)超高速發(fā)展,英偉達(dá)的市值接近兩萬億美元,對(duì)于芯片企業(yè)以前從來沒有發(fā)生過;三是社會(huì)上沖擊勞動(dòng)力市場(chǎng),北京大學(xué)國(guó)家發(fā)展研究院與智聯(lián)招聘聯(lián)合發(fā)布的《AI大模型對(duì)我國(guó)勞動(dòng)力市場(chǎng)潛在影響研究》報(bào)告指出,受影響最大的20個(gè)職業(yè)中財(cái)會(huì)、銷售、文書位于前列,需要與人打交道并提供服務(wù)的體力勞動(dòng)型工作,如人力資源、行政、后勤等反而相對(duì)更安全。
第一個(gè)前沿方向?yàn)槎嗄B(tài)大模型。
人工智能的技術(shù)前沿將朝著以下四個(gè)方向發(fā)展。從人類視角出發(fā),人類智能是天然多模態(tài)的,人擁有眼、耳、鼻、舌、身、嘴(語言),從AI視角出發(fā),視覺,聽覺等也都可以建模為token②的序列,可采取與大語言模型相同的方法進(jìn)行學(xué)習(xí),并進(jìn)一步與語言中的語義進(jìn)行對(duì)齊,實(shí)現(xiàn)多模態(tài)對(duì)齊的智能能力。
第二個(gè)前沿方向?yàn)橐曨l生成大模型。
OpenAI于2024年2月15日發(fā)布文生視頻模型SORA,將視頻生成時(shí)長(zhǎng)從幾秒鐘大幅提升到一分鐘,且在分辨率、畫面真實(shí)度、時(shí)序一致性等方面都有顯著提升。SORA的最大意義是它具備了世界模型的基本特征,即人類觀察世界并進(jìn)一步預(yù)測(cè)世界的能力。世界模型是建立在理解世界的基本物理常識(shí)(如,水往低處流等)之上,然后觀察并預(yù)測(cè)下一秒將要發(fā)生什么事件。雖然SORA要成為世界模型仍然存在很多問題,但可以認(rèn)為SORA學(xué)會(huì)了畫面想象力和分鐘級(jí)未來預(yù)測(cè)能力,這是世界模型的基礎(chǔ)特征。
第三個(gè)前沿方向?yàn)榫呱碇悄堋?/p>
具身智能指有身體并支持與物理世界進(jìn)行交互的智能體,如機(jī)器人、無人車等,通過多模態(tài)大模型處理多種傳感數(shù)據(jù)輸入,由大模型生成運(yùn)動(dòng)指令對(duì)智能體進(jìn)行驅(qū)動(dòng),替代傳統(tǒng)基于規(guī)則或者數(shù)學(xué)公式的運(yùn)動(dòng)驅(qū)動(dòng)方式,實(shí)現(xiàn)虛擬和現(xiàn)實(shí)的深度融合。因此,具有具身智能的機(jī)器人,可以聚集人工智能的三大流派:以神經(jīng)網(wǎng)絡(luò)為代表的連接主義,以知識(shí)工程為代表的符號(hào)主義和控制論相關(guān)的行為主義,三大流派可以同時(shí)作用在一個(gè)智能體,這預(yù)期會(huì)帶來新的技術(shù)突破。
第四個(gè)前沿方向是AI4R(AI for Research)成為科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明的主要范式。
當(dāng)前科學(xué)發(fā)現(xiàn)主要依賴于實(shí)驗(yàn)和人腦智慧,由人類進(jìn)行大膽猜想、小心求證,信息技術(shù)無論是計(jì)算和數(shù)據(jù),都只是起到一些輔助和驗(yàn)證的作用。相較于人類,人工智能在記憶力、高維復(fù)雜、全視野、推理深度、猜想等方面具有較大優(yōu)勢(shì),是否能以AI為主進(jìn)行一些科學(xué)發(fā)現(xiàn)和技術(shù)發(fā)明,大幅提升人類科學(xué)發(fā)現(xiàn)的效率,比如主動(dòng)發(fā)現(xiàn)物理學(xué)規(guī)律、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)、設(shè)計(jì)高性能芯片、高效合成新藥等。因?yàn)槿斯ぶ悄艽竽P途哂腥繑?shù)據(jù),具備上帝視角,通過深度學(xué)習(xí)的能力,可以比人向前看更多步數(shù),如能實(shí)現(xiàn)從推斷(inference)到推理(reasoning)的躍升,人工智能模型就有潛力具備愛因斯坦一樣的想象力和科學(xué)猜想能力,極大提升人類科學(xué)發(fā)現(xiàn)的效率,打破人類的認(rèn)知邊界。這才是真正的顛覆所在。
最后,通用人工智能③(Artificial General Intelligence,簡(jiǎn)稱AGI)是一個(gè)極具挑戰(zhàn)的話題,極具爭(zhēng)論性。
曾經(jīng)有一個(gè)哲學(xué)家和一個(gè)神經(jīng)科學(xué)家打賭:25年后(即2023年)科研人員是否能夠揭示大腦如何實(shí)現(xiàn)意識(shí)?當(dāng)時(shí)關(guān)于意識(shí)有兩個(gè)流派,一個(gè)叫集成信息理論,一個(gè)叫全局網(wǎng)絡(luò)工作空間理論,前者認(rèn)為意識(shí)是由大腦中特定類型神經(jīng)元連接形成的“結(jié)構(gòu)”,后者指出意識(shí)是當(dāng)信息通過互連網(wǎng)絡(luò)傳播到大腦區(qū)域時(shí)產(chǎn)生的。2023年,人們通過六個(gè)獨(dú)立實(shí)驗(yàn)室進(jìn)行了對(duì)抗性實(shí)驗(yàn),結(jié)果與兩種理論均不完全匹配,哲學(xué)家贏了,神經(jīng)科學(xué)家輸了。通過這一場(chǎng)賭約,可以看出人們總是希望人工智能能夠了解人類的認(rèn)知和大腦的奧秘。從物理學(xué)的視角看,物理學(xué)是對(duì)宏觀世界有了透徹理解后,從量子物理起步開啟了對(duì)微觀世界的理解。智能世界與物理世界一樣,都是具有巨大復(fù)雜度的研究對(duì)象,AI大模型仍然是通過數(shù)據(jù)驅(qū)動(dòng)等研究宏觀世界的方法,提高機(jī)器的智能水平,對(duì)智能宏觀世界理解并不夠,直接到神經(jīng)系統(tǒng)微觀世界尋找答案是困難的。人工智能自誕生以來,一直承載著人類關(guān)于智能與意識(shí)的種種夢(mèng)想與幻想,也激勵(lì)著人們不斷探索。
三、人工智能的安全風(fēng)險(xiǎn)
人工智能的發(fā)展促進(jìn)了當(dāng)今世界科技進(jìn)步的同時(shí),也帶來了很多安全風(fēng)險(xiǎn),要從技術(shù)與法規(guī)兩方面加以應(yīng)對(duì)。
一是數(shù)字分身。
首先是互聯(lián)網(wǎng)虛假信息泛濫。這里列舉若干場(chǎng)景:AI Yoon是首個(gè)使用 DeepFake 技術(shù)合成的官方“候選人”,這個(gè)數(shù)字人以韓國(guó)國(guó)民力量黨候選人尹錫悅(Yoon Suk-yeol)為原型,借助尹錫悅 20 小時(shí)的音頻和視頻片段、以及其專門為研究人員錄制的 3000 多個(gè)句子,由當(dāng)?shù)匾患?DeepFake 技術(shù)公司創(chuàng)建了虛擬形象 AI Yoon,并在網(wǎng)絡(luò)上迅速走紅。實(shí)際上 AI Yoon 表達(dá)的內(nèi)容是由競(jìng)選團(tuán)隊(duì)撰寫的,而不是候選人本人。
二是偽造視頻,
尤其是偽造領(lǐng)導(dǎo)人視頻引起國(guó)際爭(zhēng)端,擾亂選舉秩序,或引起突發(fā)輿情事件,如偽造尼克松宣布第一次登月失敗,偽造烏克蘭總統(tǒng)澤連斯基宣布“投降”的信息,這些行為導(dǎo)致新聞媒體行業(yè)的社會(huì)信任衰退。
三是偽造新聞,
主要通過虛假新聞自動(dòng)生成牟取非法利益,使用ChatGPT生成熱點(diǎn)新聞,賺取流量,截至2023年6月30日全球生成偽造新聞網(wǎng)站已達(dá)277個(gè),嚴(yán)重?cái)_亂社會(huì)秩序。
四是換臉變聲,
用于詐騙。如由于AI語音模仿了企業(yè)高管的聲音,一家香港國(guó)際企業(yè)因此被騙3500萬美元。
五是生成不雅圖片,
特別是針對(duì)公眾人物。如影視明星的色情視頻制作,造成不良社會(huì)影響。因此,迫切需要發(fā)展互聯(lián)網(wǎng)虛假信息的偽造檢測(cè)技術(shù)。
其次,AI大模型面臨嚴(yán)重可信問題。這些問題包括:(1)“一本正經(jīng)胡說八道”的事實(shí)性錯(cuò)誤;(2)以西方價(jià)值觀敘事,輸出政治偏見和錯(cuò)誤言論;(3)易被誘導(dǎo),輸出錯(cuò)誤知識(shí)和有害內(nèi)容;(4)數(shù)據(jù)安全問題加重,大模型成為重要敏感數(shù)據(jù)的誘捕器,ChatGPT將用戶輸入納入訓(xùn)練數(shù)據(jù)庫(kù),用于改善ChatGPT,美方能夠利用大模型獲得公開渠道覆蓋不到的中文語料,掌握我們自己都可能不掌握的“中國(guó)知識(shí)”。因此,迫切需要發(fā)展大模型安全監(jiān)管技術(shù)與自己的可信大模型。
除了技術(shù)手段外,人工智能安全保障需要相關(guān)立法工作。2021年科技部發(fā)布《新一代人工智能倫理規(guī)范》,2022年8月,全國(guó)信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)發(fā)布《信息安全技術(shù) 機(jī)器學(xué)習(xí)算法安全評(píng)估規(guī)范》,2022-2023年,中央網(wǎng)信辦先后發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《生成式人工智能服務(wù)管理辦法》等。歐美國(guó)家也先后出臺(tái)法規(guī),2018年5月25日,歐盟出臺(tái)《通用數(shù)據(jù)保護(hù)條例》,2022年10月4日,美國(guó)發(fā)布《人工智能權(quán)利法案藍(lán)圖》,2024年3月13日,歐洲議會(huì)通過了歐盟《人工智能法案》。
我國(guó)應(yīng)加快推進(jìn)《人工智能法》出臺(tái),構(gòu)建人工智能治理體系,確保人工智能的發(fā)展和應(yīng)用遵循人類共同價(jià)值觀,促進(jìn)人機(jī)和諧友好;創(chuàng)造有利于人工智能技術(shù)研究、開發(fā)、應(yīng)用的政策環(huán)境;建立合理披露機(jī)制和審計(jì)評(píng)估機(jī)制,理解人工智能機(jī)制原理和決策過程;明確人工智能系統(tǒng)的安全責(zé)任和問責(zé)機(jī)制,可追溯責(zé)任主體并補(bǔ)救;推動(dòng)形成公平合理、開放包容的國(guó)際人工智能治理規(guī)則。
四、中國(guó)智能計(jì)算發(fā)展困境
人工智能技術(shù)與智能計(jì)算產(chǎn)業(yè)處于中美科技競(jìng)爭(zhēng)的焦點(diǎn),我國(guó)在過去幾年雖然取得了很大的成績(jī),但依然面臨諸多發(fā)展困境,特別是由美國(guó)的科技打壓政策帶來的困難。
困境一為美國(guó)在AI核心能力上長(zhǎng)期處于領(lǐng)先地位,中國(guó)處于跟蹤模式。
中國(guó)在AI高端人才數(shù)量、AI基礎(chǔ)算法創(chuàng)新、AI底座大模型能力(大語言模型、文生圖模型、文生視頻模型)、底座大模型訓(xùn)練數(shù)據(jù)、底座大模型訓(xùn)練算力等,都與美國(guó)存在一定的差距,并且這種差距還將持續(xù)很長(zhǎng)一段時(shí)間。
困境二為高端算力產(chǎn)品禁售,高端芯片工藝長(zhǎng)期被卡。
A100,H100,B200等高端智算芯片對(duì)華禁售。華為、龍芯、寒武紀(jì)、曙光、海光等企業(yè)都進(jìn)入實(shí)體清單,它們芯片制造的先進(jìn)工藝④受限,國(guó)內(nèi)可滿足規(guī)模量產(chǎn)的工藝節(jié)點(diǎn)落后國(guó)際先進(jìn)水平2-3代,核心算力芯片的性能落后國(guó)際先進(jìn)水平2-3代。
困境三為國(guó)內(nèi)智能計(jì)算生態(tài)孱弱,AI開發(fā)框架滲透率不足。
英偉達(dá)CUDA⑤(Compute Unified Device Architecture, 通用計(jì)算設(shè)備架構(gòu))生態(tài)完備,已形成了事實(shí)上的壟斷。國(guó)內(nèi)生態(tài)孱弱,具體表現(xiàn)在:一是研發(fā)人員不足,英偉達(dá)CUDA生態(tài)有近2萬人開發(fā),是國(guó)內(nèi)所有智能芯片公司人員總和的20倍;二是開發(fā)工具不足,CUDA有550個(gè)SDK(Software Development Kit, 軟件開發(fā)工具包),是國(guó)內(nèi)相關(guān)企業(yè)的上百倍;三是資金投入不足,英偉達(dá)每年投入50億美元,是國(guó)內(nèi)相關(guān)公司的幾十倍;四是AI開發(fā)框架TensorFlow占據(jù)工業(yè)類市場(chǎng),PyTorch占據(jù)研究類市場(chǎng),百度飛槳等國(guó)產(chǎn)AI開發(fā)框架的開發(fā)人員只有國(guó)外框架的1/10。更為嚴(yán)重的是國(guó)內(nèi)企業(yè)之間山頭林立,無法形成合力,從智能應(yīng)用、開發(fā)框架、系統(tǒng)軟件、智能芯片,雖然每層都有相關(guān)產(chǎn)品,但各層之間沒有深度適配,無法形成一個(gè)有競(jìng)爭(zhēng)力的技術(shù)體系。
困境四為AI應(yīng)用于行業(yè)時(shí)成本、門檻居高不下。
當(dāng)前我國(guó)AI應(yīng)用主要集中在互聯(lián)網(wǎng)行業(yè)和一些國(guó)防領(lǐng)域。AI技術(shù)推廣應(yīng)用于各行各業(yè)時(shí),特別是從互聯(lián)網(wǎng)行業(yè)遷移到非互聯(lián)網(wǎng)行業(yè),需要進(jìn)行大量的定制工作,遷移難度大,單次使用成本高。最后,我國(guó)在AI領(lǐng)域的人才數(shù)量與實(shí)際需求相比也明顯不足。
五、中國(guó)如何發(fā)展智能計(jì)算的道路選擇
人工智能發(fā)展的道路選擇對(duì)我國(guó)至關(guān)重要,關(guān)系到發(fā)展的可持續(xù)性與最終的國(guó)際競(jìng)爭(zhēng)格局。當(dāng)前人工智能的使用成本十分高昂,微軟Copilot套件要支付每月10美元的使用費(fèi)用,ChatGPT每天消耗50萬千瓦時(shí)的電力,英偉達(dá)B200芯片價(jià)格高達(dá)3萬美元以上??傮w來說,我國(guó)應(yīng)發(fā)展用得起、安全可信的人工智能技術(shù),消除我國(guó)信息貧困人口、并造福“一帶一路”國(guó)家;低門檻地賦能各行各業(yè),讓我國(guó)的優(yōu)勢(shì)產(chǎn)業(yè)保持競(jìng)爭(zhēng)力,讓相對(duì)落后的產(chǎn)業(yè)能夠大幅地縮小差距。
選擇一:統(tǒng)一技術(shù)體系走閉源封閉,還是開源開放的道路?
支撐智能計(jì)算產(chǎn)業(yè)的是一個(gè)相互緊耦合的技術(shù)體系,即由一系列技術(shù)標(biāo)準(zhǔn)和知識(shí)產(chǎn)權(quán)將材料、器件、工藝、芯片、整機(jī)、系統(tǒng)軟件、應(yīng)用軟件等密切聯(lián)系在一起的技術(shù)整體。我國(guó)發(fā)展智能計(jì)算技術(shù)體系存在三條道路:
一是追趕兼容美國(guó)主導(dǎo)的A體系。
我國(guó)大多數(shù)互聯(lián)網(wǎng)企業(yè)走的是GPGPU/CUDA兼容道路,很多芯片領(lǐng)域的創(chuàng)業(yè)企業(yè)在生態(tài)構(gòu)建上也是盡量與CUDA兼容,這條道路較為現(xiàn)實(shí)。由于在算力方面美國(guó)對(duì)我國(guó)工藝和芯片帶寬的限制,在算法方面國(guó)內(nèi)生態(tài)林立很難形成統(tǒng)一,生態(tài)成熟度嚴(yán)重受限,在數(shù)據(jù)方面中文高質(zhì)量數(shù)據(jù)匱乏,這些因素會(huì)使得追趕者與領(lǐng)先者的差距很難縮小,一些時(shí)候還會(huì)進(jìn)一步拉大。
二是構(gòu)建專用封閉的B體系。
在軍事、氣象、司法等專用領(lǐng)域構(gòu)建企業(yè)封閉生態(tài),基于國(guó)產(chǎn)成熟工藝生產(chǎn)芯片,相對(duì)于底座大模型更加關(guān)注特定領(lǐng)域垂直類大模型,訓(xùn)練大模型更多采用領(lǐng)域?qū)S懈哔|(zhì)量數(shù)據(jù)等。這條道路易于形成完整可控的技術(shù)體系與生態(tài),我國(guó)一些大型骨干企業(yè)走的是這條道路,它的缺點(diǎn)是封閉,無法凝聚國(guó)內(nèi)大多數(shù)力量,也很難實(shí)現(xiàn)全球化。
三是全球共建開源開放的C體系。
用開源打破生態(tài)壟斷,降低企業(yè)擁有核心技術(shù)的門檻,讓每個(gè)企業(yè)都能低成本地做自己的芯片,形成智能芯片的汪洋大海,滿足無處不在的智能需求。用開放形成統(tǒng)一的技術(shù)體系,我國(guó)企業(yè)與全球化力量聯(lián)合起來共建基于國(guó)際標(biāo)準(zhǔn)的統(tǒng)一智能計(jì)算軟件棧。形成企業(yè)競(jìng)爭(zhēng)前共享機(jī)制,共享高質(zhì)量數(shù)據(jù)庫(kù),共享開源通用底座大模型。對(duì)于全球開源生態(tài),我國(guó)企業(yè)在互聯(lián)網(wǎng)時(shí)代收益良多,我國(guó)更多的是使用者,是參與者,在智能時(shí)代我國(guó)企業(yè)在RISC-V⑥+AI開源技術(shù)體系上應(yīng)更多地成為主力貢獻(xiàn)者,成為全球化開放共享的主導(dǎo)力量。
選擇二:拼算法模型,還是拼新型基礎(chǔ)設(shè)施?
人工智能技術(shù)要賦能各行各業(yè),具有典型的長(zhǎng)尾效應(yīng)⑦。我國(guó)80%的中小微企業(yè),需要的是低門檻、低價(jià)格的智能服務(wù)。因此,我國(guó)智能計(jì)算產(chǎn)業(yè)必須建立在新的數(shù)據(jù)空間基礎(chǔ)設(shè)施之上,其中關(guān)鍵是我國(guó)應(yīng)率先實(shí)現(xiàn)智能要素即數(shù)據(jù)、算力、算法的全面基礎(chǔ)設(shè)施化。這項(xiàng)工作可比肩二十世紀(jì)初美國(guó)信息高速公路計(jì)劃(即信息基礎(chǔ)設(shè)施建設(shè))對(duì)互聯(lián)網(wǎng)產(chǎn)業(yè)的歷史作用。
信息社會(huì)最核心的生產(chǎn)力是網(wǎng)絡(luò)空間(Cyberspace)。網(wǎng)絡(luò)空間的演進(jìn)過程是:從機(jī)器一元連接構(gòu)成的計(jì)算空間,演進(jìn)到人機(jī)信息二元連接構(gòu)成的信息空間,再演進(jìn)到人機(jī)物數(shù)據(jù)三元連接構(gòu)成的數(shù)據(jù)空間。從數(shù)據(jù)空間看,人工智能的本質(zhì)是數(shù)據(jù)的百煉成鋼,大模型就是對(duì)互聯(lián)網(wǎng)全量數(shù)據(jù)進(jìn)行深度加工后的產(chǎn)物。在數(shù)字化時(shí)代,在互聯(lián)網(wǎng)上傳輸?shù)氖切畔⒘?,是算力?duì)數(shù)據(jù)進(jìn)行粗加工后的結(jié)構(gòu)化抽象;在智能時(shí)代,在互聯(lián)網(wǎng)上傳輸?shù)氖侵悄芰?,是算力?duì)數(shù)據(jù)進(jìn)行深度加工與精煉后的模型化抽象。智能計(jì)算的一個(gè)核心特征就是用數(shù)值計(jì)算、數(shù)據(jù)分析、人工智能等算法,在算力池中加工海量數(shù)據(jù)件,得到智能模型,再嵌入到信息世界、物理世界的各個(gè)過程中。
首先,數(shù)據(jù)已成為國(guó)家戰(zhàn)略信息資源。
我國(guó)政府已經(jīng)前瞻性地提前布局了新型基礎(chǔ)設(shè)施,在世界各國(guó)競(jìng)爭(zhēng)中搶占了先機(jī)。數(shù)據(jù)具有資源要素與價(jià)值加工兩重屬性,數(shù)據(jù)的資源要素屬性包括生產(chǎn)、獲取、傳輸、匯聚、流通、交易、權(quán)屬、資產(chǎn)、安全等各個(gè)環(huán)節(jié),我國(guó)應(yīng)繼續(xù)加大力度建設(shè)國(guó)家數(shù)據(jù)樞紐與數(shù)據(jù)流通基礎(chǔ)設(shè)施。
其次,AI大模型就是數(shù)據(jù)空間的一類算法基礎(chǔ)設(shè)施。
以通用大模型為基座,構(gòu)建大模型研發(fā)與應(yīng)用的基礎(chǔ)設(shè)施,支撐廣大企業(yè)研發(fā)領(lǐng)域?qū)S么竽P停?wù)于機(jī)器人、無人駕駛、可穿戴設(shè)備、智能家居、智能安防等行業(yè),覆蓋長(zhǎng)尾應(yīng)用。
最后,全國(guó)一體化算力網(wǎng)建設(shè)在推動(dòng)算力的基礎(chǔ)設(shè)施化上發(fā)揮了先導(dǎo)作用。
算力基礎(chǔ)設(shè)施化的中國(guó)方案,應(yīng)在大幅度降低算力使用成本和使用門檻的同時(shí),為最廣范圍覆蓋人群提供高通量、高品質(zhì)的智能服務(wù)。算力基礎(chǔ)設(shè)施的中國(guó)方案需要具備“兩低一高”,即在供給側(cè),大幅度降低算力器件、算力設(shè)備、網(wǎng)絡(luò)連接、數(shù)據(jù)獲取、算法模型調(diào)用、電力消耗、運(yùn)營(yíng)維護(hù)、開發(fā)部署的總成本,讓廣大中小企業(yè)都消費(fèi)得起高品質(zhì)的算力服務(wù),有積極性開發(fā)算力網(wǎng)應(yīng)用;在消費(fèi)側(cè),大幅度降低廣大用戶的算力使用門檻,面向大眾的公共服務(wù)必須做到易獲取、易使用,像水電一樣即開即用,像編寫網(wǎng)頁一樣輕松定制算力服務(wù),開發(fā)算力網(wǎng)應(yīng)用。在服務(wù)效率側(cè),中國(guó)的算力服務(wù)要實(shí)現(xiàn)低熵高通量,其中高通量是指在實(shí)現(xiàn)高并發(fā)⑧度服務(wù)的同時(shí),端到端服務(wù)的響應(yīng)時(shí)間可滿足率高;低熵是指在高并發(fā)負(fù)載中出現(xiàn)資源無序競(jìng)爭(zhēng)的情況下,保障系統(tǒng)通量不急劇下降。保障“算得多”對(duì)中國(guó)尤其重要。
選擇三:AI+著重賦能虛擬經(jīng)濟(jì),還是發(fā)力實(shí)體經(jīng)濟(jì)?
“AI+”的成效是人工智能價(jià)值的試金石。次貸危機(jī)后,美國(guó)制造業(yè)增加值占GDP的比重從1950年的28%降低為2021年的11%,美國(guó)制造業(yè)在全行業(yè)就業(yè)人數(shù)占比從1979年的35%降低為2022年的8%,可見美國(guó)更傾向于回報(bào)率更高的虛擬經(jīng)濟(jì),輕視投資成本高且經(jīng)濟(jì)回報(bào)率低的實(shí)體經(jīng)濟(jì)。中國(guó)傾向于實(shí)體經(jīng)濟(jì)與虛擬經(jīng)濟(jì)同步發(fā)展,更加重視發(fā)展裝備制造、新能源汽車、光伏發(fā)電、鋰電池、高鐵、5G等實(shí)體經(jīng)濟(jì)。
相應(yīng)地美國(guó)AI主要應(yīng)用于虛擬經(jīng)濟(jì)和IT基礎(chǔ)工具,AI技術(shù)也是“脫實(shí)向虛”,自2007年以來硅谷不斷炒作虛擬現(xiàn)實(shí)(Virtual Reality,VR)、元宇宙、區(qū)塊鏈、Web3.0、深度學(xué)習(xí)、AI大模型等,是這個(gè)趨勢(shì)的反映。
我國(guó)的優(yōu)勢(shì)在實(shí)體經(jīng)濟(jì),制造業(yè)全球產(chǎn)業(yè)門類最齊全,體系最完整,特點(diǎn)是場(chǎng)景多、私有數(shù)據(jù)多。我國(guó)應(yīng)精選若干行業(yè)加大投入,形成可低門檻全行業(yè)推廣的范式,如選擇裝備制造業(yè)作為延續(xù)優(yōu)勢(shì)代表性行業(yè),選擇醫(yī)藥業(yè)作為快速縮短差距的代表性行業(yè)。賦能實(shí)體經(jīng)濟(jì)的技術(shù)難點(diǎn)是AI算法與物理機(jī)理的融合。
人工智能技術(shù)成功的關(guān)鍵是能否讓一個(gè)行業(yè)或一個(gè)產(chǎn)品的成本大幅下降,從而將用戶數(shù)與產(chǎn)業(yè)規(guī)模擴(kuò)大10倍,產(chǎn)生類似于蒸汽機(jī)對(duì)于紡織業(yè),智能手機(jī)對(duì)于互聯(lián)網(wǎng)業(yè)的變革效果。
我國(guó)應(yīng)走出適合自己的人工智能賦能實(shí)體經(jīng)濟(jì)的高質(zhì)量發(fā)展道路。
主講人系中國(guó)工程院院士,中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員、學(xué)術(shù)委員會(huì)主任
注釋:
?、倌J阶R(shí)別是指用計(jì)算的方法根據(jù)樣本的特征將樣本劃分到一定的類別中去,是通過計(jì)算機(jī)用數(shù)學(xué)方法來研究模式的自動(dòng)處理和判讀,把環(huán)境與客體統(tǒng)稱為“模式”。以圖像處理與計(jì)算機(jī)視覺、語音語言信息處理、腦網(wǎng)絡(luò)組、類腦智能等為主要研究方向。
?、赥oken可翻譯為詞元,指自然語言處理過程中用來表示單詞或短語的符號(hào)。token可以是單個(gè)字符,也可以是多個(gè)字符組成的序列。
?、弁ㄓ萌斯ぶ悄苁侵笓碛信c人類相當(dāng)甚至超過人類智能的人工智能類型。通用人工智能不僅能像人類一樣進(jìn)行感知、理解、學(xué)習(xí)和推理等基礎(chǔ)思維能力,還能在不同領(lǐng)域靈活應(yīng)用、快速學(xué)習(xí)和創(chuàng)造性思考。通用人工智能的研究目標(biāo)是尋求統(tǒng)一的理論框架來解釋各種智能現(xiàn)象。
?、苄酒圃旃に囍钢圃霤PU或GPU的制程,即晶體管門電路的尺寸,單位為納米,目前國(guó)際上實(shí)現(xiàn)量產(chǎn)的最先進(jìn)工藝以臺(tái)積電的3nm為代表。更先進(jìn)的制造工藝可以使CPU與GPU內(nèi)部集成更多的晶體管,使處理器具有更多的功能以及更高的性能,面積更小,成本更低等。
?、軨UDA是英偉達(dá)公司設(shè)計(jì)研發(fā)一種并行計(jì)算平臺(tái)和編程模型,包含了CUDA指令集架構(gòu)以及GPU內(nèi)部的并行計(jì)算引擎。開發(fā)人員可以使用C語言來為CUDA架構(gòu)編寫程序,所編寫出的程序可以在支持CUDA的處理器上以超高性能運(yùn)行。
?、轗ISC-V(發(fā)音為“risk-five”)是一個(gè)由美國(guó)加州大學(xué)伯克利分校發(fā)起的開放通用指令集架構(gòu),相比于其他付費(fèi)指令集,RISC-V允許任何人免費(fèi)地使用RISC-V指令集設(shè)計(jì)、制造和銷售芯片和軟件。
?、唛L(zhǎng)尾效應(yīng)是指那些原來不受到重視的銷量小但種類多的產(chǎn)品或服務(wù)由于總量巨大,累積起來的總收益超過主流產(chǎn)品的現(xiàn)象。在互聯(lián)網(wǎng)領(lǐng)域,長(zhǎng)尾效應(yīng)尤為顯著。
?、喔卟l(fā)通常指通過設(shè)計(jì)保證系統(tǒng)能夠同時(shí)并行處理很多請(qǐng)求。
來源:中國(guó)人大網(wǎng)
評(píng)論