近日,由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的第21屆全國(guó)高性能計(jì)算學(xué)術(shù)大會(huì)在內(nèi)蒙古鄂爾多斯召開(kāi)。大會(huì)上,中國(guó)工程院院士、中國(guó)計(jì)算機(jī)學(xué)會(huì)理事長(zhǎng)孫凝暉在題為《AI(人工智能)賦能科學(xué)發(fā)現(xiàn)》報(bào)告中,分享了對(duì)這一備受關(guān)注話題的思考。
“第五范式”登上歷史舞臺(tái)
孫凝暉首先談到,“科學(xué)智能”是AI for Science,即“AI賦能科學(xué)發(fā)現(xiàn)”。這一研究范式的出現(xiàn),始于AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上的突破。2020年,AlphaFold在CASP14大賽中成功預(yù)測(cè)了2/3的目標(biāo)蛋白結(jié)構(gòu),開(kāi)啟了基于AI預(yù)測(cè)蛋白、核酸等分子結(jié)構(gòu)的歷史進(jìn)程。
2024年諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)授予AI基礎(chǔ)理論和科學(xué)發(fā)現(xiàn)領(lǐng)域的科學(xué)家,展現(xiàn)了對(duì)AI的“偏愛(ài)”。孫凝暉認(rèn)為,這標(biāo)志著國(guó)際學(xué)術(shù)界公認(rèn)AI技術(shù)已進(jìn)入科學(xué)領(lǐng)域,“代表著科研范式的重大改變”。
“融合大模型、大算力、大數(shù)據(jù)和大團(tuán)隊(duì)服務(wù)等特點(diǎn)的科學(xué)研究,對(duì)科學(xué)發(fā)現(xiàn)的作用就像大科學(xué)裝置一樣,是一個(gè)新范式。”孫凝暉說(shuō),新范式的形成,除了“大模型、大算力、大數(shù)據(jù)”外,還離不開(kāi)物理、化學(xué)、生物、AI等各領(lǐng)域科學(xué)家和工程師團(tuán)隊(duì)的長(zhǎng)期工作,以及企業(yè)資金的支持。
孫凝暉表示,在“AI賦能科學(xué)發(fā)現(xiàn)”之前,現(xiàn)代科學(xué)活動(dòng)存在4種范式,即基于實(shí)驗(yàn)觀察的科學(xué)實(shí)驗(yàn)范式、依賴科學(xué)家的理論推演范式、借助計(jì)算設(shè)備的科學(xué)計(jì)算或數(shù)值模擬范式、基于實(shí)驗(yàn)和理論數(shù)據(jù)計(jì)算的科學(xué)數(shù)據(jù)范式。如今,“AI賦能科學(xué)發(fā)現(xiàn)”當(dāng)屬“第五范式”,正登上歷史舞臺(tái)。
幫助科學(xué)家從“增肌強(qiáng)體”到“賦予大腦”
AI如何賦能科學(xué)發(fā)現(xiàn)?孫凝暉提出,從信息化視角看,“AI賦能科學(xué)發(fā)現(xiàn)”的核心在于構(gòu)建觀測(cè)(Observe)、模擬(Orient)、猜想(Hypothesis)與實(shí)驗(yàn)(Verify)4個(gè)環(huán)節(jié),并將數(shù)據(jù)驅(qū)動(dòng)和智能算法驅(qū)動(dòng)引入這4個(gè)環(huán)節(jié),形成“OOHV全環(huán)的AI賦能”。
“在這4個(gè)環(huán)節(jié)中,信息技術(shù)總能發(fā)揮作用,讓知識(shí)獲取、分享、檢索、交換更方便,讓信息抽取更簡(jiǎn)單。”孫凝暉談到,推演模擬環(huán)節(jié)本質(zhì)上是“高性能計(jì)算+AI”,而機(jī)器學(xué)習(xí)、大模型能通過(guò)處理科學(xué)數(shù)據(jù)發(fā)現(xiàn)規(guī)律、驗(yàn)證猜想,此外,觀察和實(shí)驗(yàn)未來(lái)也可依靠具身智能。
從具體案例看,孫凝暉認(rèn)為,信息學(xué)科的主要任務(wù)是提供工具。他有一個(gè)形象的比喻:信息技術(shù)賦能科學(xué)的手段如同從“增強(qiáng)肌肉(算力)”到“提供營(yíng)養(yǎng)”(數(shù)據(jù)),如今正朝著“賦予大腦”(AI)的方向進(jìn)化。
“‘AI賦能科學(xué)發(fā)現(xiàn)’更大的作用是突破人類認(rèn)知極限,這也是科學(xué)研究的最高追求。”孫凝暉說(shuō),人類在第三范式和第四范式下都有許多突破認(rèn)知極限的工作,比如通過(guò)科學(xué)計(jì)算,我們既能做公里級(jí)精度的中短期天氣預(yù)報(bào),也能做全球尺度的氣候變化預(yù)測(cè);通過(guò)數(shù)據(jù)解析,人類得以從基因組層面認(rèn)識(shí)自己,利用天文望遠(yuǎn)鏡摸到黑洞的“脈搏”。如今,在“第五范式”下也有突破人類認(rèn)知極限的工作。
不過(guò),孫凝暉提醒,AI工具并不是萬(wàn)能的,科學(xué)發(fā)現(xiàn)依然離不開(kāi)高性能計(jì)算這一基礎(chǔ)手段。同時(shí),在解決實(shí)際科學(xué)問(wèn)題時(shí),如何對(duì)齊“AI賦能科學(xué)發(fā)現(xiàn)”共性工具的科學(xué)語(yǔ)義,將成為一個(gè)關(guān)鍵問(wèn)題。
嶄新的方法論和學(xué)術(shù)生態(tài)正在形成
孫凝暉剖析了“AI賦能科學(xué)發(fā)現(xiàn)”面臨的數(shù)據(jù)、模型和計(jì)算問(wèn)題。“科學(xué)數(shù)據(jù)大概來(lái)自4個(gè)方面,即理論數(shù)據(jù)、觀測(cè)數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)和知識(shí)數(shù)據(jù),‘AI賦能科學(xué)發(fā)現(xiàn)’數(shù)據(jù)集不僅需要長(zhǎng)期積累,還需要關(guān)注數(shù)據(jù)的AI-Ready化與成熟度。”孫凝暉表示。
在模型方面,孫凝暉提到,OpenAI將實(shí)現(xiàn)通用人工智能的路徑分為5個(gè)階段:對(duì)話者、推理者、代理者、創(chuàng)新者、組織者。這5個(gè)階段對(duì)應(yīng)的AI依次加入了數(shù)據(jù)驅(qū)動(dòng)、知識(shí)嵌入、物理約束、人機(jī)協(xié)同、群體智能的能力。目前,“AI賦能科學(xué)發(fā)現(xiàn)”的能級(jí)正處于“數(shù)據(jù)驅(qū)動(dòng)+知識(shí)嵌入+物理約束”的三輪驅(qū)動(dòng)階段。
在孫凝暉展示的能級(jí)圖中,AI進(jìn)階像“單車”到“高鐵”那樣循序漸進(jìn)。僅靠數(shù)據(jù)驅(qū)動(dòng)的AI仿佛“單輪車”,隨著知識(shí)嵌入,AI成了“自行車”;加入物理約束后,AI堪比“三輪摩托車”;而隨著人機(jī)協(xié)同、群體智能等更多“車輪”的加入,AI有望變成“跑車”“高鐵”,將大大加速人類科學(xué)發(fā)現(xiàn)的進(jìn)程。
在計(jì)算問(wèn)題上,孫凝暉提到,衡量計(jì)算有兩個(gè)關(guān)鍵維度,即精度和架構(gòu)。“AI賦能科學(xué)發(fā)現(xiàn)”不僅需要高精度計(jì)算,還需要能夠降低負(fù)載的融合架構(gòu)。他表示,未來(lái)智算的融合架構(gòu)是什么樣,成為計(jì)算機(jī)科學(xué)家需要思考的問(wèn)題。
孫凝暉展望說(shuō),隨著算力集群的堆疊、數(shù)據(jù)來(lái)源的多樣化、模型參數(shù)規(guī)模等的進(jìn)一步提升,未來(lái)算力將進(jìn)化成為Z級(jí)(每秒可進(jìn)行1021次浮點(diǎn)運(yùn)算)智能超算,數(shù)據(jù)方面將發(fā)展為由海量常識(shí)數(shù)據(jù)、高質(zhì)量理論數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)及增強(qiáng)數(shù)據(jù)來(lái)解決更復(fù)雜的問(wèn)題,模型方面將出現(xiàn)一個(gè)參數(shù)量超過(guò)千億的通用科學(xué)智能大模型。
孫凝暉認(rèn)為,隨著AI技術(shù)對(duì)科學(xué)研究范式的重構(gòu),新研究工具鏈涌現(xiàn),頂級(jí)期刊開(kāi)設(shè)專欄,全球頂尖機(jī)構(gòu)成立相關(guān)或?qū)iT研究單元,嶄新的“AI賦能科學(xué)發(fā)現(xiàn)”方法論和學(xué)術(shù)生態(tài)正在形成。
來(lái)源:《中國(guó)科學(xué)報(bào)》






資訊頻道