編者按:為展現(xiàn)智能科技動態(tài),科普中國前沿科技項目推出“人工智能”系列文章,一窺人工智能前沿進展,回應種種關切與好奇。讓我們共同探究,迎接智能時代。
?
現(xiàn)在“AI for Science(人工智能驅(qū)動的科學研究)”已成為全球人工智能新前沿。什么是AI for Science?是如何發(fā)揮作用的?有哪些關鍵問題?我們來一起探索一下。
近年來,人工智能(AI)技術發(fā)展迅猛。20世紀末,人工智能在手寫數(shù)字識別方面取得了較高的準確率,并在國際象棋中擊敗了人類。2017年,圍棋人工智能超過了人類職業(yè)頂尖水平。
過去五年間,人工智能在圖像生成、自動駕駛、聊天機器人、視頻生成、音樂生成等領域取得了重大突破。人工智能技術的發(fā)展達到了前所未有的高度。
AI機器人棋手和選手下棋
(圖片來源:南方日報)
自動駕駛(蘿卜快跑)
(圖片來源:新華網(wǎng))
當今世界,科學技術是第一生產(chǎn)力。除了上述領域之外,人們希望能夠使用人工智能來驅(qū)動科學研究,為科技發(fā)展提供幫助,這被稱為AI for Science(人工智能驅(qū)動的科學研究)。
科學研究是一個多方面的過程,一般包括假說的提出、實驗的設計、數(shù)據(jù)的收集與分析。AI for Science的目標是使用人工智能來增強和加速這其中的每一個階段,使科學研究變得更加高效。
AI for Science在科學研究中的作用
(圖片來源:參考文獻1)
早在20世紀50年代人工智能誕生初期,科學家們就試圖使用計算機來解決科學問題,這個時期的研究主要集中在數(shù)學和物理學領域,利用計算機進行數(shù)值模擬和復雜計算,這也推動了計算機技術的進步。
20世紀80年代,專家系統(tǒng)開始興起,專家系統(tǒng)內(nèi)含有特定領域的專家知識和經(jīng)驗,它可以使用這些知識和經(jīng)驗通過邏輯學進行推理與判斷,模擬人類專家去解決特定領域的問題。
隨著近20年來機器學習技術的成熟,人工智能不再局限于傳統(tǒng)的邏輯推斷,而是能夠從大量的數(shù)據(jù)之中挖掘出數(shù)據(jù)的內(nèi)在聯(lián)系,在數(shù)學、物理、化學、天文、生物等學科中取得了重要成果?,F(xiàn)在AI for Science已經(jīng)成為全球人工智能新前沿。
人工智能在各個領域的應用
(圖片來源:參考文獻1)
人類科學歷史的發(fā)展經(jīng)歷了四個階段,經(jīng)驗科學、理論科學、計算科學、數(shù)據(jù)科學。
在經(jīng)驗科學階段,科學發(fā)展依賴于對自然現(xiàn)象的觀察與總結(jié)。例如,16世紀哥白尼通過觀察行星運動提出了日心說。
在理論科學階段,人們不僅總結(jié)自然現(xiàn)象的規(guī)律,還探討其背后的科學理論,17世紀牛頓總結(jié)出的物體運動的三個基本定律是這一階段的代表之一。
20世紀,隨著計算機的發(fā)展,人們進入了計算科學階段,借助計算機的強大計算能力,人們可以根據(jù)物理定律進行建模和模擬,如流體運動仿真和氣象預測。
21世紀,大數(shù)據(jù)技術的興起推動了數(shù)據(jù)科學的發(fā)展,科學家通過處理與分析海量的實驗數(shù)據(jù),從中發(fā)現(xiàn)新的科學規(guī)律。
AI for Science是一個新興的科學研究手段,是這四個發(fā)展階段科學研究方法的有機結(jié)合。它使用已知的科學規(guī)律進行建模,同時又挖掘海量數(shù)據(jù)的規(guī)律,在計算機的強大算力的加持下,進行科學問題的研究。
人工智能(AI)作為計算機學科的一個新興分支,它在科研領域發(fā)揮的作用與傳統(tǒng)的計算機科學不同。計算機最早是為了輔助人類計算而發(fā)明的,它計算速度快、準確度高、可以自動化執(zhí)行,在科研領域產(chǎn)生了重要的影響。
但傳統(tǒng)計算機只是代替人類完成復雜繁瑣的計算,而人工智能更加追求“智能”,希望計算機能夠代替人類的智能,像人類一樣學習、推理與決策。
下面,我們通過一個例子來介紹 AI for Science 的具體應用。
最近,中國科學技術大學的研究人員開發(fā)了全球首個集閱讀文獻、設計實驗、自主優(yōu)化等功能于一體,覆蓋化學品開發(fā)全流程的機器化學家平臺,它被科研人員形象地稱為“機器化學家”。
“機器化學家”在做實驗
(圖片來源:中國科學技術大學)
在“高熵非貴金屬產(chǎn)氧催化劑”材料研究中,機器化學家展現(xiàn)出了AI for Science的極大潛力。為了尋找合適的材料,按照以往的方法,科研人員要從29種非貴金屬元素中選出5種進行超過55萬種配比組合,“試錯”研究可能需要1400年。而有了機器化學家的幫助,只需要幾周時間就可以完成。
機器化學家首先從文獻數(shù)據(jù)庫中閱讀1.6萬篇相關論文,總結(jié)規(guī)律然后挑選出可能滿足要求的材料組合,使用計算機進行模擬計算。它將模擬計算進一步挑選出的材料組合進行自動化實驗以驗證材料的真實性能。它可以根據(jù)預先設定好的流程利用自動化技術自動完成從材料合成到性能測試的全流程實驗,并對實驗數(shù)據(jù)進行處理與分析,最終挑選出合適的材料。
機器化學家的優(yōu)勢在于它將大數(shù)據(jù)與人工智能相結(jié)合,利用人工智能進行人類難以完成的海量文獻閱讀,并從中獲取經(jīng)驗。在獲取經(jīng)驗的基礎上,機器化學家自主提出可能的方案并進行實驗驗證,從而代替了先前需要大量人工的試錯過程,加速了科學研究的進展。
在AI for Science發(fā)展的過程中,它仍然面臨著以下幾個關鍵問題:數(shù)據(jù)、算法、算力、人才。
數(shù)據(jù)問題:為了讓人工智能能夠自主決策,科學家需要提供數(shù)據(jù)以供學習,如何獲取高質(zhì)量的數(shù)據(jù)已經(jīng)成為了提高人工智能能力的瓶頸。特別是在科研領域,科學家面臨的問題都是人類知識的邊界,人工智能所能利用的數(shù)據(jù)比其它領域更為稀少。
在機器化學家的研發(fā)中,為了獲得足夠的數(shù)據(jù),研究人員用了3年時間收集教科書、論文、專利中“沉淀”的化學經(jīng)驗和知識。但這些數(shù)據(jù)來源繁雜,質(zhì)量參差不齊,仍然需要進一步豐富和優(yōu)化。
算法問題:在人工智能應用于具體的科學領域時,人工智能并不能從零開始依據(jù)數(shù)據(jù)學習到所有的規(guī)律,這就需要相應領域的專家依據(jù)當前領域已有的規(guī)律或經(jīng)驗為人工智能設計對應的算法。不僅需要AI for Science,有時也需要Science for AI,如何進行計算機科學與其它各領域的交叉融合也是一個重要的問題。
算力問題:人工智能模型的訓練以及應用需要大量的算力作為支撐,歸根到底人工智能仍然是計算機技術,計算機的性能會制約人工智能的能力。在機器化學家的訓練迭代和應用過程中,需要消耗大量算力。因此,為了讓人工智能取得廣泛應用,高性能計算機的研發(fā)是不可或缺的。
人才問題:在AI for Science中,人工智能始終是輔助科研人員進行研究的技術,它尚未發(fā)展至可以完全不依賴于人的控制自行解決所有問題的程度,因此我們需要更多的科研人員參與進來,推動AI for Science的發(fā)展。機器化學家正是在一批多學科背景的科研人員的通力合作、協(xié)同攻關下取得了成功。
期待在未來,隨著人工智能的發(fā)展,AI for Science可以在科學領域產(chǎn)出更多的成果,促進人類的科技進步。
參考文獻:
1.Wang, H., Fu, T., Du, Y. et al. Scientific discovery in the age of artificial intelligence. Nature 620, 47–60 (2023).