數(shù)智時代下,AI是最重要的通用技術之一,具有溢出帶動性很強的“頭雁”效應。其進入制造、電力、農(nóng)業(yè)等領域,不僅能帶動產(chǎn)業(yè)提質增效,還能創(chuàng)造顯著的經(jīng)濟和社會效益。
而在科研領域,借AI之力推動產(chǎn)學研用創(chuàng)新的例子也不勝枚舉。比如,目前AI就被廣泛應用于科學計算領域,這大幅提升了科學家們的工作效率。但不為人知的是,科學計算的基礎軟件對于AI的兼容性問題十分突出,一度讓深圳灣實驗室副研究員楊奕苦惱不已。畢竟,這些科學計算軟件最初設計的時候并非為AI而生。
(資料圖)
如何讓先進的AI技術、AI框架融入科研院所?從深圳灣實驗室與昇思MindSpore開源社區(qū)攜手,推動科研實現(xiàn)“從0到90”跨越式進步的案例中,你或許能得到答案。
缺人手、缺軟件、缺平臺......產(chǎn)學研發(fā)展面臨時代挑戰(zhàn)
楊奕于2019年正式回國并加入深圳灣實驗室,負責分子模擬領域的研究工作。團隊希望將AI算法應用到分子模擬領域。誰料,缺軟件、缺人手......各種挑戰(zhàn)接踵而至。
就拿“缺人”來說。“我們的課題組,最開始只有兩人,后來逐漸發(fā)展,也不過五六個人。大家集中干這一件事情,雖然寫了一些核心代碼,但單純靠一個課題組實現(xiàn)一個完整的科學計算套件的難度太大。”楊奕表示。
不僅如此,在人工智能框架和分子模擬軟件的相互兼容環(huán)節(jié),也讓實驗團隊眾人犯了難。
“當下比較流行的分子動力學模擬軟件,歷史都比較悠久,而且大部分是使用C/C++和Fortran等編譯型語言來編程,這些軟件想兼容目前主流的AI框架是非常困難的。”
據(jù)楊奕說,近些年,AI的發(fā)展非常迅速,也開始往科學計算領域大量滲透。然而,隨著研究的逐步深入,他發(fā)現(xiàn),分子模擬研究中常用的軟件,如AMBER、GROMACS、LAMMPS等存在設計思想老舊的問題,最初沒有考慮到與AI框架兼容結合的問題,因而它們很難匹配市面上如MindSpore、TensorFlow、PyTorch、JAX等最新的AI框架,這也導致AI算法難以真正地應用到分子模擬實驗中。
如何才能解決兼容性問題,讓AI真正為科研賦能?楊奕和他所在的團隊想,“既然傳統(tǒng)的分子模擬軟件難以兼容AI框架,那么我們有沒有可能打造一套使人工智能框架與分子模擬無縫結合的系統(tǒng)?那將會是一件非常有前景的事情。”
與華為攜手“搭橋”,推動科研實現(xiàn)跨越式進步
轉折點發(fā)生在2019年末。據(jù)楊奕回憶,在當年的華為開發(fā)者大會上,他第一次接觸到了人工智能框架——昇思MindSpore,一下子就被其強大的能力所吸引:不但設計理念先進,還非常適用于科學計算,完全可以用它開發(fā)一款國產(chǎn)分子模擬軟件。此外,基于昇騰AI基礎軟硬件平臺開發(fā)出來的軟件可以與硬件直接協(xié)同,組成一套完整的科學計算軟硬件平臺。“如果引入科研,一定可以很好地解決我們的一些痛點問題。”他說。
略作思忖,他與華為相關技術人員取得了聯(lián)系,希望能合作開發(fā)一款基于MindSpore的“智能化”分子模擬軟件。初期,雙方主要完成的是“適配”的工作——“昇思作為一個人工智能框架,起初并不是為解決科學計算而設計的,很多我們需要的功能昇思都還沒有開發(fā)。但當我們向華為提出‘能否添加適用于科學計算的算子等相關功能’的訴求時,他們很爽快地答應了。”據(jù)楊奕說,隨著后續(xù)合作的深入推進,雙方合作越來越緊密,2020年至今,雙方聯(lián)合開發(fā)分子模擬軟件的工作,99%以上的功能都被實現(xiàn)。
更重要的是,作為一款全自主研發(fā)的“智能化”分子模擬軟件,它的落地,標志著我國真正走在了全球分子模擬研究領域的前列。“西方國家在分子模擬軟件技術中積累的時間很長,我們中國人自己開發(fā)的軟件幾乎無人問津。但如今,我們有了‘彎道超車’的機會。”
楊奕說,華為、深圳灣實驗室、北京大學、昌平實驗室共同發(fā)起了MindSporeSPONGE科學計算項目,取得的成果包括多個分子模擬相關的軟件,比如名為“Aichemist”的人工智能分子模型通用架構,以及AI原生分子動力學模擬軟件MindSPONGE。開發(fā)者可以一邊在MindSpore中執(zhí)行訓練,一邊在MindSporeSPONGE中進行分子動力學模擬,從而實現(xiàn)AI算法與分子模擬的無縫結合;MindSporeSPONGE項目還為分子科學提供了一套完整的程序框架和工具庫,為AI在分子科學中的應用鋪平了技術上的道路。
“如果只是靠我們,完全無法實現(xiàn)這么大規(guī)模的工程性項目。可以說,我們不僅僅實現(xiàn)了從0到1,還一次性做到了從0到90。昇思MindSpore幫我們攻克了科研中最大的難關。”
楊奕還說,項目開始不久之后北京大學、昌平實驗室的科研團隊也加入進來,大家一起基于MindSpore開發(fā)和完善針對分子科學的各種科學計算程序,推進軟件和昇騰硬件的適配工作,為打造一套基于人工智能的分子科學計算軟硬件平臺共同努力。
“像這樣的跨界合作,在以往的學術圈、科研圈是非常少見的。我希望未來學界和科技企業(yè)能多多聯(lián)合,將先進的AI技術、算法框架引入更多科研院所,賦能產(chǎn)學研用。”他表示。
公開資料顯示,作為開源的新一代全場景AI框架,昇思MindSpore生態(tài)得到了快速發(fā)展,已成為國內最具創(chuàng)新活力的AI開源社區(qū)。
開設網(wǎng)紅“暑期班”,架起AI人才培養(yǎng)橋梁
技術為根,人才為本。推動產(chǎn)業(yè)繁榮的同時,人才培養(yǎng)也不能落下。
據(jù)楊奕介紹,從三年前開始,昇思社區(qū)聯(lián)合深圳灣實驗室和北京大學等多家合作單位共同開設“MindSpore SPONGE暑期學校”,邀請全國高校和研究所的研究生和科研人員,來到線下以及線上參與基于人工智能的分子模擬課程學習,親眼見證AI框架及大模型如何賦能科學計算,還有機會直接動手實操。
以今年舉辦的暑期學校為例,據(jù)統(tǒng)計,線上線下共有近千人參與。“很多學生在學習后,也希望在這分子科學方面有些建樹,或者用AI在自己的科學研究領域上有一些突破。”
楊奕說,“我們的暑期學校,可以說是毫無保留地向學生展示了我們最新的成果。線下課程結束后,我們還會把相關的資料、文件公開分享到網(wǎng)站上,供感興趣的同學查閱。就目前來看,這樣主題的課程在國內是很少見的,其公開度、透明度也超乎了想象。”
而這樣做的目的,據(jù)他表示,是希望有更多高校人才借此了解昇思,開拓視野;更重要的是,“我們希望能夠為中國人工智能和科學計算相關領域培養(yǎng)一些真正的人才,成為科技創(chuàng)新的帶頭人,未來改善我國科研領域中‘拿來主義’的現(xiàn)象。”楊奕指出。
在昇思MindSpore開源社區(qū)開放管理、系統(tǒng)化培訓之下,截至目前,昇思開源版本下載量超過551萬,增速第一;昇思MindSpore開發(fā)者已遍及全球,生態(tài)貢獻者超過2.1萬人;共搭建有超過500個模型,包括東方.翼風、MEGA-Protein等;支持900余篇頂會論文發(fā)表;325所高校開設了昇思課程;40多家科研院所基于昇思進行原生AI創(chuàng)新研究;服務超過5500個行業(yè)企業(yè),覆蓋金融、醫(yī)療、制造、數(shù)字政府等領域。(許雋)