新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)8月29日,在2024數(shù)博會(huì)上,中國科學(xué)院地球化學(xué)研究所與阿里云聯(lián)合發(fā)布國際首個(gè)“月球科學(xué)多模態(tài)專業(yè)大模型”(簡稱“月球?qū)I(yè)大模型”)。該大模型以視覺、多模態(tài)及自然語言等通義系列模型為基模,結(jié)合RAG檢索增強(qiáng)等技術(shù),目前在月球撞擊坑年代和形態(tài)判別上,月球?qū)I(yè)大模型的準(zhǔn)確率已達(dá)到80%以上。


中國科學(xué)院院士、中國月球探測工程首任首席科學(xué)家歐陽自遠(yuǎn)表示,隨著人類深空探測活動(dòng)的快速推進(jìn),探測數(shù)據(jù)呈井噴式增長??茖W(xué)大數(shù)據(jù)已然成為推動(dòng)科技創(chuàng)新的強(qiáng)大引擎。目前在數(shù)據(jù)管理方面,我國已經(jīng)取得先發(fā)優(yōu)勢。在數(shù)據(jù)應(yīng)用方面,我國必須充分發(fā)揮現(xiàn)有的人工智能技術(shù)優(yōu)勢,月球?qū)I(yè)大模型將大大加速海量數(shù)據(jù)的處理,幫助科研工作者挖掘新的科學(xué)發(fā)現(xiàn)。


據(jù)介紹,目前月球?qū)I(yè)大模型的最佳落地場景是月球撞擊坑識(shí)別。人類對月球地質(zhì)演化的研究除了探測返回的樣品,主要依靠撞擊坑識(shí)別等月球地質(zhì)對象的研究。撞擊坑的大小、深淺、形狀等特征,是研究月球地質(zhì)演化的重要依據(jù)。據(jù)統(tǒng)計(jì),目前月球上直徑一公里以上的月球撞擊坑數(shù)量已超100萬個(gè),直徑一公里以下的撞擊坑數(shù)量至今無法確定。如果完全依賴人工,完成所有月球撞擊坑的識(shí)別是“幾乎無法實(shí)現(xiàn)的”。


月球?qū)I(yè)大模型于阿里云百煉專屬版進(jìn)行微調(diào)及訓(xùn)練,科研工作者只需輸入月球撞擊坑圖像和相關(guān)問題,月球?qū)I(yè)大模型即可調(diào)用通義視覺、多模態(tài)模型,從17種多模態(tài)數(shù)據(jù)中(包括光譜、高程、重力等數(shù)據(jù))判定該圖像對應(yīng)的模態(tài)類型;通過檢索知識(shí)庫、調(diào)用通義語言模型,月球?qū)I(yè)大模型可回答該撞擊坑的形態(tài)、大小、年代等相關(guān)問題,并給出推理過程。


中國科學(xué)院地化所研究員劉建忠介紹,在月球撞擊坑識(shí)別上,月球?qū)I(yè)大模型的準(zhǔn)確率已達(dá)到80%以上。“通過對海量數(shù)據(jù)的準(zhǔn)確把握,大模型不僅可以對撞擊坑進(jìn)行分類,還可以解決一些目前仍未解決的科學(xué)問題?!?/p>


接下來,月球?qū)I(yè)大模型將嵌入“數(shù)字月球云平臺(tái)”,推動(dòng)“月球云平臺(tái)”智慧化升級?!皵?shù)字月球云平臺(tái)”由中國科學(xué)院地化所牽頭建設(shè)完成,是國際上月球探測數(shù)據(jù)最全,集科學(xué)研究、工程應(yīng)用以及科普教育為一體的云平臺(tái),它將與FAST等大科學(xué)裝置一同成為科研基礎(chǔ)設(shè)施的重要組成部分,助力我國月球與行星科研創(chuàng)新加速。


編輯 岳彩周

校對 柳寶慶