學子風采丨必贏官網(wǎng)博士生李金膛榮獲第二屆世界科學智能大賽一等獎

近日,上??茖W智能研究院與復(fù)旦大學聯(lián)合主辦、阿里云天池協(xié)辦的第二屆世界科學智能大賽圓滿落幕。必贏官網(wǎng)博士生李金膛在我校陳亮老師、陳武輝老師的指導(dǎo)下,憑借扎實的專業(yè)基礎(chǔ)和創(chuàng)新實踐能力,從24個國家和地區(qū)的1085個機構(gòu)的12687名選手中脫穎而出,獲得了大賽總決賽邏輯推理賽道的一等獎(此賽道唯一一個)。

李金膛(左一)于大賽頒獎典禮

李金膛于總決賽答辯現(xiàn)場

 

 

比賽介紹

第二屆世界科學智能大賽由上??茖W智能研究院與復(fù)旦大學聯(lián)合主辦,阿里云協(xié)辦,以科學智能為風向標,秉持AI賦能千行百業(yè)的理念,聚焦五大賽道科技和產(chǎn)業(yè)前沿的深入探索。指導(dǎo)機構(gòu)為上海市科學技術(shù)委員會、上海市發(fā)展和改革委員會、上海市經(jīng)濟和信息化委員會、上海市教育委員會。

作為科學智能(AI for Science)領(lǐng)域的全球前沿賽事,大賽不限國籍、地域、單位,面向全球人才進行選拔,共設(shè)立生命科學、地球科學、物質(zhì)科學、社會科學、邏輯推理等五大賽道。大賽共吸引了來自24個國家和地區(qū)的12687名選手參賽,20多位來自上海頂尖高中的高中生首次組團參賽,賽事具有極強的多元性和挑戰(zhàn)性。

本次賽事五大賽道中的邏輯推理賽道是唯一一個以大模型為主題的競賽賽道,該賽道主要考驗參賽選手通過解決復(fù)雜的邏輯推理題,測試大型語言模型的邏輯推理能力。賽題設(shè)置上,采用了多樣化的邏輯題,涵蓋了多種關(guān)系和推理規(guī)則,覆蓋了不同難度的邏輯推理任務(wù),強調(diào)了邏輯推理在AI領(lǐng)域的重要性。比賽的研究成果將有助于評估和改進模型的邏輯推理能力,對于開發(fā)更智能、更有效的人工智能系統(tǒng)具有重要意義。

大賽總決賽合影

大賽獲獎名單

 

 

 

 

獲獎成果介紹

學院參賽選手李金膛在導(dǎo)師的指導(dǎo)下,在比賽過程中設(shè)計并實現(xiàn)了《基于數(shù)據(jù)合成與模型微調(diào)的大模型邏輯推理能力增強》方案,旨在打破大模型隨機鸚鵡的桎梏,賦予大模型更強大的邏輯推理能力。

 

創(chuàng)新點:本方案基于通義千問模型,采用多階段的Easy-to-Hard數(shù)據(jù)合成方法,模擬人類學習的由簡單到困難的思路,逐階段構(gòu)造多樣化的訓(xùn)練數(shù)據(jù)。數(shù)據(jù)生成階段,訓(xùn)練數(shù)據(jù)的標簽,引入了“Chain-of-Thought”思維鏈模式,生成多樣化的推理路徑,逐步對齊推理Scaling Law。訓(xùn)練階段,采用了LoRA對通義千問32B模型在合成數(shù)據(jù)集上進行參數(shù)高效微調(diào)。推理階段,使用了4bit低精度量化,并結(jié)合vLLM框架進行推理加速,最終達到準確性、效率和顯存利用率的統(tǒng)一。

 

 

學生獲獎感想

首先,比賽的復(fù)雜性使我更加深入地理解了邏輯推理在大型語言模型中的應(yīng)用挑戰(zhàn),讓我清晰地認識到如何構(gòu)建有效的推理路徑,以及設(shè)計多樣化數(shù)據(jù)來引導(dǎo)模型準確理解邏輯關(guān)系的重要性。其次,通過在不同數(shù)據(jù)集上多次微調(diào)模型,我在模型訓(xùn)練與集成優(yōu)化方面積累了豐富的實踐經(jīng)驗,幫助我更好地理解模型在不同訓(xùn)練條件下的表現(xiàn)差異??傮w而言,這次比賽不僅顯著提升了我的專業(yè)技術(shù)能力,也使我更加深刻地認識到,邏輯推理是人工智能邁向更高認知能力的關(guān)鍵領(lǐng)域,仍有許多值得探索的空間。