ICML(International Conference on Machine Learning)是機器學習領域的頂級學術會議之一,由國際機器學習學會(IMLS)主辦,被中國計算機學會認定為A類會議。會議涵蓋了機器學習的各個前沿方向,包括但不限于深度學習、強化學習、自然語言處理、計算機視覺、貝葉斯方法及優化算法等。
近日,ICML 2025公布了本屆論文審稿結果,思必馳-上海交大聯合實驗室2篇論文被收錄。本次收錄的論文成果聚焦大語言模型可靠性、可解釋性前沿研究方向,針對復雜任務執行與工具幻覺應對、大模型內部模塊功能探測等關鍵技術取得重要突破,不僅增強了大模型在嚴肅場景下的可靠任務執行能力,還為產業級大模型的可解釋審計、推理加速與低成本定制部署提供了全新技術路徑。兩項成果共同助力思必馳“讓大模型更可靠、更可控、更高效”,以下為兩項成果介紹:
大模型與工具協作的可靠性
Reducing Tool Hallucination via Reliability Alignment
針對大語言模型(LLMs)與外部工具交互中出現的工具幻覺問題,提出“Relign” 可靠性對齊框架,通過定義工具幻覺類型并引入RelyToolBench基準集,強化了模型在工具選擇和使用上的可靠性,顯著降低大模型的工具幻覺率并減少無效調用次數,從而同步提升任務成功率并節省算力與接口成本。
論文簡介:大型語言模型(LLMs)的能力已從單純的語言生成擴展到與外部工具的交互,從而實現了自動化和現實世界的應用。然而,工具幻覺(tool hallucinations)——即模型選擇不恰當的工具或錯誤使用工具——帶來了重大挑戰,導致任務執行錯誤、計算成本增加以及系統可靠性降低。為系統性地解決這一問題,我們將工具幻覺定義并分類為兩種主要類型:工具選擇幻覺(tool selection hallucination)和工具使用幻覺(tool usage hallucination)。為評估和緩解這些問題,我們提出了RelyToolBench,該基準集整合了專門的測試案例和新穎的指標,用于評估考慮幻覺的任務成功率和效率。最后,我們提出了Relign,一個可靠性對齊框架,該框架將工具使用的動作空間擴展為包含猶豫性動作,允許LLMs推遲使用工具、尋求澄清或動態調整工具選擇。通過大量實驗,我們證明Relign 能顯著減少工具幻覺,提升任務可靠性,并提高LLM工具交互的效率。
大模型可解釋性與輕量化
Heads up! Large Language Models Can Perform Tasks Without Your Instruction via Selective Attention Head Masking
針對大語言模型內部模塊組合的功能探測問題,提出二元注意力頭掩碼功能分區方法,可快速識別執行特定任務所需的關鍵注意力通路,并支持解釋性、剪枝加速與小參數微調三合一,該成果助力思必馳在保持模型性能的同時大幅降低定制與部署成本。
論文簡介:大語言模型(LLM)由眾多Transformer模塊構成,雖然這些模型可以執行各種功能,但如何將這些模塊組合起來以展現各自獨特的內在功能仍然是一個懸而未決的問題。本文研究了LLM內部的模塊,并證明在推理過程中,僅通過屏蔽或保留特定的注意力頭,LLM便能展現出特定任務的功能,而無需明確的指令或修改模型參數。針對不同模型和任務的實驗表明,LLM天生編碼了“功能路徑”——這是一組結構化的、相互依賴的注意力頭群,它們對于執行特定任務至關重要。這些路徑不僅決定了模型的功能行為,還提高了參數效率,因為抑制路徑之外的注意力頭可以改善任務性能。
長期以來,思必馳深度參與國內外學術前沿研究,在ICASSP、INTERSPEECH、ACL、EMNLP、AAAI、ICML等頂級學術會議上屢獲佳績,持續產出高質量科研成果。思必馳-上海交大聯合實驗室憑借一系列高水平論文,彰顯了在人工智能語音語言關鍵技術領域的深度探索和重大突破,為行業的發展注入了強大動力。思必馳秉持科研與產業應用緊密結合的理念,未來也將持續探索科技成果的應用轉化。
作為專業的對話式人工智能平臺型企業,思必馳具有源頭技術創新和應用創新的能力,自2022年7月獲國家科技部批準建設“語言計算國家新一代人工智能開放創新平臺”以來,接連于2023-2024年獲批組建蘇州市、江蘇省、長三角三級創新聯合體,并于2025年攜手上海交通大學、蘇州大學,牽頭組建“江蘇省語言計算及應用重點實驗室”,成為國家人工智能戰略科技力量的重要組成部分。
思必馳承擔了包括國家重點研發計劃、國家發改委“互聯網+”重大工程和人工智能創新發展工程、國家工信部人工智能與實體經濟深度融合項目、長三角科技創新共同體聯合攻關計劃項目等十余項國家級、省部級項目,展現出卓越的科研實力與項目落地能力。
思必馳深耕語音語言領域,憑借自主研發的核心技術多次在國際研究機構評測中奪得冠軍;曾三度斬獲國內人工智能最高獎“吳文俊獎”,榮獲中國專利優秀獎,以及信通院車載智能語音交互系統最高級別認證等重要榮譽。技術創新能力備受全球矚目,被高盛全球人工智能報告列為關鍵參與者,也被Gartner評為東亞五大明星AI公司之一。
截至2024年年底,思必馳擁有近100項全球獨創技術,已授權知識產權1597件,其中已授權發明專利633項,參與了71項國家/行業/團體標準,獲得23項國家級的產品認證。近期,大模型人機對話技術創新與產業賦能發展提速,思必馳堅持自主的大模型技術路線,即“構建可靠性優先的1+N分布式智能體系統:1 個中樞大模型+ N 個垂域模型及全鏈路交互組件組成全功能系統”,以任務型交互為核心,結合智能硬件感知優勢,構建垂域大模型和中樞大模型系統,服務企業客戶。
-
機器學習
+關注
關注
66文章
8495瀏覽量
134181 -
思必馳
+關注
關注
4文章
328瀏覽量
15149 -
大模型
+關注
關注
2文章
3055瀏覽量
3874
原文標題:ICML2025|思必馳-上海交大聯合實驗室2篇論文被收錄
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論