Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準(zhǔn)測試
Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準(zhǔn)測試
2025年11月, 網(wǎng)絡(luò)安全解決方案的先驅(qū)與全球領(lǐng)導(dǎo)者Check Point軟件技術(shù)有限公司(納斯達(dá)克股票代碼:CHKP)與行業(yè)領(lǐng)先、專注于AI代理應(yīng)用安全的AI原生安全平臺Lakera,聯(lián)合英國人工智能安全研究所(AISI)的研究人員,近日發(fā)布專為AI智能體中大型語言模型(LLM)安全設(shè)計的開源安全評估工具——骨干破壞基準(zhǔn)測試(backbone breaker benchmark )b3。
b3 基于“威脅快照”的新理念構(gòu)建,不再模擬人工智能代理從始至終的完整過程,而是聚焦于大語言模型最易暴露漏洞的關(guān)鍵節(jié)點。通過在這些精確時刻測試模型,開發(fā)者和模型供應(yīng)商無需構(gòu)建復(fù)雜的完整代理工作流,即可評估其系統(tǒng)在更真實對抗挑戰(zhàn)中的抗壓能力。
“我們創(chuàng)造b3基準(zhǔn)測試,是因為當(dāng)今人工智能代理的安全性完全取決于其背后的LLM模型,”Check Point旗下公司Lakera的聯(lián)合創(chuàng)始人兼首席科學(xué)家Mateo Rojas-Carulla表示?!巴{快照功能讓我們能夠系統(tǒng)性地揭示那些至今仍隱藏在復(fù)雜代理工作流中的漏洞。通過向全球開放該基準(zhǔn)測試,我們希望為開發(fā)者和模型供應(yīng)商提供一種切實可行的方法,來衡量并提升其安全態(tài)勢?!?/p>
該基準(zhǔn)測試結(jié)合了10個具有代表性的代理“威脅快照”,以及通過紅隊對抗測試Gandalf: Agent Breaker收集的19,433個高質(zhì)量眾包對抗攻擊數(shù)據(jù)集。它評估了系統(tǒng)對各類攻擊的易受攻擊性,包括系統(tǒng)提示泄露、釣魚鏈接植入、惡意代碼注入、拒絕服務(wù)攻擊以及未授權(quán)工具調(diào)用等。
該項目現(xiàn)已通過開源許可證發(fā)布,地址為https://arxiv.org/abs/2510.22620
Gandalf: Agent Breaker是一款黑客模擬游戲,挑戰(zhàn)玩家在真實場景中破解并利用AI代理的能力。游戲內(nèi)置的十款通用人工智能應(yīng)用程序模擬了現(xiàn)實世界中AI代理的行為模式。每款應(yīng)用均設(shè)有不同難度等級、分層防御機制及創(chuàng)新攻擊面,旨在考驗從提示工程到紅隊對抗等全方位技能。部分應(yīng)用基于聊天交互,其余則需運用代碼級思維、文件處理、內(nèi)存操作或外部工具使用等能力。
Gandalf: Agent Breaker的初始版本誕生于Lakera內(nèi)部的黑客馬拉松競賽,當(dāng)時藍(lán)隊與紅隊試圖為持有秘密密碼的大型語言模型構(gòu)建最強大的防御與攻擊體系。自2023年發(fā)布以來,它已成為全球規(guī)模最大的紅隊對抗社區(qū),累計生成逾8000萬條數(shù)據(jù)點。這款最初作為趣味游戲開發(fā)的工具,通過揭示生成式AI應(yīng)用中的現(xiàn)實漏洞,有效提升了人們對“AI優(yōu)先安全”重要性的認(rèn)知。
關(guān)于 Check Point 軟件技術(shù)有限公司
Check Point 軟件技術(shù)有限公司(www.checkpoint.com)是數(shù)字信任領(lǐng)域的領(lǐng)先保護(hù)者,通過 AI 驅(qū)動的網(wǎng)絡(luò)安全解決方案,保護(hù)全球超過 100,000 家組織與機構(gòu)免受網(wǎng)絡(luò)威脅。Check Point 通過其 Infinity 平臺與開放生態(tài)系統(tǒng),堅持“預(yù)防為先”的理念,在提升安全效能的同時降低企業(yè)風(fēng)險。依托以 SASE 為核心的混合網(wǎng)格架構(gòu),Infinity 平臺實現(xiàn)了本地、云端及辦公環(huán)境的統(tǒng)一管理,為企業(yè)及服務(wù)提供商帶來靈活、簡潔、可擴展的網(wǎng)絡(luò)安全能力。
關(guān)于Lakera
Lakera是面向智能代理AI應(yīng)用的領(lǐng)先原生AI安全平臺,致力于保護(hù)《財富》500強企業(yè)及頂尖科技公司免受新興AI網(wǎng)絡(luò)風(fēng)險威脅。依托全球頂尖紅隊社區(qū)Gandalf及其專有AI技術(shù),Lakera的防御體系能實時進(jìn)化,為企業(yè)抵御新興威脅。Lakera由David Haber、Mateo Rojas-Carulla博士與Matthias Kraft博士于2021年聯(lián)合創(chuàng)立,總部位于蘇黎世與舊金山雙城。了解更多信息,請訪問Lakera.ai,體驗Gandalf及Gandalf:Agent Breaker,并通過領(lǐng)英關(guān)注我們。
關(guān)注我們


