人工智慧代理可以提升以太坊安全嗎?OpenAI與Paradigm創建測試平台
關鍵要點
- OpenAI與加密投資公司Paradigm合作推出EVMbench,一款測試AI代理發現及修補智慧合約漏洞能力的工具。
- EVMbench專注於以太坊虛擬機(EVM)環境中檢測、修補及利用高風險漏洞。
- 每週以太坊網路上的智慧合約部署數創下新高,顯示市場對可靠合約驗證的需求。
- 測試平台使用的漏洞多從公開的審計競賽中取得,如Code4rena,並包含來自Stripe的Tempo區塊鏈的審計場景。
WEEX Crypto News, 2026-02-19 09:43:01
在迅速發展的區塊鏈技術領域中,安全性問題始終備受關注。作為全球第二大加密貨幣網絡,以太坊以其高度的智能合約應用而聞名。然而,伴隨智能合約部署不斷增加,如何確保其安全性成為業內關注的焦點。為應對這一挑戰,OpenAI和Paradigm攜手創建了EVMbench,一款專門測試AI代理發現在以太坊虛擬機(EVM)環境中智能合約高風險漏洞並加以修補和利用的工具。
OpenAI與Paradigm的合作
OpenAI是ChatGPT的開發商,而Paradigm則是一家專注於加密市場的投資公司。這次合作旨在結合AI技術與區塊鏈安全的需求,為智能合約的穩定運行提供保障。EVMbench正是這一合作的成果,它著重評估AI模型在檢測(Detect)、修補(Patch)和利用(Exploit)模式下的表現。
在“檢測”模式中,AI代理會對庫存進行審核並根據其識別出實際漏洞的準確性打分。“修補”模式則要求AI代理在不破壞合約預期功能的情況下消除漏洞。而在“利用”階段,代理則試圖在沙盒區塊鏈環境中完成端到端的攻擊行動,並通過確定性交易重演進行評分。
智能合約擴張需求
以太坊網絡以其龐大的去中心化金融協議及代幣發行功能而聞名,每周部署的智能合約數量屢創新高。根據Token Terminal的數據顯示,2025年11月,以太坊網絡上每周部署的智能合約數達到歷史新高的170萬件,而就在上周,又有超過66.95萬件合約被部署。這些數據顯示了市場對智慧合約驗證和更新的強烈需求。
EVMbench的技術詳解
EVMbench共採用了120個精選漏洞,來源於40次審計,其中大多數是來自於Code4rena等公開審計競賽。它還包含了Tempo,Stripe策劃的以高吞吐量、低成本穩定幣支付為重點的區塊鏈層-1項目的安全審計過程中的場景。這確保了測試基於經濟上有意義的真實世界場景,特別是隨著人工智慧驅動的穩定幣支付不斷擴展。
Stripe於十二月份發佈了Tempo的公開測試網,聲稱此項目是與Visa、Shopify和OpenAI等公司共同研發。其目標是確保測試建構於有經濟價值的現實代碼之中。
AI代理及EVMbench的性能
在EVMbench的“利用”模式中,OpenAI的GPT-5.3-Codex通過Codex CLI運行,成績達到72.2%,相較於六個月前發佈的GPT-5成績為31.9%。不過,在“檢測”和“修補”任務中,性能表現稍遜,研究者指出這是由於代理有時未能徹底審計或難以保持合約完整性。
儘管如此,OpenAI的研究者認為EVMbench並不能完全捕捉真實世界的安全複雜性。但他們強調,隨著模型成為對攻擊者和防禦者的重要工具,在市場經濟環境中衡量AI性能至關重要。
矛盾的技術發展觀
在2025年1月,OpenAI的創始人Sam Altman表示,他們公司有信心可建立如傳統所理解的人工通用智慧(AGI)。然而,以太坊的共同創始人Vitalik Buterin則主張AI系統應包含“軟暫停”功能,以便在出現警示信號時能暫時限制大規模工業級AI運行。
強調經濟上的關聯性和安全性需求,EVMbench的推出不僅是技術界的一次試驗,也是區塊鏈安全的進一步保障。隨著以太坊智能合約不斷擴張,保障其安全性能成為關鍵。未來,隨著AI技術的不斷成熟,我們預期EVMbench將在保障區塊鏈環境的安全性方面發揮更關鍵的角色。
常見問題
EVMbench如何促進以太坊智能合約的安全性?
EVMbench結合AI技術與現實代碼場景,對智能合約的安全性進行多層次測試,從而有效識別和修補漏洞,提高整體的安全性。
OpenAI和Paradigm的合作對行業有何影響?
這次合作展示了大數據智能技術與區塊鏈領域的交集,通過工具的突破,提高合約的安全水平,推動行業的進一步發展。
EVMbench是如何運行的?
EVMbench在三種模式——檢測、修補和利用——下評估AI的表現,涵蓋漏洞識別、功能保護及實戰演習等多個環節。
AI代理在智能合約安全中的角色如何?
AI代理有助於提高智能合約的自動化審計與漏洞修補水平,減少人為失誤,提升整體安全性。
這項技術的未來發展如何?
隨著AI技術的進步,像EVMbench這樣的工具將愈發重要,不僅能提升以太坊的安全性能,也將引領其他區塊鏈技術的安全升級。
猜你喜歡

如何在DeFi收益中平衡風險與回報?

湯姆·李的以太坊投資論點:為何那位曾準確預測上一輪行情的人如今正加倍押注Bitmine
湯姆·李正逐漸成為以太坊最具影響力的支持者之一。從Fundstrat到Bitmine,他的以太坊投資論點融合了質押收益、國庫積累以及長線網絡價值。這就是「Tom Lee 以太坊」為何成為加密貨幣領域最受關注的熱點之一。

納瓦爾親自登台:普通人與風險投資之間的歷史碰撞

a16z Crypto:9張圖表助您了解穩定幣的發展趨勢

駁楊海坡《加密貨幣終局》

吹風機能賺到 34,000 美元嗎?解讀預測市場的自反性悖論

6MV創始人:在2026年,加密投資的「標誌性轉折點」已經到來

Abraxas Capital 鑄造了 28.9 億美元的 USDT:是流動性提升,還是僅僅是更多穩定幣套利?
Abraxas Capital剛剛從 Tether 收到了28.9 億美元的新鑄造 USDT。這究竟是對加密貨幣市場的看漲流動性注入,還是穩定幣套利巨頭的日常操作?我們將分析這些數據及其對比特幣、競爭幣和去中心化金融(DeFi)可能產生的影響。

加密貨幣領域的一位風投表示,人工智慧太瘋狂了,他們非常保守

合約算法鐮刀進化史:永續合約十年,幕還未謝

今日比特幣ETF動態:21億美元資金流入是信號,表明機構對BTC需求強勁
比特幣ETF相關消息顯示,過去8個交易日累計淨流入達21億美元,創下近期最強勁的資金淨流入紀錄之一。最新比特幣ETF消息對BTC價格意味著什麼,以及8萬美元的突破關口是否即將到來。

被PayPal踢出局後,馬斯克計畫重返加密貨幣市場

麥可·塞勒:冬天過去了——他說得對嗎?5 個關鍵數據點(2026 年)
麥可·塞勒昨天在推特上發文: “冬天結束了。”這很空頭。這很大膽。這件事在加密貨幣領域引起了熱議。
但他說得對嗎?還是說這只是又一位 CEO 在自我吹噓?
讓我們來看看數據。讓我們保持中立。我們來看看冰是不是真的融化了。

WEEX Bubbles App 正式上線:一眼洞察加密市場走勢 -4.6
WEEX Bubbles 是一款獨立應用,透過直觀的氣泡可視化方式,幫助使用者快速理解複雜的加密市場行情。

Polygon聯合創始人Sandeep:在鏈橋鏈爆炸後寫道

網頁端圖表大升級:支持10+種專業K線樣式,WEEX助您多維洞察市場
為了給各位交易者提供更專業、更全面的市場分析工具,WEEX網頁端圖表已迎來重磅升級,全面支持高達14種專業K線/圖表樣式!

早報 | Aethir 承接 Axe Compute 2.6 億美元企業級合同;新火科技收購 Avenir Group 交易團隊;Polymarket 交易量被 Kalshi 反超

鮑威爾:我們有一個短暫的窗口期來應對通脹
美聯儲主席提名人鮑威爾強調不相信前瞻指引,但希望透過資產負債表和利率政策協同合作來降低通脹。 鮑威爾明確表示不會受任何政治壓力影響,堅持獨立制定貨幣政策。 近期市場動態顯示,有新的地址從幣安提取35,000 ETH並轉移至BitGo。 一名巨鯨增加40,000枚HYPE持幣量,價值約為163萬美元。 Kelp DAO攻擊者將50,700 ETH轉移至兩個新地址中。 WEEX Crypto News, 鮑威爾對抗通脹的策略 鮑威爾表示,美聯儲在現階段必須迅速行動來降低通脹。他拒絕遵循傳統的前瞻指引,而是強調資產負債表和利率政策的協同效果,以應對未來潛在的通脹率。這種方法強調實際操作的靈活性和政策獨立性,[Place Image: Screenshot of Powell’s statement].…
如何在DeFi收益中平衡風險與回報?
湯姆·李的以太坊投資論點:為何那位曾準確預測上一輪行情的人如今正加倍押注Bitmine
湯姆·李正逐漸成為以太坊最具影響力的支持者之一。從Fundstrat到Bitmine,他的以太坊投資論點融合了質押收益、國庫積累以及長線網絡價值。這就是「Tom Lee 以太坊」為何成為加密貨幣領域最受關注的熱點之一。




