Ramp Labs提出多智能体記憶共享新方案,Token消耗最高降低65%
BlockBeats 消息,4 月 11 日,AI 基礎設施公司 Ramp Labs 發布研究成果「Latent Briefing」,通過直接壓縮大型模型 KV 快取實現多智能體系間的高效記憶共享,在不損失準確率的前提下大幅降低 Token 消耗。
在主流多智能體架構中,編排者(Orchestrator)將任務拆解並反覆調用工作者(Worker)模型,隨著推理鏈路不斷延伸,Token 用量呈指數級膨脹。Latent Briefing 的核心思路是:借助注意力機制識別上下文中真正關鍵的部分,在表示層直接丟棄冗余信息,而非依賴速度慢的 LLM 摘要或穩定性差的 RAG 檢索。
在 LongBench v2 基準測試中,該方法表現亮眼:Worker 模型 Token 消耗降低 65%,中等長度文檔(32k 至 100k)的 Token 節省中位數達 49%,整體準確率較基線提升約 3 個百分點,而每次壓縮的額外耗時僅約 1.7 秒,較原始算法提速約 20 倍。
實驗以 Claude Sonnet 4 作為編排者、Qwen3-14B 作為工作者模型,覆蓋學術論文、法律文書、小說及政府報告等多類文檔場景。研究還發現,最優壓縮閾值因任務難度和文檔長度而異——難題適合激進壓縮以過濾投機性推理噪音,長文檔則更適合輕度壓縮以保留分散的關鍵信息。
猜你喜歡

等不來了的 V5,Uniswap 陷入創新困境

<1>穩定幣的流動性與外匯市場的溢出效應<1>

歷時兩年,香港首批穩定幣牌照終於落地:滙豐、渣打入圍

幫TAO漲了90%的人,今天又親手帶崩了價格

3分鐘了解如何在Bitget參與SpaceX IPO

如何在2026年競爭幣熱潮來臨前,利用閒置的USDT理財賺取15,000美元
想知道2026年是否會迎來競爭幣行情?獲取最新市場動態,了解如何將閒置的穩定幣轉化為最高達15,000 USDT的額外獎勵。

交易量不大也能獲得 Joker Returns 的收益嗎?WEEX Joker Returns 第二季新玩家常犯的 5 個錯誤
小額交易者能否在不進行巨額交易的情況下贏得 WEEX Joker Returns 2026?是的——只要你避免這5個代價高昂的錯誤。學習如何最大化抽牌次數,明智地使用百搭牌,並將小額存款轉化為 15,000 USDT 獎勵。

Alt賽季會在2026年到來嗎?5提示現貨未來100倍加密機會
競爭幣的季節會在2026年到來嗎?發現5個輪動階段,智能交易者關注的早期信號,以及未來100倍競爭幣機會可能出現的關鍵加密行業。

競爭幣2026賽季:盈利的4個階段(人群FOMO進入之前)
競爭幣2026季即將開始 — — 發現資本輪動的4個關鍵階段(從ETH到PEPE)以及如何在高峰前持倉。了解哪些代幣將引領每個階段,避免錯過集會。

2026年第一季度值得買入的五大加密貨幣:ChatGPT深度解析
了解2026年第一季度值得買入的五大加密貨幣,包括BTC、ETH、SOL、TAO和ONDO。了解影響下一輪市場走勢的價格展望、核心觀點及機構催化因素。

熊市了,加密 ETF 發行商也捲起來了

這位首富與他的前老闆發生了爭執

創造SBTI測試的女孩:談了場必死的賽博戀愛,一個失去電子丈夫的老鼠人

B.AI正式上線:構建AI Agent金融底層基座,驅動AGI時代商業底層邏輯

B.AI正式上線:破除A2A協作壁壘,以全景基建解鎖智能體經濟潛能

我們幫徐明星寫了一本《OK人生》

罕見的費率年化400%,TradeXYZ在向石油做多者撒錢?

a16z:永續合約正在改寫全球交易規則
等不來了的 V5,Uniswap 陷入創新困境
<1>穩定幣的流動性與外匯市場的溢出效應<1>
歷時兩年,香港首批穩定幣牌照終於落地:滙豐、渣打入圍
幫TAO漲了90%的人,今天又親手帶崩了價格
3分鐘了解如何在Bitget參與SpaceX IPO
如何在2026年競爭幣熱潮來臨前,利用閒置的USDT理財賺取15,000美元
想知道2026年是否會迎來競爭幣行情?獲取最新市場動態,了解如何將閒置的穩定幣轉化為最高達15,000 USDT的額外獎勵。
