logo

小米和MiniMax同時放大招,Agent定價戰正式開打

By: blockbeats|2026/03/20 13:00:03
0
分享
copy

3 月 18 日和 19 日,兩家中國公司先後發布了各自的 Agent 方向大模型。國內 AI 初創公司 MiniMax 推出 M2.7,小米旗下大模型團隊 MiMo 推出 V2-Pro。兩款模型在 Agent benchmark 上均進入全球第一梯隊,但它們的 API 輸出定價分別是 Claude Opus 4.6 的 1/21 和 1/8。

兩家同一周出牌,但手裡的牌完全不同。它們代表了兩條截然不同的技術路線,賭的是 Agent 時代的兩種未來。

同一場考試,1/17 的學費

先看最直觀的對比。

小米和MiniMax同時放大招,Agent定價戰正式開打

據 OpenRouter 和各公司官方定價頁數據,以 API 輸出價格(每百萬 tokens)計,MiniMax M2.7 是 1.2 美元,MiMo-V2-Pro 是 3 美元。作為參照,Claude Opus 4.6 的輸出價是 25 美元,GPT-5.2 是 14 美元,Claude Sonnet 4.6 是 15 美元。

價格差距是數量級的,但能力差距不是。在 SWE-bench Verified(當前衡量代碼工程能力最主流的 benchmark)上,MiMo-V2-Pro 拿到 78%,Sonnet 4.6 是 79.6%,差距不到兩個百分點。M2.7 的 SWE-Pro 成績為 56.22%,與 GPT-5.3-Codex 持平。在 VIBE-Pro(端到端項目交付能力)上,M2.7 拿到 55.6%,接近 Opus 4.6 的水平。

這張圖的重點不在於誰高誰低——各家的 benchmark 体系不完全對齊,直接比較要謹慎。重點在於那個「價格-性能剪刀差」:國產 Agent 模型已經擠進了同一個能力帶,但站在完全不同的價格區間裡。

萬億參數 vs 自我進化

價格只是表象。兩家公司拿出了兩套完全不同的底牌。

MiMo-V2-Pro 走的是「大力出奇蹟」路線。據小米官方公告,V2-Pro 擁有超過 1 萬億總參數,啟動參數 42B,支持 100 萬 tokens 的超長上下文。它的核心創新是 Hybrid Attention 混合注意力機制,將滑動窗口注意力(SWA)與全局注意力(GA)的比例調至 7:1——前代 V2-Flash 是 5:1。這套架構讓模型在處理長文檔、多工具並行調用的 Agent 場景時更穩定。在 PinchBench(Agent 工具調用能力評測)上,MiMo-V2-Pro 拿到 84%。

M2.7 走了一條完全不同的路。據 MiniMax 3 月 18 日發布的官方技術博客,M2.7 的參數量未公開,但它展示了一種「自迭代進化」機制:模型自主運行 100 輪以上的優化循環,包括分析失敗軌跡、規劃修改、修改自身代碼架構、跑評估、再循環,最終在內部評估集上實現了 30% 的性能提升。在 MLE Bench Lite(機器學習競賽難度評測)的 22 道高難度題中,M2.7 拿下 9 金 5 銀 1 銅,平均獎牌率 66.6%。

從五個維度看,兩條路線的鋒芒朝向完全不同:MiMo-V2-Pro 在上下文長度和代碼工程維度上明顯佔優,M2.7 則在辦公自動化和自迭代能力上拉開距離。據 MiniMax 同篇技術博客,M2.7 在 GDPval-AA(辦公文檔處理評測)上拿到 ELO 1495,居開源模型首位,在覆蓋 40 多個複雜技能的 MM-Claw 測試中保持了 97% 的技能遵循率。

五個月四版本

兩家公司不只技術路線不同,迭代節奏也完全不一樣。

據公開發布記錄,MiniMax 從 2025 年 10 月發布 M2 到 2026 年 3 月發布 M2.7,五個月內迭代了四個版本,平均每 49 天一個大版本。其中 M2.5 到 M2.7 的間隔只有約 30 天。

小米 MiMo 的節奏不同:2025 年 4 月發布 MiMo-7B(7B 參數的開源推理模型),同年 12 月發布 V2-Flash(309B 總參數),2026 年 3 月發布 V2-Pro(1T 總參數)。每一代之間的參數規模跨越更大,但版本間隔也更長。

MiniMax 選擇了小步快跑,每次迭代幅度不大但頻率極高,M2.7 的自迭代機制本身就是為「持續進化」設計的。小米選擇了蓄力一擊,每個版本都是參數規模和架構的大幅躍遷。

-- 價格

--

匿名 8 天,登頂 OpenRouter

除了技術路線,小米的發布策略也打破了行業慣例。

据 Reuters 報導,3 月 11 日,一个名為 Hunter Alpha 的匿名模型出現在全球最大 API 聚合平台 OpenRouter 上。沒有品牌背書,沒有發布會,沒有技術部落格。它的 API 定價極低,性能卻出人意料地強。

社區開始猜測它的來歷。據 Republic World 和多家科技媒體報導,最主流的猜測是 DeepSeek V4,因為 MiMo 團隊負責人羅福莉此前曾在 DeepSeek 從事研究工作。調用量迅速攀升,匿名期內總調用量突破 1 萬億 tokens,登頂 OpenRouter 週榜第一。

3 月 19 日凌晨,小米揭榜:Hunter Alpha 就是 MiMo-V2-Pro。據 Reuters 同篇報導,揭榜後小米港股一度漲幅達 5.8%。

這是國產大模型第一次在全球平台上以純盲測的方式證明自己。不靠品牌,不靠宣傳,用 8 天時間讓開發者用腳投票。

猜你喜歡

投籃姿勢已定。交易也是如此:CHZ、SportFi 和那扇不會等待的歐冠窗口

隨著歐洲冠軍聯賽(UCL)和全球足球周期的加速,SportFi 的敘事也在加速發展,CHZ 也因此獲得了勢頭。本文探討了 CHZ、粉絲代幣以及更廣泛的 SportFi 生態系統如何受到現實世界活動、市場敘事和資本流動的驅動——深入分析了為什麼 SportFi 正在成為加密貨幣領域最具活力的行業之一。

Lattice Capital 創始人:加密 VC,因為相信所以看見

“如果你相信這個行業未來還會增長 100 倍,而且競爭更少、估值更低,那現在正是投資的好時機。我們選擇的就是這條路。”

早報 | SpaceX 以 600 億美元收購 Cursor;Kalshi 與 Polymarket 推出永續合約交易;NeoCognition 完成 4000 萬美元融資

4 月 22 日市場重要事件一覽

國際貨幣基金組織 | 穩定幣與支付的未來:來自金融市場的證據

國際貨幣基金組織的深度報告揭示了穩定幣監管的影響:美國的"天才法案"引發了支付巨頭3000億美元的市場震盪,跨境支付受到的衝擊最大,行業格局面臨"去中介化"的重構。

ORDI BRC-20 大漲 +88%:比特幣 Layer 2 是否即將爆發?

ORDI 價格上漲 88% 反映 BRC-20 市場活躍,市值達到 1.04 億美元。 BRC-20 的漲勢顯示出投資者真實的參與,而非薄弱的訂單簿操縱。 比特幣本身的價格走勢推動了 BRC-20 的市場變化,增加了投資魅力。 Bitcoin Hyper 項目利用 Solana 虛擬機的集成,試圖解決比特幣的交易速度和費用問題。…

幣安一天內燒毀價值13.2億美元的BNB:價格突破650美元在望?

幣安於2026年4月15日進行第35次季度BNB燒毀,銷毀約214萬個BNB,價值13.2億美元。 BNB價格目前穩定在622美元上下,市場消化燒毀對供應量的影響。 此次燒毀由幣安自動燒毀機制完成,並包含由先鋒燒毀計劃所導致的4500個BNB。 幣安目前已經燒毀超過6200萬個BNB,超過最初兩億總供應的30%。 關鍵阻力位於645美元至651美元之間,這是月底目標的重要天花板。 WEEX Crypto News, 幣安燒毀影響BNB價格走勢 幣安於2026年4月15日完成其35次季度燒毀,銷毀了價值約13.2億美元的BNB,這是歷史上最大的一次去通脹事件之一。此舉使總共燒毀數量超過6200萬個BNB,占原始供應量的30%以上。這不僅減少市場上的BNB流通量,也可能推動價格突破650美元。 BNB目前在622美元左右交易,低於50日和200日移動均線,顯示中立至謹慎的趨勢。相對強弱指數(RSI)在47.39,表明市場仍需更多量能確認突破。突破的關鍵阻力是645美元至651美元區域,跌破581美元則可能進一步下探至540美元。 BNB價格能否在四月底前達到650美元? BNB目前在621至624美元區間盤整,未確認出現突破。其關鍵阻力位集中在645至651美元範圍內。另一方面,根據技術分析,若BNB再度獲得量能支持並突破50日移動均線,那麼價格有望向650至680美元區間前進。 然而,目前市場尚需進一步確認動能。如果未能重新站上581美元的關鍵支撐水平,則反彈可能只是短暫,不是趨勢扭轉。 Maxi Doge尋求早期優勢 在BNB測試關鍵阻力之際,投資者也將目光投向早期階段資產,其中之一是Maxi Doge。這是一種ERC-20的迷因代幣,以上漲1000倍為目標,吸引了積極投資者的關注。…

熱門幣種

最新加密貨幣要聞

閱讀更多