月之暗面重返基模戰場：發布首個開源萬億模型，押注“模型即Agent”

熱點 2025年07月12日 21:20 3 admin

　　炒股就看金麒麟分析師研報，權威，專業，及時，全面，助您挖掘潛力主題機會！

　　藍鯨新聞7月12日訊（記者朱俊熹）時隔半年，“大模型六小龍”之一的月之暗面終于推出新一代基座模型Kimi K2。據官方介紹，Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務的MoE架構基礎模型，總參數達1萬億，激活參數為320億。

　　7月11日發布并同步開源的新模型包括兩個版本：基礎模型Kimi-K2-Base、更適合通用聊天和智能體任務的后訓練模型Kimi-K2-Instruct。在自主編程、工具調用和數學推理相關的能力評測中，Kimi K2均取得了較優的表現。以SWE-bench Verified、AIME 2025等評測集為例，Kimi-K2-Instruct的得分超過了同為開源模型的DeepSeek-V3、阿里Qwen3，逼近甚至能夠反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等領先閉源模型。

　　結合6月底開啟內測的新Agent“Kimi-Researcher”不難看出，月之暗面的思路正轉向“模型即Agent”。模型自身就集成了自主決策和執行任務的能力，能夠作為智能體解決復雜任務。

　　在官方釋出的用例中，用戶要求Kimi K2幫忙規劃參加Coldplay樂隊巡演的行程。該模型通過17次工具調用，涵蓋搜索、日歷、郵箱、航班、餐廳預訂等環節，制定出一份完整的機酒與旅游規劃，并形成可視化報告。

　　智能體能力正在成為國內外大模型廠商競相押注的進化方向。本周，馬斯克旗下的人工智能初創公司xAI發布新一代大模型Grok 4，包括單智能體、多智能體兩個版本，具備工具使用、實時搜索等功能。Anthropic在推出Claude 4系列模型時也強調，在編程、推理和Agent方面“樹立了全新標準”，能夠處理復雜且長時間運行的任務。

　　月之暗面在Kimi K2的技術博客里分享了對構建開放智能體智能的看法。其指出，預訓練是智能體智能的關鍵基礎，它讓模型擁有基本的知識、理解和推理能力，從而在后續的強化學習中更有效地學習。但“人類數據就像是有限的‘化石燃料’”，因此如何在預訓練階段提升對有限數據的利用效率，成為當前AI擴展的關鍵挑戰。

　　而在后訓練階段，大模型不再只依賴人類數據，開始從自己的行為和結果中獲得獎勵、進行自我優化，以實現超越人類能力的可能。

　　“Kimi K2正是在這些洞見之上鍛造而成的?！痹轮得姹硎?。其同時強調，Kimi K2是構建通用Agent能力的堅實基礎，但通用Agent還需要更高級的能力，比如思考和視覺理解，計劃未來為該模型加入這些能力。此外，長文本處理能力曾是Kimi的核心優勢，此次Kimi K2的上下文長度為128k，不及部分新發布的模型。

　　值得注意的是，Kimi K2是國內首個開源的萬億參數級別模型。此前雖有其他大模型廠商訓練出萬億參數模型，如騰訊混元Turbo、MiniMax abab 6.5等，但都采取了閉源路線。

　　在訓練Kimi K2這樣的萬億參數級別的大模型時，月之暗面采用了自主創新的Muon優化器。與傳統的Adam優化器相比，Muon在token利用效率上表現更優，能讓大模型學得更快、更有效率。同時為解決Muon在超大規模訓練時遇到的不穩定問題，團隊還提出了MuonClip這一穩定性增強技術，支撐Kimi K2順利完成15.5萬億tokens的預訓練，未出現訓練損失值的異常峰值。

　　自年初DeepSeek橫空出世以來，月之暗面雖然陸續釋出了一些技術或產品上的更新，但始終未能重拾外界對其的熱切期待，一度表現得頗為低調沉寂。而此次Kimi K2的發布，讓這家明星創企終于重回基模舞臺的聚光燈下，這場牌局仍未見定論。

標簽：模型

馬來西亞黃金期貨：下周或在3300 - 3350美元區間走高

歡迎使用Z-BlogPHP！

發表評論

月之暗面重返基模戰場：發布首個開源萬億模型，押注“模型即Agent”

馬來西亞黃金期貨：下周或在3300 - 3350美元區間走高

歡迎使用Z-BlogPHP！

標簽列表

熱門文章

友情鏈接

月之暗面重返基模戰場：發布首個開源萬億模型，押注“模型即Agent”

馬來西亞黃金期貨：下周或在3300 - 3350美元區間走高

歡迎使用Z-BlogPHP！

標簽列表

熱門文章

友情鏈接

月之暗面重返基模戰場：發布首個開源萬億模型，押注“模型即Agent”

歡迎使用Z-BlogPHP！