日前,北京月之暗面科技有限公司(簡稱“月之暗面”)發(fā)布了開源大模型Kimi K2,引發(fā)全球關注。上線一周后,國際權威大模型排行榜LMArena宣布,這一模型接棒DeepSeek、登頂全球開源模型榜單,并在開閉源總榜上排名第五。
據(jù)了解,Kimi K2在多項基準性能測試中取得優(yōu)異表現(xiàn),展現(xiàn)出在自主編程、智能體工具調用和數(shù)學推理等方面的領先能力。良好的使用體驗也讓Kimi K2在海外技術社區(qū)上收獲了大量好評。英國《自然》雜志網(wǎng)站評價,中國人工智能模型Kimi K2發(fā)布后引發(fā)轟動,世界迎來“又一個DeepSeek時刻”。
Kimi K2在技術上有哪些亮點?Kimi K2項目組成員詹皓冰稱,“一方面,Kimi K2的前端編程能力很強,在3D、游戲、動畫制作等場景上,用簡單的指令和Kimi K2交互,就能得到很驚艷的效果。另一方面,智能體(Agent)的工具調動能力也讓模型整體上有了很大提升!
在文風上Kimi K2也更具有細節(jié)性和感情,就像生活中的“小伙伴”。當記者輸入“月亮的背面是怎樣的?”其中一些回復令人感動!叭祟愔詧(zhí)意要去看一眼月亮的背面,不只是為了把地圖填得更滿,更是對自我的突破和對新知的不斷探索!备ㄈ诵浴⒏訉嵱、更加強大,也是Kimi K2登頂全球榜單的優(yōu)勢所在。
據(jù)悉,Kimi K2參數(shù)總規(guī)模達到萬億級別,但激活參數(shù)只有32B。這意味著,Kimi K2能以更低的成本開展更加復雜的工作。對此,Kimi研究員杜羽倫稱,“我們提出了一些非常創(chuàng)新的方法,在有限的數(shù)據(jù)里面,讓模型學到更多的智能。同時,我們把Kimi K2權重和技術方案都開源了,希望通過開放共享推動全球相關技術發(fā)展。我們也真誠地認為,開源社區(qū)也會反哺給我們更多觀點,讓我們后續(xù)迭代模型變得更強!
值得一提的是,Kimi K2目前已接入OpenRouter、Cline、Visual Studio Code等國際主流開發(fā)平臺。Kimi團隊成員劉少偉分享稱,Kimi K2繼承了DeepSeek-V3的架構,并在后者基礎上進行增加專家數(shù)量、減少注意力頭數(shù)量等調整,最終實現(xiàn)了較強的性能。這也顯示出,中國的開源模型已經(jīng)形成良好生態(tài),在互相借鑒中持續(xù)進步。
記者了解到,月之暗面成立于2023年4月,總部位于海淀區(qū)知春路。公司現(xiàn)有員工300余人,超一半為90后。創(chuàng)始人楊植麟本科畢業(yè)于清華大學,是國內頂尖的AI研究者,被譽為“中國大模型90后第一人”。2024年,月之暗面因推出了具備長文本分析和AI搜索功能的Kimi模型而迅速走紅,吸引大量用戶關注。(記者 孟紫薇)

關注精彩內容