K2 Think 性能媲美頂級推理模型,規(guī)模大幅縮減
阿聯(lián)酋阿布扎比2025年9月11日 /美通社/ -- Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) 旗下基礎(chǔ)模型研究所與 G42 今日聯(lián)合宣佈,正式推出領(lǐng)先的開源高階人工智能推理系統(tǒng) K2 Think。
K2 Think 開創(chuàng)了構(gòu)建更智能、更高效人工智能的嶄新模式。該模型僅有 320 億個(gè)參數(shù),其性能表現(xiàn)卻超越了規(guī)模大 20 倍的旗艦級推理模型。這項(xiàng)在參數(shù)效率上的重大突破,使 K2 Think 成為高階推理領(lǐng)域的另一強(qiáng)大選擇,並重新定義了精簡架構(gòu)的無限可能。
K2 Think 建基於六大創(chuàng)新支柱,奠定了新一代推理模型的典範(fàn)。它採用「長思維鏈監(jiān)督式微調(diào)」以深化邏輯層次,繼而透過「可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)」提升處理複雜難題的準(zhǔn)繩度。其「代理規(guī)劃」功能協(xié)助模型在推理前有效分解複雜挑戰(zhàn),而「測試時(shí)擴(kuò)展技術(shù)」則進(jìn)一步增強(qiáng)其適應(yīng)能力。此外,K2 Think 即將登陸 Cerebras 的晶圓級推理優(yōu)化計(jì)算平臺,讓全球研究人員與創(chuàng)新者能以閃電般的速度,將推理性能推向新高峰。透過為 Cerebras 硬體優(yōu)化的「推測解碼」技術(shù),K2 Think 的吞吐量將達(dá)到前所未有的每秒 2000 token,成為現(xiàn)時(shí)全球最快、最高效的推理系統(tǒng)之一。
K2 Think 的性能位列業(yè)界頂尖,在 AIME '24/'25、HMMT '25 及 OMNI-Math-HARD 等多項(xiàng)數(shù)學(xué)基準(zhǔn)測試中,表現(xiàn)領(lǐng)先所有開源模型。
K2 Think 的面世不僅是一項(xiàng)技術(shù)成就,更是阿聯(lián)酋人工智能發(fā)展的重要里程碑。它充分體現(xiàn)了開放式創(chuàng)新與緊密的公私營合作,如何鞏固阿布扎比作為全球人工智能樞紐的領(lǐng)導(dǎo)地位,並證明未來 AI 推理的發(fā)展關(guān)鍵,不僅在於模型規(guī)模,更在於創(chuàng)意與協(xié)作。
MBZUAI 董事會主席兼人工智能及先進(jìn)技術(shù)委員會 (AIATC) 成員 Khaldoon Khalifa Al Mubarak 閣下表示:「K2 Think 樹立了全新的全球基準(zhǔn),彰顯 MBZUAI 基礎(chǔ)模型研究所計(jì)劃的超卓創(chuàng)見,為全球合作及尖端研究提供了快行通道。這亦印證了阿聯(lián)酋的承諾——致力構(gòu)建由本地機(jī)構(gòu)研發(fā)、並與世界共享的先進(jìn)系統(tǒng),最終推動具技術(shù)突破、實(shí)用且可擴(kuò)展的創(chuàng)新,為全球帶來深遠(yuǎn)的變革?!?/i>
MBZUAI 董事會成員、阿布扎比人工智能及先進(jìn)技術(shù)委員會成員兼 G42 集團(tuán)行政總裁 Peng Xiao 補(bǔ)充道:「K2 Think 已將 AI 推理的典範(fàn)從『越大越好』成功轉(zhuǎn)向『越聰明越好』。在阿聯(lián)酋創(chuàng)新生態(tài)的支持下,MBZUAI 正以開放、高效及功能強(qiáng)大的技術(shù),開拓 AI 技術(shù)的前沿。這次的成果證明了更小、更具資源效益的模型,其實(shí)力足以媲美最大型的推理系統(tǒng),標(biāo)誌著新一輪 AI 創(chuàng)新浪潮的來臨。」
有別於大多數(shù)僅發(fā)布權(quán)重的「開放式」AI 模型,K2 Think 實(shí)現(xiàn)全面開源,範(fàn)圍涵蓋訓(xùn)練數(shù)據(jù)、參數(shù)權(quán)重,以至部署和測試時(shí)優(yōu)化的軟件代碼。這種前所未有的透明度,讓全球研究社群能夠深入研究、重現(xiàn)並拓展模型學(xué)習(xí)推理的整個(gè)過程。
MBZUAI 校長兼大學(xué)教授 Eric Xing 教授表示:「由 MBZUAI 基礎(chǔ)模型研究所開發(fā)的 K2 Think,是全球 AI 研發(fā)社群的一大重要進(jìn)展。我們透過完全透明的框架提供這些先進(jìn)成果,正引領(lǐng)一個(gè)更具成本效益、可重現(xiàn)且負(fù)責(zé)任的 AI 新時(shí)代。對於一所僅成立五年的年輕學(xué)府而言,我們的全球研究人員、工程師及團(tuán)隊(duì)?wèi){藉巧思與開創(chuàng)精神推動科技發(fā)展,對此我們深感自豪?!?/i>
K2 Think 建基於阿聯(lián)酋一個(gè)持續(xù)壯大的開源模型系列,當(dāng)中包括全球最先進(jìn)的阿拉伯語大型語言模型 (LLM) Jais、印地語模型 NANDA 及哈薩克語模型 SHERKALA。它同時(shí)延續(xù)了 K2-65B 的開創(chuàng)性傳統(tǒng)——K2-65B 是全球首個(gè)於 2024 年發(fā)布、可全面重現(xiàn)的開源基礎(chǔ)模型。
K2 Think 現(xiàn)已在 https://www.k2think.ai/ 及 Hugging Face 平臺上提供。
關(guān)於 Mohamed bin Zayed University of Artificial Intelligence (MBZUAI)
MBZUAI 是阿布扎比的研究型大學(xué),也是第一所完全致力於透過人工智能,推動科學(xué)進(jìn)步的大學(xué)。大學(xué)透過世界一流的教育和跨學(xué)科研究,賦予下一代 AI 領(lǐng)袖能力,推動 AI 的創(chuàng)新和有影響力的科技應(yīng)用。2025 年,MBZUAI 首次推出其本科課程,即人工智能理學(xué)士 (Bachelor of Science in AI),此課程有兩個(gè)截然不同的範(fàn)疇:商業(yè) (Business) 和工程 (Engineering)。更多資訊,請瀏覽 www.mbzuai.ac.ae。
繁體中文知識庫正在建設(shè)中,請您選擇簡體中文或英文版查看。
Copyright © 2025 美通社版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載.
Cision 旗下公司.