北京2025年8月6日 /美通社/ -- 亞馬遜云科技宣布,Anthropic最新一代模型Claude Opus 4.1與Claude Sonnet 4,現(xiàn)已在Amazon Bedrock全面上線。這批新型雙模推理模型支持在即時響應與"深度思考"模式間動態(tài)切換,為編碼、高級推理及多步驟工作流樹立了全新行業(yè)標桿,能夠在復雜且長耗時的任務中保持穩(wěn)定性能,驅動AI Agents將耗時數(shù)小時的工作壓縮至分鐘級完成。
將Claude Opus 4.1和Claude Sonnet 4引入Amazon Bedrock,為客戶提供了Anthropic最先進模型的選擇,簡化了客戶借助企業(yè)級安全保障和負責任的AI管控機制,構建更優(yōu)質、更具變革性應用程序的流程。
評估方法說明:
1.使用pass@1指標,結合bash、編輯器工具對Opus 4.1、Opus 4和Sonnet 4進行測試。在10次試驗中取平均值,單次嘗試修補,測試時不進行額外計算,采用核采樣(nucleus sampling)方法,設置top_p值為0.95。
2.本文報告的所有分數(shù)均基于默認Agent框架("Terminus 1"),并在5次試驗中取平均值。
3.Claude在MMMLU上的得分,取自14種非英語語言得分的平均值。
4.Opus 4.1、Opus 4和Sonnet 4在AIME上的測試采用核采樣方法,設置top_p值為0.95。
全新的Claude 4模型從根本上改變了團隊處理復雜項目的方式。對于那些需要持續(xù)投入精力和深厚專業(yè)知識的大型企業(yè)而言,這一變革尤為顯著。Claude 4雙模推理模型支持客戶在即時響應與深度推演間靈活選擇,這些模型可徹底改變企業(yè)將AI應用于復雜任務和日常高容量業(yè)務操作的方式。兩款模型均旨在為跨數(shù)千個步驟的多步驟工作流,提供更強大、更自主的AI Agents支持。Claude Opus 4.1也是Anthropic迄今為止功能最強的模型,編程能力冠絕業(yè)界。
Claude Opus 4.1如同一位精明能干的協(xié)作伙伴,在Agentic搜索與研究、內容創(chuàng)作以及記憶和上下文管理方面表現(xiàn)出色,能夠綜合提煉深刻見解、產(chǎn)出高質量內容并實現(xiàn)高效總結。
Claude Opus 4.1可直接替代Opus 4,它在實際編碼和Agent任務中,展現(xiàn)出更出色的性能和精準度。Anthropic表示,Claude Opus 4.1是其迄今為止最智能的模型,且在編碼和Agent領域處于行業(yè)領先地位。該模型具備先進的編碼能力,能夠獨立規(guī)劃并執(zhí)行復雜的端到端開發(fā)任務,同時根據(jù)用戶風格進行調整,并始終保持高質量輸出。此外,該模型還改進了前端代碼生成功能,在有效處理復雜邏輯的同時,能輸出高質量的視覺效果。
另外,Opus 4.1具備出色的長期任務處理能力和復雜問題解決能力,是持續(xù)推理和長鏈行動中的理想虛擬協(xié)作伙伴。它還能提升AI Agents的性能,使其能夠以極高的準確度應對復雜的多步驟任務。
Claude Sonnet 4則以高效性著稱,將敏捷思維與實用智能完美融合,適用于各類項目。憑借速度與性能的平衡,Claude Sonnet 4可在各項任務間無縫切換,秉持務實態(tài)度,確保首次執(zhí)行即能圓滿完成。
Claude Sonnet 4在編碼和推理能力上,均超越了其前代產(chǎn)品Claude Sonnet 3.7,并在性能與成本優(yōu)化之間實現(xiàn)了平衡,非常適合處理大批量應用場景,成為大多數(shù)生產(chǎn)應用的理想之選。Claude Sonnet 4的應用范圍十分廣泛,既能為實時客戶支持Agent提供支持,也能處理代碼審查、漏洞修復等日常開發(fā)任務,還可作為特定任務的子Agent同時處理搜索、數(shù)據(jù)分析或內容合成等多項任務。旅游和酒店業(yè)客戶可以借助Claude Sonnet 4實時處理客戶請求,并以近乎實時的速度提供個性化回復。
這兩款模型均具備 "深度思考"功能,使Claude能夠在深度推理和行動執(zhí)行兩種模式間靈活切換。Claude可根據(jù)需要進行數(shù)據(jù)分析,并在工作過程中不斷提高準確性,從而更精準地預判并執(zhí)行后續(xù)步驟。
Anthropic公司增長與營收部門負責人Kate Jensen表示:"Claude Opus 4和Claude Sonnet 4將AI從一種工具,轉變?yōu)槊總€人、每個團隊的真正協(xié)作伙伴。我們的客戶將看到項目周期大幅縮短——在許多情況下,能從數(shù)周縮短至數(shù)小時。Claude 4系列模型在編碼、高級推理及多步驟工作流方面樹立了新標桿,同時能全面理解業(yè)務背景并輸出精準結果。其真正的突破在于,Claude承擔了大量繁重工作,讓團隊人才得以專注于戰(zhàn)略性工作。"
核心信息
新一代Claude模型標志著Agentic AI能力的重大飛躍,徹底改變了企業(yè)將AI應用于專業(yè)復雜任務和日常高容量運營的方式。Claude Opus 4.1和Claude Sonnet 4不再局限于內容生成,而是更像專業(yè)的虛擬協(xié)作伙伴,能夠在復雜任務中保持專注,留存相關上下文信息,無需提供持續(xù)指導即可提供完整的解決方案。
這一能力革新了企業(yè)應對挑戰(zhàn)的方式,從軟件開發(fā)到營銷策略制定均可適用。對于日常用戶而言,這意味著他們可以使用更懂自身需求的AI,且該AI能獨立承擔項目中更大比例的工作。
數(shù)據(jù)解讀:
據(jù)Anthropic公司稱,Claude Opus 4.1和Claude Sonnet 4預示著未來AI系統(tǒng),將在創(chuàng)意工作和知識型工作中成為能力日益強大的合作伙伴。例如,它們可在企業(yè)中承擔更多專業(yè)角色,如處理日常分析工作、跨部門協(xié)作,甚至在極少監(jiān)督的情況下管理完整的工作流程。
更多詳情,請參閱Amazon Bedrock上Anthropic的Claude產(chǎn)品頁面。