本站3月28日消息,騰訊云AI代碼助手最新宣布,正式搭載DeepSeek-V3-0324頂級模型。
無需配置,下載/更新AI代碼助手插件即可用,官方號稱開發效率能直接提升100倍。
DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型參數從初代V3的6710億小幅增至6850億,依然采用混合專家(MoE)架構,每個token激活約370億參數,在推理、編程、數學、中文處理等多個領域達到行業領先水平。
甚至最近討論火熱的“7米甘蔗過2米門”AI測試題也能自主發現隱藏解法,給出合理答案。
騰訊總結了DeepSeek-V3-0324的五大強項:
創新的訓練策略
-采用無輔助損失的負載均衡,避免傳統方法的性能損失
-多token預測訓練提升推理速度,FP8混合精度訓練顯著降低計算成本
-在超大規模模型上驗證FP8訓練的有效性,提高訓練效率
優化的MoE架構
-動態調整偏差項,防止路由崩潰,性能提升15%以上
-節點受限路由機制減少跨節點通信流量至1/3,結合FP8調度與RDMA優化,訓練效率提升40%
-支持128K超長上下文,可處理50頁PDF或完整代碼庫,多輪對話記憶更強
綜合能力大幅提升
-關鍵指標突破性進步,在各項權威基準測試中相較于初代V3,在關鍵指標上展現了突破性進步。
MMLU-Pro:75.9→81.2( 5.3)-多領域知識理解能力
GPQA:59.1→68.4( 9.3)-專業問答能力
AIME:39.6→59.4( 19.8)-數學競賽解題能力,進步最為顯著
LiveCodeBench:39.2→49.2( 10.0)-代碼生成與調試能力
-數學推理能力突出,AIME競賽正確率提升近20%,超越Grok3
-中文處理優勢,中長篇寫作邏輯更嚴密,聯網搜索報告更精準
頂尖的編程生成能力,代碼生成質量達到行業頂尖水平
-單一提示詞中,可精準生成800行無錯誤網頁代碼(含動態交互,視覺美觀)
-代碼可運行率92%,支持20 編程語言,前端開發效率提升80%
-在kcores-llm-arena評測超越Claude 3 Sonnet普通版
高效的推理與開發者體驗
-推理任務顯著提升,借鑒DeepSeek R1模型訓練技術,上線每秒20 token生成速度(M3 Ultra設備),響應比前代快40%
-智能補全、代碼糾錯、API兼容性檢測等功能大幅提升開發效率
-支持復雜邏輯問題(如"7米甘蔗過2米門"),自主發現隱藏解法
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。