国产欧美精品一区二区三区_国产黄色电影_久久极品_欧美日韩专区_成人国产免费视频_一级片大片

幣圈網

14.9萬元!滿血流暢運行DeepSeek一體機抱回家!清華90后出品

滿血DeepSeek一體機,價格竟然被打到10萬元級別了!

而且還不是量化版本,正是那個671B參數、最高質量的FP8原版。

或許有小伙伴要問了,那跑DeepSeek-R1/V3的速度,能跟官方一較高下嗎?

可以的,甚至是更快的那種。例如我們提個問題,來感受一下這個feel:

一個漢字具有左右結構,左邊是木,右邊是乞。這個字是什么?只需回答這個字即可。

不僅答案精準,一體機的速度也是肉眼可見地比DeepSeek官網快上一些,粗略估計是已經接近了22 tokens/s。

那么這個一體機到底是什么來頭?

不賣關子,它就是由北京行云集成電路最新推出的產品——褐蟻HY90,具體價格定到了14.9萬元。

而且除了產品,這家公司本身也是有不少的“標簽”在身上的,其中最為吸睛或許當屬CEO了:

季宇,清華90后博士、前華為“天才少年”、計算機學會CCF優博獎獲得者。

那么褐蟻HY90具體執行起更多任務時,又會是什么樣的效果?

來,更多維度的一波實測走起。

我們先在褐蟻HY90部署DeepSeek-R1,來測試一下它的推理能力。

有請AIME 2025的數學題:

Find the sum of all integer bases b>9 for which 17b is a divisor of 97b.

從內容生成的速度上來看,褐蟻HY90面對數學推理問題,依舊是可以保持接近20 tokens/s。

并且最終給到的答案也是精準無誤:70。

再來一道新版類似“9.9和9.11哪個大”、“Strawberry里面有幾個‘r’”,極度迷惑一眾AI的難題:

讓7米長的甘蔗通過2米高1米寬的門。


△左:一體機;右:DeepSeek官網

速度依舊在線,并且這個問題已經是難不倒DeepSeek,給出的答案也是正解。

而除了DeepSeek之外,我們還在褐蟻HY90上體驗了一把類似Deep Research的功能:

由此可見,無論是什么類型的題目,褐蟻HY90都能以相對較快的速度絲滑處理。

不過有一說一,以往的一體機,即便是搭載Q4量化版本,成本動輒就要達到200萬元。

而褐蟻HY90在搭載滿血、未量化的DeepSeek情況下,不僅能夠保證速度,更是把價格打掉了一個數量級。

因此,接下來的一個問題便是:

如何煉成的?

在我們聊“如何實現”之前,且需了解一下“什么在阻礙”。

首先,大家提到一體機,第一反應大概率就是GPU,而它本身就或許構成了短板。

因為傳統GPU方案因顯存容量限制,例如671GB需求需多張A100顯卡,成本已經超過了百萬的級別。

而CPU方案則受限于內存帶寬,因為大模型推理需要頻繁加載參數(如671B參數的FP8精度模型占用約671GB內存)。

如果內存帶寬不足,就會導致計算單元(CPU 核心)長時間等待數據,形成“內存墻”(Memory Wall),嚴重影響推理速度。

針對上述的短板,行云的褐蟻一體機采用雙路AMD EPYC 9005系列CPU,通過1TB/s的高內存帶寬滿足基礎推理需求,同時搭配一張中高端消費級GPU作為算力補充。

這種異構計算架構通過軟件協同優化,既解決了純CPU方案在部分推理階段的算力不足問題,又顯著降低了成本,將硬件投入壓縮至10萬元以內。

除此之外,行云自主研發的推理引擎框架通過算法優化和任務調度,同樣對token生成速率起到了顯著的提升作用。

在FP8精度下,Decode階段速度穩定在20TPS以上,且受上下文長度影響較小(128K上下文仍保持15TPS);Prefill階段在16K上下文內首字延遲控制在80秒以內。

這種高效推理能力尤其適合需要連續生成大量token的場景(如AI Agent),大幅縮短任務響應時間。

不僅如此,團隊還針對大模型運行需求,精準平衡了計算能力與內存帶寬,支持滿血FP8精度的R1/V3模型,并預留擴展能力,未來可支持1.5T參數量的模型。

通過參數壓縮技術(如INT4量化),進一步將Decode速度提升至28TPS(1K上下文),滿足不同場景對速度與精度的靈活需求。

據了解,團隊后續還將對MoE類的模型提供較好的支持。

褐蟻一體機的出現,可以說是改寫了行業的格局——

此前運行滿血671B模型需百萬級設備,而同類低配方案(如32B/70B模型)仍需20-40萬元。

行云通過技術整合,將最高質量的模型體驗直接帶入10萬元價位,為中小團隊提供了低門檻、高擴展性的AI部署方案。

這一技術突破不僅實現了“高性能 低成本”的平衡,更推動了大模型在智能客服、數據分析等場景的普惠應用。

最后,正如我們剛才提到的,行云除了產品本身之外,創始團隊同樣也有不少的亮點。

首先就是創始人兼CEO季宇,他本科就讀于清華大學物理系,后轉向計算機體系結構方向,獲得清華大學計算機體系結構博士學位。

在學術研究方面,他曾作為共同第一作者在頂級期刊《自然》(Nature)上發表計算機體系結構相關論文,并榮獲中國計算機學會(CCF)優秀博士學位論文獎(CCF優博獎)。


△行云集成電路創始人兼CEO,季宇

在2023年8月成立行云集成電路之前,季宇曾在華為海思昇騰芯片團隊,擔任昇騰AI芯片編譯器專家,負責多個昇騰編譯器項目,也曾入選“華為天才少年”。

在華為期間,正因長期專注于AI編譯器優化和處理器微架構等挑戰性問題,也讓他積累了豐富的AI芯片研發經驗。

除了季宇本人之外,CTO余洪敏擁有深厚的學術背景和豐富的行業經驗。

他本科畢業于華中科技大學,后在中國科學院半導體研究所獲得博士學位。

在職業履歷方面,余洪敏曾擔任百度昆侖芯、華為海思車載昇騰芯片等多款芯片的負責人,并曾在地平線擔任芯片研發總監。

他長期領導和管理超過100人的研發團隊,精通芯片研發設計全流程,具備豐富的實戰經驗——成功主導10余款芯片的流片與量產,并多次推動先進工藝數據中心芯片的架構設計、工程實現及大規模商用部署。

值得一提的是,在去年11月份,行云集成電路還得到了一眾明星資本的投資,包括智譜AI、峰瑞資本、嘉御資本、春華資本、中科創星、同創偉業奇績創壇、水木清華校友基金等。

由此,從行云集成電路成立至今的發展來看,是有產品,有團隊,更有市場的那種了。

但更重要的一點是,這家剛成立兩年的公司,一舉實現了一體機圈子里類似的DeepSeek的“高性能 低成本”——

嗯,“中國初創”的含金量還在持續上升。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 国产熟人av一二三区 | 一区免费在线观看 | 国产亚洲精品一区二区 | 麻豆tv入口在线看 | a一级特黄日本大片 s色 | 国产亚洲精品成人久久网站 | 成人精品视频一区二区三区尤物 | 一区二区三区四区在线不卡高清 | 92精品国产自产在线观看48页 | 精品国产一区二区三区免费看 | 久久久高清 | 美女高潮无遮挡免费视频 | 成人免费视频在线观看 | 色偷偷久久一区二区三区 | 欧美最猛性xxxxx免费 | 亚洲日本va午夜在线影院 | 国产在线精品福利一区二区三区 | 久久久精品人妻一区亚美研究所 | 韩国美女人成网站在线看看 | 欧美va在线高清 | 亚洲综合精品 | 欧美激情综合色综合啪啪五月 | 毛片特级 | 国产亚洲影院 | 国产伦精品一区二区三区免.费 | 福利视频观看 | 狠狠色狠狠色综合 | s级毛片 | 全黄a免费一级毛片人人爱 全黄h全肉边做边吃奶视频 | 久久精品中文字幕有码日本 | 亚洲国产精品第一页 | 亚洲视频2020| 国产毛片毛多水多的特级毛片 | 国产一级高清视频在线 | 九九精品免视看国产成人 | 黄短视频在线观看免费版 | 久久精品人人爽人人爽快 | 伊人久久久精品区aaa片 | a毛片在线播放 | 亚洲国产果冻传媒av在线观看 | 成人精品免费网站 |