“DeepSeek比過去兩年多以來,全行業對于用戶的教育都要更加有效?!苯眨劶癉eepSeek帶來的變化,OPPO ColorOS系統設計總監陳希對第一財經感慨,一夜之間幾乎全民都知道了什么是大模型,對應用企業來說,這種普及是關鍵的機會點。
DeepSeek引發的效應正在每一個行業發生。“客戶直接指定了,非常明確地說要DeepSeek?!泵鄱仁紫夹g官劉益東對第一財經提及客戶對一體機的要求突然轉向。在今年1月初就提出需要一體機產品的客戶,1個月后新的需求是,在原來功能基礎上,希望能將模型換成DeepSeek,同時,也有更多用戶開始來咨詢一體機產品。
從手機、辦公到影像,甚至是農田無人機,DeepSeek撬動了越來越多的產業,讓更多的企業、更多的人開始真正思考,“我必須要用大模型去做一些事情”。陳希認為,這是一個起點,未來一定會驅動產生一系列的AI實踐。但這場風暴催生的變革初期,挑戰同樣存在。
“小步快跑”用起來
作為一線從業者,劉益東認為大模型目前經歷了兩個重要的階段。第一個階段是2022年ChatGPT發布之后,引起了市場的廣泛關注和討論,完成了基礎的市場的教育,但客戶對AI仍然將信將疑,擔憂模型是否真的能夠解決問題。
第二個階段是今年初的DeepSeek,劉益東認為,它完成了更大一輪大模型的市場教育,“大家已經不再懷疑大模型到底能不能給我帶來工作上的變革或者效率上的提升,絕大部分不再猶豫,甚至是我的家人在和我吃飯交流的時候都在討論DeepSeek,基于此我認為它已經是一個全民現象級的話題和認知”。
數據中心服務廠商超云在2023年就已發布一體機,但連續一年多的時間,“大家對于一體機這事兒并不是很感冒”。在一場直播中超云產品運營中心副總經理任世杰提到,背后原因一方面是部署成本過高,另外一方面或許與業務相結合的效果沒有達到客戶的預期。任世杰發現,直到DeepSeek出現后,一體機的需求開始旺盛。
蜜度主要做B端政企和機構的智能辦公、城市治理等服務,也推出了一體機產品,在今年1月他們發布了針對智能辦公場景的“模力通”。在節前已經溝通過需求的客戶,在節后新的需求是,希望有一個DeepSeek的選擇。
“客戶問一體機能不能放DeepSeek的模型,我們也緊急在春節期間,包括節后就開始產研,做適配和驗證,將它放進去。”劉益東感受到DeepSeek對業務促進明顯,1月后,更多的客戶來咨詢了,也有已經達成的商業合作。
“在一個大致正確的方向上,我們信奉小步快跑,不斷更精細化地去驗證用戶精細顆粒的需求?!監PPO是第一批接入DeepSeek的手機廠商,談及接入前的思考,陳希表示,在這一確定性很高的趨勢上,內部沒有經過太長的糾結,“我們想的是怎樣盡快把DeepSeek第一個融入到我們的產品中來,這是一個非常好的一個機會點。”目前ColorOS對外表示“月月有更新”,甚至以周為單位迭代新的功能。
DeepSeek讓更多企業、更多的人開始思考,“必須要用大模型去做一些事情”。
2024年11月,第一財經問及極飛科技創始人兼CEO彭斌大模型在農業無人機的應用,彼時這位創業老兵對這一問題較為謹慎,他提到計算機視覺這樣傳統AI技術已經在無人機的避障中用起來了,但大模型當下仍有待探索。
四個月后彭斌的答案變了。在3月的采訪中,他對記者表示,DeepSeek的出現是一個有象征意義的節點,帶來的改變是全方位的。極飛的研究團隊已經轉為“作戰團隊”開始嘗試落地。
“(以前)我們覺得(大模型的應用)太貴太遠,突然間這么一招,我過年七八天每一天都興奮,和同事一直在群里聊,我們還在電腦上去部署一些蒸餾版的模型,也特別驚艷?!迸肀笥X得,2025年新年那一段時間大家經歷了有意義的變化,DeepSeek給行業注入了全新的可能。
“一個通用的大模型,給它一張照片,它會告訴你這是一塊農田。但是我們的大模型微調以后,它應該會告訴你這是種的棉花,長勢如何、什么地方有一點問題,你得去看看。甚至可以給出更重要的意見,比如灌溉沒做好,缺肥缺微量元素,這也是常年在農場里干活的農業專家的工作。”彭斌表示,極飛一定會有這樣的AI功能出來。
在DeepSeek之前,沒有廠商將有用且便宜做到一個完美的平衡點。DeepSeek給出了選擇,之后可能也會拉動整個行業,激活大量應用場景的變化。彭斌表示,雖然短期可能看不太出來,但是它會孕育一種生態,慢慢就會發生,可能再過半年一年去看會很有意思。
成本和性能的平衡
成本和性能的平衡,是不少應用廠商評價DeepSeek催生變革的關鍵點。
“成本、性能是蹺蹺板的兩端,DeepSeek這個蹺蹺板是平的,不是歪的,如果生成的結果很差,那么再低的成本都沒有意義,也是因為效果好,大家才會對它這么低的成本感到驚訝?!标愊1硎尽?/p>
彭斌很早就用了ChatGPT,這一AI助手的智能化也給了他非常大的震撼,但當時在團隊的判斷里,大模型這件事情會特別費錢,因為一般的公司不可能做大模型基座,動不動幾萬張卡、大量的數據訓練等。
“所以我們會認為AI大模型國內未來就算做出來,成本也會很高。每一次詢問和分析輸出結果,代價太大了。在農業里,我雇一個員工可能3000-5000元每月。但可能問大模型,也會用上三五千塊,還沒人來得靈活,那這個事情就不可能行得通?!睒O飛無人機的場景里有大量復雜場景需要分析,團隊覺得最終的成本一定遠遠大于雇傭一個人。
彭斌并未完全否定大模型的可能性,但當時覺得離真的落地還有更遠的距離,這個距離可能是三到五年。DeepSeek出現了以后,團隊現在認為這個距離迅速拉近到一兩年了?,F在極飛的判斷是,這件事情無限可能。
彭斌坦言,這個過程確實是過去幾個月帶來的變化,這種變化最大的原因是DeepSeek帶來的大模型平權,這一改變對他本人來說也是很大的刺激。
智能體平臺創企楓清科技的產品也接入了DeepSeek大模型,創始人兼CEO高雪峰對記者表示,在R1推出了之后,團隊先后在自身的測試環境以及客戶環境中進行了部署和適配,他認為,R1 模型展現出的明顯優勢是,性能突出和高性價比。
高雪峰認為,R1推出時,在性能效果上的表現、推理能力,特別是在某些應用場景中,已可與國際領先的閉源模型一較高下。其相對較低的推理成本,以及蒸餾出來的各種尺寸的中小模型,對于客戶和市場具有強大的吸引力。DeepSeek 模型顯著降低了大模型的本地化部署的復雜度與成本。
影像企業美圖在去年12月就部署了DeepSeek,當時他們將DeepSeek用到了美圖設計室的LivePPT功能上,也為AI口播視頻制作工具開拍接入了DeepSeek。他們發現,DeepSeek對PPT邏輯的理解和AI腳本的撰寫幫助很大。
在采訪中,美圖創始人、董事長吳欣鴻對第一財經提到,相比其他開源模型, DeepSeek在中文的理解上會更好。其次,DeepSeek的工程優化做得非常極致,推理速度很快,成本很低,這實際上是很多公司切換成DeepSeek一個重要的原因。
吳欣鴻認為,DeepSeek會帶來一些更宏觀的影響,某種意義上它成為了行業的共識,從大廠到小企業都在接入,一個事實上的標準?!坝辛诉@個標準,比百模大戰、千模大戰要好,就像以前的移動操作系統里一旦有一個很強的產品出現,大家就可以放心用,而不用糾結到底用什么?!?/p>
其次,DeepSeek確實讓AI走進了大眾,這個很關鍵,“AI不能是陽春白雪,必須讓普通人都能用上,而DeepSeek的出現讓我們看到很多人用起來了,他們可能是第一次用AI助手,感受AI的魅力?!边@一意義重大。
“買菜無需豪華車”
盡管DeepSeek效果很好,但在應用場景里單一模型也并非所有情況下的最優選。商業化面臨的一個選擇是,在不同場景里挑選性價比最高的模型“應答”。如果追求大參數量的滿血版本,用戶是否會為模型更高的成本買單?這是商業化需要考慮的核心問題。
在蜜度,內部曾花了一兩周的時間去驗證 DeepSeek在公司業務場景的表現,在智能辦公、智能客服、城市治理這類不同場景下,同時測與DeepSeek同類型同等參數量的其他解決方案模型。
劉益東對第一財經表示,基本上DeepSeek帶思維鏈或者深度思考的R1滿血版本,效果要優于原來的解決方案里不帶深度思考的版本。而原來方案里采用的模型的表現,可能要略好于DeepSeek同類型參數不帶深度思考的版本。他強調,這是在公司的業務場景里,積累下來的數據集跑出來的結果,并不代表所有應用。
與此同時,這帶來的一個問題是,雖然帶深度思考的模型會優于其他版本,但算力成本和時間成本都會高不少?!皢栆粋€問題,以前模型秒回應,但深度思考就需要過程輸出,另外模型輸出的思維鏈是要消耗token成本的,如果開啟深度思考,一個問題給到模型,假設輸出2000個token,那不開啟慢思考,可能500個token就夠了。”劉益東解釋。
DeepSeek目前主要有兩個最新的模型,一個是推理模型R1,也就是有思維鏈的深度思考模型,消耗更多的token、更多的時間帶來更加詳細的回答,另外一個則是基礎的V3模型,用更少的token和更快地響應,帶來更簡單的回答。這是不同的兩個技術路線,在應用場景里用來解決不同深度的問題。除這兩個模型之外,在應用中還可以選擇DeepSeek不同參數量的蒸餾版模型,減少部署成本。
除了調用API的模式外,私有化部署也存在用不同模型成本的問題。
任世杰提到,“不見得部署自己的模型,就非要是滿血版的?!彼硎?,有客戶看到單機就可部署DeepSeek 671B滿血版本的模型,就也要滿血版,但沒有考慮到,單機部署雖然把這些模型容納進去,但實際使用中能并發出來的模型專家數量也就8個到10個,利用率會變得非常低。
“將選模型的問題看作是買車的話,如果需求更多是買菜、送孩子上學,那沒必要買一輛豪華跑車?!敝袊嗣翊髮W校級計算平臺負責人、高級工程師魯蔚征認為,雖然豪華跑車更好,安全性或者榮譽感都很好,但是帶來的成本也會很高,同時還有維護成本。
對于這個問題,超聚變AI首席結構師趙迪的觀點是,滿血版大模型是綜合能力強,每一個細分場景都能取得一個不錯的分數。如果場景或者行業的屬性不明確的情況下,預算又不受限制,滿血版部署會更好。但業務如果具體到細分領域,專業訓練的小模型一定是更好的選擇。
實際上,大部分業務部署必須要考慮成本的問題。“現在因為DeepSeek剛火不久,大家都是先去擁抱DeepSeek的生態。越往后業務量起來之后,推理的請求多了之后,算力成本或者推理成本是不是能接受得了,這是一個比較大的問題?!盪Cloud優刻得華北解決方案架構師馬杰提到。
這個問題放在手機廠商這里,為了做到性能和成本的平衡,OPPO系統團隊在做的是“意圖分流”。陳希提到,OPPO ColorOS會做一個系統級的AI,和多個大模型進行合作,除了DeepSeek,還有其他視覺大模型、聲音大模型以及其他多模態的模型,系統要把這些模型整合在一起。
“我們的挑戰就是要把這種不同能力類型的模型整合成一個用戶體驗,到用戶層面上,他使用的是一個產品,這個很重要?!标愊0l現,用戶場景里不同用戶的需求非常繁雜,這背后涉及的是復雜的技術問題,要不斷進行調試。
“假如用戶問一個很簡單的問題,今天天氣怎么樣,也許不需要用到大模型,不需要調用很多操作、消耗算力,就能達成結果,這個時候怎么能從用戶的意圖分流上,把這一類的問題分流成所謂的簡單問題,從而減少調用,這就是在系統層面上未來要去持續構建的意圖分流框架?!标愊=忉?,在進行分流后,一方面是大幅度降低成本,另外也能夠更精準地去判斷用戶意圖,帶來更準確的答案,不是每個問題都需要“長篇大論”。
在DeepSeek的應用端,這個選擇題實際上是留給了用戶,用戶可以在界面選擇“深度思考R1”版本,或者“聯網搜索”來讓模型解答自己的問題,相當于提前做了分流。但陳希認為,在手機系統里,這種問題不應該留給用戶,“用戶去想用什么方法解決問題,本身也是一種復雜,我們更想把這個復雜留給自己,那么技術就要去判斷用戶的意圖”。
除了模型整合上的挑戰外,在手機系統上,用模型做一些更復雜的應用同樣還存在難題。例如,谷歌曾于去年發布 AI 智能體項目Project Astra,可以通過手機攝像頭與大模型進行實時的視覺與語音交互,在今年3月底終于上線,但也并未完全開放。
陳希認為,視頻對話這樣的場景會更復雜,怎么能讓技術的嘗鮮變成用戶場景的常用,這一步比較困難的是要做大量泛化的努力。這本質上還是技術的問題,因為現在的技術并不能充分滿足各種各樣的應用場景,用戶場景是復雜的、千變萬化的,有可能在車上晃來晃去,有可能在暗光環境下看不清楚,都會對技術的可靠性造成很大影響,而現有的技術還不能完全泛化地去處理所有產品,這也是OPPO仍然在探索的方向。
除了一些技術的挑戰外,不少從業者都提及的一個點是,客戶內部的數據源質量會決定企業能否將大模型的潛力挖掘出來。
在實際項目落地中,馬杰發現很多用戶數據的質量是參差不齊的,存在錯誤或者偏離,模型最終輸出的結果、訓練效果都不是特別理想,尤其在金融、醫療等領域,對數據的安全性、私密性和準確度要求較高,也會存在不同格式的數據,質量也不一樣。適配業務的時候,需要大量的清洗和預處理的工作。
“之前接觸的一個定制類項目,客戶的數據分類有很多,如圖片、音頻、文檔、流程圖,會涉及多個模型和業務的結合,數據的轉化降噪,清洗等工程量也非常大。”馬杰表示,模型落地如果要達到一個很好的效果,對客戶數據的質量要求很高。
拋開具體業務層面的難題,趙迪認為,落地中一個更核心的問題是,企業機構擁抱AI的決心有多大,相應的業務流程和組織結構,是否會根據新的技術進行調整。他發現,現在的客戶部分是因為DeepSeek比較火,需要“嘗一下鮮”,但實際上,公司整個業務流程和組織結構還需要做好準備。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業動態,歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。