久久91亚洲人成电影网站_久久精品亚洲综合专区_狼狼综合久久久久综合网_伊人久久青草青青综合

大公產(chǎn)品

首頁 > 新聞 > 正文

?專家剖析DeepSeek技術(shù)

時間:2025-02-08 05:02:17來源:大公報

  謬誤1

  DeepSeek是在ChatGPT大模型上通過「蒸餾」產(chǎn)生的,這涉及「偷取」知識產(chǎn)權(quán),且任何人都可以以低成本蒸餾出「精華」。

  高飛:否。模型蒸餾並不是一項新技術(shù),目前沒有任何公司利用蒸餾方法,訓(xùn)練出超過其他模型性能的產(chǎn)品。這兩年,擁有高端芯片、強(qiáng)大算力、在ChatGPT上蒸餾數(shù)據(jù)的模型,不下幾十個,沒有一個能「跑」出類似的效果,都達(dá)不到DeepSeekR1強(qiáng)大的性能。而且,DeepSeek的技術(shù)秘密是公開的,它既模型開源,又在原始技術(shù)論文中公開了細(xì)節(jié)。

  謬誤2

  DeepSeek背後是接近50000臺英偉達(dá)最先進(jìn)A100芯片在支撐,不可能只用2000塊GPU就訓(xùn)練出這麼高性能的模型。

高飛:否。DeepSeek的技術(shù)論文中清楚地寫明了訓(xùn)練模型所需要的GPU數(shù)量,DeepSeek團(tuán)隊沒有必要在這個數(shù)字上作假。目前所有聲稱「DeepSeek靠五萬卡訓(xùn)練模型」的說法,都是坊間猜測,無任何權(quán)威出處。

  謬誤3

  DeepSeek模型只受國人追捧,美國有OpenAI、Meta等前沿模型,沒有必要用DeepSeek的產(chǎn)品。

高飛:否。近期全球眾多大廠紛紛宣布支持DeepSeek的模型,包括亞馬遜、英特爾、微軟、Perplexity、NVIDIA等。DeepSeek的APP也登頂多個國家的App Store下載排行榜??梢哉f,DeepSeek在全球範(fàn)圍內(nèi)都是一個現(xiàn)象級的產(chǎn)品。

最新要聞

最受歡迎