?專家剖析DeepSeek技術(shù)

時間：2025-02-08 05:02:17來源：大公報

　　謬誤1

　　DeepSeek是在ChatGPT大模型上通過「蒸餾」產(chǎn)生的，這涉及「偷取」知識產(chǎn)權(quán)，且任何人都可以以低成本蒸餾出「精華」。

　　高飛：否。模型蒸餾並不是一項新技術(shù)，目前沒有任何公司利用蒸餾方法，訓(xùn)練出超過其他模型性能的產(chǎn)品。這兩年，擁有高端芯片、強(qiáng)大算力、在ChatGPT上蒸餾數(shù)據(jù)的模型，不下幾十個，沒有一個能「跑」出類似的效果，都達(dá)不到DeepSeekR1強(qiáng)大的性能。而且，DeepSeek的技術(shù)秘密是公開的，它既模型開源，又在原始技術(shù)論文中公開了細(xì)節(jié)。

　　謬誤2

　　DeepSeek背後是接近50000臺英偉達(dá)最先進(jìn)A100芯片在支撐，不可能只用2000塊GPU就訓(xùn)練出這麼高性能的模型。

高飛：否。DeepSeek的技術(shù)論文中清楚地寫明了訓(xùn)練模型所需要的GPU數(shù)量，DeepSeek團(tuán)隊沒有必要在這個數(shù)字上作假。目前所有聲稱「DeepSeek靠五萬卡訓(xùn)練模型」的說法，都是坊間猜測，無任何權(quán)威出處。

　　謬誤3

　　DeepSeek模型只受國人追捧，美國有OpenAI、Meta等前沿模型，沒有必要用DeepSeek的產(chǎn)品。

高飛：否。近期全球眾多大廠紛紛宣布支持DeepSeek的模型，包括亞馬遜、英特爾、微軟、Perplexity、NVIDIA等。DeepSeek的APP也登頂多個國家的App Store下載排行榜?？梢哉f，DeepSeek在全球範(fàn)圍內(nèi)都是一個現(xiàn)象級的產(chǎn)品。

久久91亚洲人成电影网站_久久精品亚洲综合专区_狼狼综合久久久久综合网_伊人久久青草青青综合



大公產(chǎn)品

?專家剖析DeepSeek技術(shù)

時間：2025-02-08 05:02:17來源：大公報

最新要聞

最受歡迎