謬誤1
DeepSeek是在ChatGPT大模型上通過「蒸餾」產(chǎn)生的,這涉及「偷取」知識產(chǎn)權(quán),且任何人都可以以低成本蒸餾出「精華」。
高飛:否。模型蒸餾並不是一項新技術(shù),目前沒有任何公司利用蒸餾方法,訓(xùn)練出超過其他模型性能的產(chǎn)品。這兩年,擁有高端芯片、強(qiáng)大算力、在ChatGPT上蒸餾數(shù)據(jù)的模型,不下幾十個,沒有一個能「跑」出類似的效果,都達(dá)不到DeepSeekR1強(qiáng)大的性能。而且,DeepSeek的技術(shù)秘密是公開的,它既模型開源,又在原始技術(shù)論文中公開了細(xì)節(jié)。
謬誤2
DeepSeek背後是接近50000臺英偉達(dá)最先進(jìn)A100芯片在支撐,不可能只用2000塊GPU就訓(xùn)練出這麼高性能的模型。
高飛:否。DeepSeek的技術(shù)論文中清楚地寫明了訓(xùn)練模型所需要的GPU數(shù)量,DeepSeek團(tuán)隊沒有必要在這個數(shù)字上作假。目前所有聲稱「DeepSeek靠五萬卡訓(xùn)練模型」的說法,都是坊間猜測,無任何權(quán)威出處。
謬誤3
DeepSeek模型只受國人追捧,美國有OpenAI、Meta等前沿模型,沒有必要用DeepSeek的產(chǎn)品。
高飛:否。近期全球眾多大廠紛紛宣布支持DeepSeek的模型,包括亞馬遜、英特爾、微軟、Perplexity、NVIDIA等。DeepSeek的APP也登頂多個國家的App Store下載排行榜??梢哉f,DeepSeek在全球範(fàn)圍內(nèi)都是一個現(xiàn)象級的產(chǎn)品。