PCDVD數位科技討論區 - 瀏覽單個文章 - DeepSeek崛起、輝達結束獨霸時代！

引用:

作者healthfirst.

很多人說是蒸餾ChatGPT的模型
但有沒有想過ChatGPT最新最強的早就弊源了?

現在DeepSeek端出的
是一個跟ChatGPT最新最強的差不多聰明的模型
DeepSeek只能算是跟ChatGPT同一個等級而已
頂多算追平
不能說是超越
本來以為有2~3年差距
結果一下抹平了

DeepSeek強是強在訓練成本比同級模型低很多
我看有人用看醫生的舉例說明
大模型裡頭還可以拆分不同的參數、不同的子模型
不同的子模型就是不同的專科
現在所有的模型
都是有病就去所有科別看一次
DeepSeek是有辦法辨別是哪一科的問題
只去那一科看病
這樣成本就省出來了
其他大模型為啥不這樣幹?
因為他們要分哪個科別這步就卡住了
還沒做好
只好每科醫生都看一遍
現在DeepSeek是第一個做到比較準確調用子模型的大模型

我也只是道聽塗說
不知真假

開始追殺了

https://www.cna.com.tw/news/aopl/202501290140.aspx

美國總統川普政府的AI專家塞克斯（David Sacks）也在福斯新聞（Fox News）訪談中提及蒸餾技術，並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出，以協助開發自家技術，但他也沒有進一步提出證據。

另一方面，美國Scale AI執行長汪滔（Alexandr Wang）日前表示，DeepSeek應握有多達5萬顆輝達（Nvidia）H100晶片，以開發現有模型。美國億萬富豪馬斯克（Elon Musk）也在社群平台X回應相關推文，並加上「顯而易見」的評論，似乎同意這項說法。