引用:
作者healthfirst.
很多人說是蒸餾ChatGPT的模型
但有沒有想過ChatGPT最新最強的早就弊源了?
現在DeepSeek端出的
是一個跟ChatGPT最新最強的差不多聰明的模型
DeepSeek只能算是跟ChatGPT同一個等級而已
頂多算追平
不能說是超越
本來以為有2~3年差距
結果一下抹平了
DeepSeek強是強在訓練成本比同級模型低很多
我看有人用看醫生的舉例說明
大模型裡頭還可以拆分不同的參數、不同的子模型
不同的子模型就是不同的專科
現在所有的模型
都是有病就去所有科別看一次
DeepSeek是有辦法辨別是哪一科的問題
只去那一科看病
這樣成本就省出來了
其他大模型為啥不這樣幹?
因為他們要分哪個科別這步就卡住了
還沒做好
只好每科醫生都看一遍
現在DeepSeek是第一個做到比較準確調用子模型的大模型
我也只是道聽塗說
不知真假
|
開始追殺了
https://www.cna.com.tw/news/aopl/202501290140.aspx
美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中提及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自家技術,但他也沒有進一步提出證據。
另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多達5萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk)也在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。