作者healthfirst.
很多人說是蒸餾ChatGPT的模型
但有沒有想過ChatGPT最新最強的早就弊源了?
現在DeepSeek端出的
是一個跟ChatGPT最新最強的差不多聰明的模型
DeepSeek只能算是跟ChatGPT同一個等級而已
頂多算追平
不能說是超越
本來以為有2~3年差距
結果一下抹平了
DeepSeek強是強在訓練成本比同級模型低很多
我看有人用看醫生的舉例說明
大模型裡頭還可以拆分不同的參數、不同的子模型
不同的子模型就是不同的專科
現在所有的模型
都是有病就去所有科別看一次
DeepSeek是有辦法辨別是哪一科的問題
只去那一科看病
這樣成本就省出來了
其他大模型為啥不這樣幹?
因為他們要分哪個科別這步就卡住了
還沒做好
只好每科醫生都看一遍
現在DeepSeek是第一個做到比較準確調用子模型的大模型
我也只是道聽塗說
不知真假
|