瀏覽單個文章
healthfirst.
Golden Member
 
healthfirst.的大頭照
 

加入日期: Apr 2017
您的住址: 陣亡者的靈堂
文章: 3,170
很多人說是蒸餾ChatGPT的模型
但有沒有想過ChatGPT最新最強的早就弊源了?

現在DeepSeek端出的
是一個跟ChatGPT最新最強的差不多聰明的模型
DeepSeek只能算是跟ChatGPT同一個等級而已
頂多算追平
不能說是超越
本來以為有2~3年差距
結果一下抹平了

DeepSeek強是強在訓練成本比同級模型低很多
我看有人用看醫生的舉例說明
大模型裡頭還可以拆分不同的參數、不同的子模型
不同的子模型就是不同的專科
現在所有的模型
都是有病就去所有科別看一次
DeepSeek是有辦法辨別是哪一科的問題
只去那一科看病
這樣成本就省出來了
其他大模型為啥不這樣幹?
因為他們要分哪個科別這步就卡住了
還沒做好
只好每科醫生都看一遍
現在DeepSeek是第一個做到比較準確調用子模型的大模型

我也只是道聽塗說
不知真假
舊 2025-01-30, 01:39 AM #63
回應時引用此文章
healthfirst.離線中