主題
:
陸AI黑馬DeepSeek震撼矽谷! 美日科技股嚇崩
瀏覽單個文章
healthfirst.
Golden Member
加入日期: Apr 2017
您的住址: 陣亡者的靈堂
文章: 3,170
引用:
只花不到50美元 美大學AI模型媲美OpenAI「o1」
2025-02-07
https://www.moneydj.com/kmdj/news/n...af-57778e0cc3cd
s1是以阿里巴巴開放免費下載的AI模型「通義千問」(Qwen)為基礎。為了訓練s1,研究人員精心挑選了1,000個問題,
再搭配Gemini 2.0 Flash Thinking Experimental對問題的回應和背後思考的過程集成資料庫。
有人用同樣的方法試過了
以DeepSeek的論文為啟發
在其他AI大模型再蒸餾
結果ChatCPT, DeepSeek都不行
只有阿里巴巴的通義千問才能走通蒸餾的這條路
其他團隊有打造出類似的成果
只是測試結果一樣
只有通義千問能當蒸餾的底座
至於是為什麼
還在研究中
__________________
2025-02-09, 06:57 PM #
87
healthfirst.
瀏覽公開訊息
傳送私人訊息給healthfirst.
查詢healthfirst.發表的更多文章
增加 healthfirst. 到好友清單