瀏覽單個文章
healthfirst.
Golden Member
 
healthfirst.的大頭照
 

加入日期: Apr 2017
您的住址: 陣亡者的靈堂
文章: 3,170
引用:
只花不到50美元 美大學AI模型媲美OpenAI「o1」
2025-02-07
https://www.moneydj.com/kmdj/news/n...af-57778e0cc3cd

s1是以阿里巴巴開放免費下載的AI模型「通義千問」(Qwen)為基礎。為了訓練s1,研究人員精心挑選了1,000個問題,
再搭配Gemini 2.0 Flash Thinking Experimental對問題的回應和背後思考的過程集成資料庫。

有人用同樣的方法試過了
以DeepSeek的論文為啟發
在其他AI大模型再蒸餾
結果ChatCPT, DeepSeek都不行
只有阿里巴巴的通義千問才能走通蒸餾的這條路
其他團隊有打造出類似的成果
只是測試結果一樣
只有通義千問能當蒸餾的底座

至於是為什麼
還在研究中
__________________
舊 2025-02-09, 06:57 PM #87
回應時引用此文章
healthfirst.離線中