PCDVD數位科技討論區 - 瀏覽單個文章 - 陸AI黑馬DeepSeek震撼矽谷！美日科技股嚇崩

引用:

只花不到50美元美大學AI模型媲美OpenAI「o1」
2025-02-07
https://www.moneydj.com/kmdj/news/n...af-57778e0cc3cd

s1是以阿里巴巴開放免費下載的AI模型「通義千問」(Qwen)為基礎。為了訓練s1，研究人員精心挑選了1,000個問題，
再搭配Gemini 2.0 Flash Thinking Experimental對問題的回應和背後思考的過程集成資料庫。

有人用同樣的方法試過了
以DeepSeek的論文為啟發
在其他AI大模型再蒸餾
結果ChatCPT, DeepSeek都不行
只有阿里巴巴的通義千問才能走通蒸餾的這條路
其他團隊有打造出類似的成果
只是測試結果一樣
只有通義千問能當蒸餾的底座

至於是為什麼
還在研究中