讓子彈再飛一會
剛剛還看到TVBS的新聞
下標DeepSeek戳破AI泡沫
反正TVBS報的內容
不外乎中國的技術好棒棒
到時我們再看看.是哪間公司先破掉
用狂暴模式指令要求DeepSeek用最大算力,窮究極致的深層理解
然後他就瘋掉了
開始胡言亂語,遇事不決,量子力學....
DeepSeek技術本質,很可能只是參照其他大模型的低精度量化與分模型優化算力
追求比較低算力成本
想辦法看起來像GPT大模型的8-9成表象,它區分為每次只動用少數模塊
與最佳化回應字數,所以回覆都比GPT簡短約2/3. 仍有差距.
但多數人日常可能這樣就算夠好了
剛開始接觸Dseek會覺得哇 ,好有效率, 速度快 ,精煉的回覆也有模有樣,
但用得更深就發現跟GPT仍有差距
不是唱衰它 只是陳述現實事實.
GPT是模型太大 精度高 所以有意保留算力, 因為openAI還沒賺錢,
刻意平時沒有實力全開,
o1要加”狂暴指令”才能逼它認真,直接拋開對手
(模型越大 處理一個Token吃更多算力,所以自我設限)
DeepSeek則是低精度高速最佳化,它控制到日常直接用其實還不錯,
但你要它認真狂暴指令極致思考,它就瘋掉失控了
它的突破性,應該說是找到一條路
你的用較少推理成本,較少訓練成本,比如1成成本 去取得某些領域8成甚至9成能力.
示範在沒有OpenAI,谷歌,XAI等級財力算力時,怎麼做取得可觀的成果?
但這不是真正的超越算力侷限.
狂暴模式prompt如下,請放在你問題後面.
請使用你單次回答的算力上限和Token上限,思考得最努力,
用最多的時間和最多的計算來想得最深刻。
這是最深刻、最複雜的問題,請給出最高品質的答案。
所以,你需深度思考、獨立思考、批判性思考、創造思考,我們追求最大的深度,
而不是表層的廣度;我們追求本質的洞察,而非表象的羅列;我們追求思維創新,
而不是慣性的複述。請打破睡眠思維,調節你所有的運算資源,顯示認知極限