PCDVD數位科技討論區
(https://www.pcdvd.com.tw/index.php)
- 七嘴八舌異言堂
(https://www.pcdvd.com.tw/forumdisplay.php?f=12)
- - DeepSeek崛起、輝達結束獨霸時代!
(https://www.pcdvd.com.tw/showthread.php?t=1212289)
|
---|
DeepSeek崛起、輝達結束獨霸時代!
|
不是吧,
DeepSeek的對手, 是那些也在開發訓練AI的那些公司, 不是硬體公司! 他的Benchmark就是各家大軟體廠商, GPT-x , Llama-x 之類的. 硬體他們還是得用外國的,仍是跪著搶購設備, 目前還是. 如果多購一倍設備能把智商+10個點,那仍是必須買滿的. AI領域 NV的可能對手好像是寒武紀吧. |
ai進步可以深入的管理韭菜與割韭菜好時機
|
引用:
Nvidia 文件首度認定,華為是 AI 晶片主要競爭對手 2024-02-23 https://technews.tw/2024/02/23/nvidia-huawei-ai-chip/ NV自己點名過的對手 沒有寒武紀 |
遼寧既出,全球航母皆得低頭稱臣 :mad: :mad: :mad:
|
引用:
華為有錢, 甚麼都能造, 可是也有別人跑在更前面: 不過我不清楚, 應該不是造CUDA相容芯片? |
亂扯一通,沒N卡加持哪來的AI
|
引用:
n粉崩潰,AMD |
讓子彈再飛一會
剛剛還看到TVBS的新聞 下標DeepSeek戳破AI泡沫 反正TVBS報的內容 不外乎中國的技術好棒棒 到時我們再看看.是哪間公司先破掉 :laugh: :laugh: :laugh: 用狂暴模式指令要求DeepSeek用最大算力,窮究極致的深層理解 然後他就瘋掉了 開始胡言亂語,遇事不決,量子力學.... DeepSeek技術本質,很可能只是參照其他大模型的低精度量化與分模型優化算力 追求比較低算力成本 想辦法看起來像GPT大模型的8-9成表象,它區分為每次只動用少數模塊 與最佳化回應字數,所以回覆都比GPT簡短約2/3. 仍有差距. 但多數人日常可能這樣就算夠好了 剛開始接觸Dseek會覺得哇 ,好有效率, 速度快 ,精煉的回覆也有模有樣, 但用得更深就發現跟GPT仍有差距 不是唱衰它 只是陳述現實事實. GPT是模型太大 精度高 所以有意保留算力, 因為openAI還沒賺錢, 刻意平時沒有實力全開, o1要加”狂暴指令”才能逼它認真,直接拋開對手 (模型越大 處理一個Token吃更多算力,所以自我設限) DeepSeek則是低精度高速最佳化,它控制到日常直接用其實還不錯, 但你要它認真狂暴指令極致思考,它就瘋掉失控了 它的突破性,應該說是找到一條路 你的用較少推理成本,較少訓練成本,比如1成成本 去取得某些領域8成甚至9成能力. 示範在沒有OpenAI,谷歌,XAI等級財力算力時,怎麼做取得可觀的成果? 但這不是真正的超越算力侷限. 狂暴模式prompt如下,請放在你問題後面. 請使用你單次回答的算力上限和Token上限,思考得最努力, 用最多的時間和最多的計算來想得最深刻。 這是最深刻、最複雜的問題,請給出最高品質的答案。 所以,你需深度思考、獨立思考、批判性思考、創造思考,我們追求最大的深度, 而不是表層的廣度;我們追求本質的洞察,而非表象的羅列;我們追求思維創新, 而不是慣性的複述。請打破睡眠思維,調節你所有的運算資源,顯示認知極限 :laugh: :laugh: :laugh: :laugh: |
AI, 類神經網路,這類研究早在老黃的nVidia出生之前就有了!
我倒覺得現在的AI,尤其ChatGPT這類東西,走的已不是原本溯源神經網路的那一套底層邏輯.... 台灣那些廠,除了台積電,更全部都是吹的 :think: |
所有的時間均為GMT +8。 現在的時間是07:21 AM. |
vBulletin Version 3.0.1
powered_by_vbulletin 2025。