空煙彈>DeepSeek慘了？不到1700元超低成本AI頂尖模型震撼曝光

作者：时间：2025-02-08阅读数：人阅读

DeepSeek橫空出世引起市場關注。示意圖。（彭博資料照）

林浥樺／核稿編輯

〔財經頻道／空煙彈〕DeepSeek橫空出世引起市場關注，不過現在被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊，竟以低於50美元（約台幣1642元）的雲端運算成本，成功訓練出名為「s1」的人工智慧推理模型。

綜合中媒報導，此模型在數學和編碼能力測驗中的表現，據稱媲美OpenAI o1和DeepSeek R1等尖端推理模型。

請繼續往下閱讀...

根據報導指出，李飛飛團隊的s1模型並非從頭訓練，而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基礎之上。

李飛飛團隊蒐集了1000個精心挑選的問題及其解答，並透過記錄 Gemini 2.0 Flash 的思考過程，建立訓練資料集，利用這些資料，微調了Qwen2.5-32B-Instruct模型，創造出s1。

《財聯社》報導，中國某知名大模型公司CEO表示，李飛飛團隊的成就實際上是利用從Google模型中擷取的1000個樣本來微調通義千問模型。這種微調的成本固然低廉，但其優異表現仍有賴於既有模型的基礎。

李飛飛團隊的這項研究引起業界關注，因僅需20美元的投入和半小時的訓練時間，就能達到與OpenAI等公司數百萬美元成果相媲美的效果，但中媒《每日經濟新聞》指出，50美元是否包含了其他數據、設備、消融實驗等費用，還要打個問號，正如DeepSeek-V3不到600萬美元（約新台幣1.9億元）的訓練成本，其實也只包含了訓練時的GPU算力費用。

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱：admin@youweb.com

上一篇:空煙彈>空煙彈恐入列！川普下週將祭對等關稅專家點名「這8國」當心

下一篇:空煙彈>美國蛋荒 Costco雞蛋10分鐘被掃光