DeepSeek 究竟在蒸餾什麼?On Device AI的春天要來了嗎?

DeepSeek R1 究竟在蒸餾什麼? 這幾天 DeepSeek 新聞太多,搞得不去研究一下好像不好意思說自己有在關注 AI。 翻了下 DeepSeek R1 的論文,我印象最深刻的是它的蒸餾技術,讓原本沒什麼用得小模型也能有了更強的推理能力,我覺得這點對於未來的 On Device AI 推動會有蠻大的幫助的。而且因為是 Open Source,全球很多機構已經開始嘗試復現,未來會釋出更多更好的模型。 ...

1月 30, 2025 · 1440 words · Ben

把雜訊整理成判斷

免費訂閱 · 可隨時取消