DeepSeek 究竟在蒸餾什麼?On Device AI的春天要來了嗎?
DeepSeek R1 究竟在蒸餾什麼? 這幾天 DeepSeek 新聞太多,搞得不去研究一下好像不好意思說自己有在關注 AI。 翻了下 DeepSeek R1 的論文,我印象最深刻的是它的蒸餾技術,讓原本沒什麼用得小模型也能有了更強的推理能力,我覺得這點對於未來的 On Device AI 推動會有蠻大的幫助的。而且因為是 Open Source,全球很多機構已經開始嘗試復現,未來會釋出更多更好的模型。 ...
DeepSeek R1 究竟在蒸餾什麼? 這幾天 DeepSeek 新聞太多,搞得不去研究一下好像不好意思說自己有在關注 AI。 翻了下 DeepSeek R1 的論文,我印象最深刻的是它的蒸餾技術,讓原本沒什麼用得小模型也能有了更強的推理能力,我覺得這點對於未來的 On Device AI 推動會有蠻大的幫助的。而且因為是 Open Source,全球很多機構已經開始嘗試復現,未來會釋出更多更好的模型。 ...