ollama 上提供的 deepseek-r1 模型除了 671b 其他为什么都是蒸馏的

悬赏园豆：30 [已解决问题] 解决于 2025-02-14 16:13

今天看了一下 ollama 上提供的所有 deepseek-r1 模型，除了 671b，其他都是蒸馏的，为什么会这样？

https://ollama.com/library/deepseek-r1

AI deepseek

dudu | 高人七级 | 园豆：22848
提问于：2025-02-13 17:38

< >

最佳答案

在 https://github.com/deepseek-ai/DeepSeek-R1 的 readme 中找到了答案：

To support the research community, we have open-sourced DeepSeek-R1-Zero, DeepSeek-R1, and six dense models distilled from DeepSeek-R1 based on Llama and Qwen.

以下是 readme 中的表格截图

dudu | 高人七级 |园豆：22848 | 2025-02-14 16:11

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。