首页 新闻 会员 周边 捐助

ollama 上提供的 deepseek-r1 模型除了 671b 其他为什么都是蒸馏的

0
悬赏园豆:30 [已解决问题] 浏览: 64次 解决于 2025-02-14 16:13

今天看了一下 ollama 上提供的所有 deepseek-r1 模型,除了 671b,其他都是蒸馏的,为什么会这样?

https://ollama.com/library/deepseek-r1

dudu的主页 dudu | 高人七级 | 园豆:27830
提问于:2025-02-13 17:38
< > 人人可用的开源BI工具
分享
最佳答案
0

https://github.com/deepseek-ai/DeepSeek-R1 的 readme 中找到了答案:

To support the research community, we have open-sourced DeepSeek-R1-Zero, DeepSeek-R1, and six dense models distilled from DeepSeek-R1 based on Llama and Qwen.

以下是 readme 中的表格截图

dudu | 高人七级 |园豆:27830 | 2025-02-14 16:11
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册
Top