不用等R2了！第三方给新版DeepSeek V3添加深度思开云体育考

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-04-28

浏览次数：次

　　HuggingFace创始人此时推荐“以不变应万变”，打开官方认证账号的更新提醒，就能第一时间获取通知。

　　之所以有很多人相信R2会在4月底发布，有一部分原因也是出于R1与V3之间相隔了一个月左右。

　　而且做到这一点，不是靠微调或蒸馏，而是DeepSeek V3-0324和R1两个模型融合而成。

　　该团队此前也探索过可调专家混合（MoTE）方法，让DeepSeek-R1在推理部署时可以改变行为。

　　新的R1T-Chimera模型权重可在HuggingFace下载，也可以在OpenRouter免费在线试玩。

　　TNG团队表示最终结果令人惊讶，不仅没有表现出融合模型的缺陷，相反，思考过程还比原版R1更紧凑有序。

　　暂没有技术报告或更详细的模型融合方法公布，要验证它是否符合描述，就只能拉出来试一试了。

　　101秒，最终计算出可以通过。虽然还是无法像人类一样直观的理解三维空间，让甘蔗与门的平面垂直就可通过，但依然通过计算夹角与投影得出了结论。

　　后面依然陷入了各种误区，在旋转甘蔗、弯曲甘蔗、计算“门的厚度”上走了弯路。

　　不过在实验中，这种简单融合方法表现并不如这篇论文中提出的Long2short强化学习方法。

　　另一个在模型融合上有经验的团队是Transformer作者Llion Jones创办的Sakana AI。

　　随着更多团队跟进这一路线年大模型的一大技术趋势呢？欢迎在评论区留下你的看法。