DeepSeek-R1 推理模型迎「小」更新,性能提升显著,网友实测代码能力大幅增强
DeepSeek的R1推理模型更新至0528版本,参数量达6850亿,采用MIT许可证支持商业用途。新版DeepSeek-R1-0528推理能力更强,文本输出更自然且结构清晰。在LiveCodeBench和Extended NYT Connections等基准测试中表现优异,编程能力显著提升。尽管存在过度思考问题,但相较前版有明显进步,网友们对其即将到来的R2版本充满期待。来源:https://mp.weixin.qq.com/s/14YOsEZ_Kr6MD-7qvm3Hgg
页:
[1]