DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源
DeepSeek推出的DeepSeek-R1-Preview在LiveCodeBench测试中表现出色,进入前三名,其性能与OpenAI o1-Medium相当。该版本采用更大规模的基础模型,相比之前的Lite版有显著提升。DeepSeek与LiveCodeBench团队合作评估新模型能力并协助改进评分系统。此前DeepSeek宣布R1模型将开源,引发网友期待。LiveCodeBench由UC伯克利、MIT和康奈尔大学团队推出,以确保测试的公平性和可靠性。来源:https://www.chinaz.com/2025/0120/1664952.shtml
页:
[1]