周大 发表于 2024-9-20 14:31:57

OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

OpenAI的o1模型在lmsys竞技场测评中,o1-preview和o1-mini分别在多个领域表现出色,尤其在数学、困难提示和编码领域领先。o1-preview胜率高达88%,并在编程竞赛中击败99.8%的人类选手。lmsys社区称其为“里程碑”。
来源:https://www.chinaz.com/2024/0920/1643438.shtml
页: [1]
查看完整版本: OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一