周大 发表于 2024-12-7 14:13:42

OpenAI 发布强化微调技术,12 个例子定制专家模型

OpenAI 在“12 天”活动的第二天发布了强化微调技术,仅需 12 个示例即可定制专家模型,显著提升模型推理能力。强化微调通过少量高质量示例快速调整模型,效果优于 o1 mini 和 o1。现场演示显示,强化微调后的大模型在遗传疾病预测任务中表现优异。该技术为科学家和开发者提供了定制化 AI 模型的新途径,标志着 AI 定制化的重要进展。
来源:https://tech.ifeng.com/c/8f77tCtiQ1a
页: [1]
查看完整版本: OpenAI 发布强化微调技术,12 个例子定制专家模型