只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学团队提出Tina模型,结合LoRA与强化学习,在15亿参数基础模型上实现高效推理能力。该模型在数学和科学推理任务中表现出色,平均分数达48.16%-50.60%,且复现成本低至9美元。通过使用两个NVIDIA L40S GPU,显著减少硬件需求。团队还进行了多方面消融实验,验证了数据集质量、学习率等关键因素的影响,为资源受限环境下的AI推理提供新方向。来源:https://mp.weixin.qq.com/s/i4fxMSspTxZ5HSKo0ibMTw
页:
[1]