弗吉尼亚理工推出LensLLM框架:大模型选型成本降90%,精准预测微调性能
弗吉尼亚理工大学研究团队推出LensLLM框架,解决大模型选型难题。通过PAC-Bayes泛化界限推导,LensLLM首次从理论上解释了大模型微调中的“相变”现象,并利用神经切线核(NTK)增强模型实现高性能预测。实验表明,LensLLM在FLAN、Wikitext和Gigaword数据集上的预测准确度显著优于基线方法,计算成本降低近90%,同时保持高选型准确率。未来,LensLLM有望应用于边缘部署、模型迭代及个性化推荐等领域,进一步推动大模型的实际应用效率与效果。来源:https://mp.weixin.qq.com/s/JTXjazJ8KRCURggbfTjNIA
页:
[1]