长序列挑战:LLMs理解能力触及天花板

[复制链接]
周大 发表于 2024-5-14 15:39:02 | 显示全部楼层 |阅读模式
滑铁卢大学的研究揭示了大型语言模型(LLMs)在处理长序列文本时的局限性。尽管一些LLMs在较短文本和简单任务中表现出色,但在LongICLBench基准测试中,当面临大量标签和极长文本时,其性能急剧下降。在最复杂的数据集Discovery上,所有模型都无法准确理解174个标签的上下文,准确率归零。这表明当前的LLMs在长序列理解和推理方面仍有重大挑战。
来源:https://mp.weixin.qq.com/s/NI4juWbm9jOjhK2hCM8KQA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-7 21:56 , Processed in 0.281846 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表