大模型“故障”token问题凸显,优化tokenizer成关键

[复制链接]
周大 发表于 2024-5-13 15:37:23 | 显示全部楼层 |阅读模式
大模型的tokenizer问题引起关注,由于tokenizer与模型训练的分离,部分token可能“训练不足”,引发异常输出。Cohere公司的研究团队提出一种有效检测方法,并在多个开源模型上发现此类问题普遍存在。为解决这个问题,他们提出优化tokenizer算法和词汇表结构,以确保tokenizer与模型训练数据的对齐。
来源:https://mp.weixin.qq.com/s/UpkgRhZkK45gAPWOOmEwYQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-2 22:53 , Processed in 0.286000 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表