周大 发表于 2024-5-13 15:37:23

大模型“故障”token问题凸显,优化tokenizer成关键

大模型的tokenizer问题引起关注,由于tokenizer与模型训练的分离,部分token可能“训练不足”,引发异常输出。Cohere公司的研究团队提出一种有效检测方法,并在多个开源模型上发现此类问题普遍存在。为解决这个问题,他们提出优化tokenizer算法和词汇表结构,以确保tokenizer与模型训练数据的对齐。
来源:https://mp.weixin.qq.com/s/UpkgRhZkK45gAPWOOmEwYQ
页: [1]
查看完整版本: 大模型“故障”token问题凸显,优化tokenizer成关键