大模型“故障”token问题凸显，优化tokenizer成关键

周大发表于 2024-5-13 15:37:23

大模型的tokenizer问题引起关注，由于tokenizer与模型训练的分离，部分token可能“训练不足”，引发异常输出。Cohere公司的研究团队提出一种有效检测方法，并在多个开源模型上发现此类问题普遍存在。为解决这个问题，他们提出优化tokenizer算法和词汇表结构，以确保tokenizer与模型训练数据的对齐。
来源：https://mp.weixin.qq.com/s/UpkgRhZkK45gAPWOOmEwYQ

页: [1]

靠浦ai课堂's Archiver

大模型“故障”token问题凸显，优化tokenizer成关键