周大 发表于 2025-6-6 13:48:03

阿里开源Qwen3文本表征与排序模型,多语言文本表征与排序性能卓越霸榜

阿里巴巴开源了两款Qwen3系列新模型——Qwen3-Embedding和Qwen3-Reranker,专注于文本表征与排序任务,支持119种语言。测试数据显示,Qwen3 Embedding的8B参数模型以70.58分领先,超越谷歌Gemini-Embedding;Qwen3 Reranker在多语言检索中表现突出,中文得分77.45,英文得分69.76。模型采用因果注意力机制和单塔结构,提供三种参数规模配置。通过创新的多阶段训练方法,包括无监督预训练、监督微调和模型融合,以及高质量合成数据生成,这两款模型在性能和泛化能力上显著优于其他基线模型。
来源:https://tech.ifeng.com/c/8jwFugbAmwT
页: [1]
查看完整版本: 阿里开源Qwen3文本表征与排序模型,多语言文本表征与排序性能卓越霸榜