周大 发表于 2024-5-6 15:41:40

微软phi-3-mini 3.8B模型,性能超7B模型

微软新推phi-3-mini语言模型,以3.8B参数量惊人效率击败7B参数大模型,iPhone 14离线运行每秒生成12个tokens。该模型利用创新数据处理和紧凑设计,挑战大模型规模法则,同时确保安全。
来源:https://mp.weixin.qq.com/s/_t0jgnqk_WcvEQ37mr5R-A
页: [1]
查看完整版本: 微软phi-3-mini 3.8B模型,性能超7B模型