端侧AI发展加速,定制化成关键
近期华为、联想等头部厂商宣布接入DeepSeek-R1,尽管大型语言模型(LLM)逐渐接近人类思考方式,但智能终端设备的实际体验仍不理想。传统LLM主要部署在云服务器上,存在延迟、数据隐私和联网等局限性。随着智能手机、汽车等设备智能化发展,直接在边缘设备部署LLM成为关键需求。然而,端侧设备的硬件能力有限,难以满足大模型的计算需求,尤其是算力不足问题突出。DeepSeek通过压缩、量化等技术降低端侧算力需求,但资源受限仍是主要挑战。因此,端侧模型轻量化设计变得尤为重要,通常由大模型蒸馏而来,但在实际场景中往往需要专门定制以适应硬件约束和特定应用场景。来源:https://mp.weixin.qq.com/s/8iau0wdQ7ZSxZAeJ1Ef2yw
页:
[1]