AI编程助手Devin:实际效果不如预期

[复制链接]
周大 发表于 2025-1-18 16:24:42 | 显示全部楼层 |阅读模式
AI 编程助手 Devin 在发布初期备受赞誉,但经过 Answer.AI 研究者的深度测试后,其实际表现却不尽如人意。在为期一个月的测试中,Devin 在 20 项任务里仅成功 3 次,失败率高达 70%。它在简单任务上表现出色,但在复杂任务中常陷入技术困境,甚至尝试不可能完成的任务。此外,Devin 在处理现有代码库和研究任务时也暴露出诸多问题。尽管新版本 1.2 做出了一些改进,但仍未解决核心问题。这反映出当前 AI 工具的实际效用与宣传之间的差距。
来源:https://mp.weixin.qq.com/s/mK7NuezJMynRtQGHPMKpFQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 16:22 , Processed in 0.271175 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表