验证码成AI拦路虎多模态模型居然败给验证码多模态Agent再强,也逃不过图形“验

量子位看科技 2025-06-04 16:27:11

验证码成AI拦路虎多模态模型居然败给验证码

多模态Agent再强,也逃不过图形“验证码”这关。

MetaAgentX团队推出了一个专注多模态交互智能体与验证码问题的开放研究平台——Open CaptchaWorld,专门用来测试Agent解图形验证码的能力。

其中一个关键发现是,多模态Agent“过度细化任务”严重:人类三步能解的题,它们往往拆成十几步,既慢又易错。这也暴露出当前模型在动态交互与任务规划上的短板。

另外,研究还评估了模型在成功率与计算成本间的性价比。虽然OpenAI-o3成功率最高,但成本也最贵。而DeepSeek-V3、Claude-3.5-Haiku等则更平衡,适合作为轻量级基线。

0 阅读:2
量子位看科技

量子位看科技

感谢大家的关注