验证码成AI拦路虎多模态模型居然败给验证码多模态Agent再强，也逃不过图形“验

量子位看科技 2025-06-04 16:27:11

验证码成AI拦路虎多模态模型居然败给验证码

多模态Agent再强，也逃不过图形“验证码”这关。

MetaAgentX团队推出了一个专注多模态交互智能体与验证码问题的开放研究平台——Open CaptchaWorld，专门用来测试Agent解图形验证码的能力。

其中一个关键发现是，多模态Agent“过度细化任务”严重：人类三步能解的题，它们往往拆成十几步，既慢又易错。这也暴露出当前模型在动态交互与任务规划上的短板。

另外，研究还评估了模型在成功率与计算成本间的性价比。虽然OpenAI-o3成功率最高，但成本也最贵。而DeepSeek-V3、Claude-3.5-Haiku等则更平衡，适合作为轻量级基线。

0 阅读：2

如何评价DeepSeek-R1-0528。从很多方面来讲，如果论公司，这是一个

ChatGPT新功能，豆包、飞书都有昨天凌晨，OpenAI发布ChatG

【1评论】

chatgpt openai 语音识别飞书

DeepSeek新模型被指套壳DeepSeek新模型疑似借鉴GeminiDeep

deepseek gemini Twitter

印度哭完美国哭，中国官宣的新技术让外网再次炸锅，连国外CEO都忍不住感慨：不止印

【33评论】【116点赞】

达摩院算法 ai 美国食品药品监督管理局互联网医疗

金融时报FT：由于英伟达处理器库存不断减少以及美国出口管制日益收紧，中国头部科

【12评论】【16点赞】

英伟达出口管制 CPU 人工智能 it芯片

大吃一惊！华为正式官宣了！6月3日，华为终端正式官宣：首款鸿蒙AI智能手

【2评论】【1点赞】

ai 华为鸿蒙系统智能手表华为终端人工智能

因为老美禁令，英伟达很多人才去了华为！据英伟达首席科技家比尔·戴利表示：“大量过

【1点赞】

英伟达华为人工智能 ai

量子位看科技

感谢大家的关注

免费软著申请教程软件著作申请模板想申请软著，但不知道从哪下手？这里有份软著模板库

逆向iPhone摄影系统iPhone照片里藏着深度图一张看似普通的iPhone1

推理模型倾向于知难而退苹果新研究发现推理模型越难越摆烂越困难的问题，推理模型一定

清华牵头推出电镜领域的AI智能体STEM图像转换CIF结构缩短至几分钟AI Ag

AMD三天完成两次收购AMD收购低功耗AI推理芯片团队AMD最近动作频频，前天宣

如何精准调控模型行为浙大腾讯团队新思路打造聪明听话的AI如果你面前有两个AI助手

12万数学题特训AI模型超难AI数学特训集AI也能像数学家一样证明定理？腾讯AI

第九届全球跨境电商峰会暨2025亿邦全球化新品牌AI竞争力大会来啦！一起来看这

大神Karpathy炮轰复杂UI应用无法被模型调用的软件将失去未来在人与AI高度

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

好纠结呀！现在的小屏手机到底哪款性价比最出色呢？

2025年手机选购指南，全价位段手机推荐

一图解读：十款手机配置，各显神通，你更喜欢哪款？

一个人躺在沙发上玩手机。

以前这样挂着一部手机那是相当时髦的

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

字节的工资是真的高啊！

投屏之前一定要检查好啊这下可麻烦了

618手机大促，不同价位手机，超值推荐！你觉得618购买手机性价比高吗？

存一张美得很人山人海的（AI

科技最新文章

王自如回应做AI内容看完他讲述的故事，其实后面更动容。人生就是很多选择，敢去做

618新机推荐：智能选机指南，哪款值得入手呢？

刘强东这次真的当了冤大头了！一个叫姜官成的外卖小哥，刚从美团跳槽到京东外卖没几天

2025年5月OPPO四款手机推荐，性能与颜值并存！618你会选购哪款呢？

iOS26设计渲染图曝光为什么是iOS26？因为用年份命名版本，比如26年就是

苹果iOS26泄露了，看起来似乎还不错呢。[吃瓜]ios用户ios一觉

iPhone手机各型号优缺点合集！盘了一下苹果11，苹果12，苹果13，苹果1

万万没有想到，现在的Ai技术，已经做得那么真实了啊。

618iPhone手机哪款值得入手啊？

随机资讯

世俱杯前瞻（三）：穆勒拜仁生涯最后一舞，本菲卡需尽早确立优势

2025NBA选秀观察（三）：长臂投篮机器——艾斯-贝利

Here we go！国米新主帅浮出水面！竟是国米三冠王传奇！

[赛事简报] 法网女单半决赛：萨巴伦卡战胜斯瓦泰克，首进法网决赛

[赛事简报] 法网女单半决赛：高芙轻取布瓦松，将与萨巴伦卡争冠

步行者不仅拿下NBA总决赛首胜，还赢得了大部分NBA球迷的支持！

国足0-1印尼无缘世界杯，下届世预赛这些老将还应该被征召吗？

战术板（四）：变化无穷尽的奥秘——三角进攻

安切洛蒂巴西首秀闷平！厄瓜多尔0-0锁死维尼修斯，安东尼替补未登场

生死战今夜打响！哥伦比亚主场强攻秘鲁南美预选出线关键役