先把写代码放一边,AI现在想要帮你完成软件工程的整个流程! 前不久刚刚被OpenAI以30亿美元收购的Windsurf宣布推出其首个AI软件工程模型家族。【图1】 不仅仅能够用于写代码,还能够用于优化处理终端操作、测试验证、用户反馈处理及长期工程规划等工作,目前包含三个模型: 1、SWE-1 工具调用推理能力接近Claude 3.5 Sonnet,但服务成本更低 推广期内付费用户可零积分/次调用 2、SWE-1-lite 更优质的轻量级模型,全面升级替代Cascade Base 所有用户(含免费)不限量使用 3、SWE-1-mini 极速响应的小模型 为所有用户提供Windsurf Tab被动交互体验 在离线评估中,SWE-1表现相当不错,在对话式SWE任务基准测试和端到端SWE任务基准测试中表现都接近前沿模型。【图2、图3】 这反应出模型能与用户较好地配合,很多活不用人插手就能自己搞定。 Windsurf之所以有勇气放言SWE-1将成为最优解,背后的秘诀在于他们的“流程感知”:在用户和AI的完整状态之间建立无缝的交互。 简单来说就是,AI在做啥,用户都能察觉到,然后采取行动,反之亦然。 在AI能够完全自己解决问题前,流程感知能保证AI出现错误时,能够迅速摇来用户进行修正,随后AI就能继续基于用户的调整进行工作。 这种无缝自然的控制权交替,正是人机协作的最佳形态。 技术博客:-wave-9-swe-1 更新日志:
先把写代码放一边,AI现在想要帮你完成软件工程的整个流程! 前不久刚刚被Open
量子位来谈科技
2025-05-16 13:13:35
0
阅读:40