前两天,豆包AI有了一项新能力。你可以和它视频通话,还能把屏幕上的内容共享给它看

智远行业评论 2025-05-28 07:52:51

前两天,豆包AI有了一项新能力。你可以和它视频通话,还能把屏幕上的内容共享给它看,它能理解你正在做什么。 这不仅是技术的进步,也意味着人和机器的配合方式发生了变化。AI不再只是被动地等你输入信息,变成了一个可以“看见”你工作的助手。 从商业角度来看,这项功能有几个值得关注的地方。其一,这是交互方式的一次大升级。 以前我们用电脑,是靠点击、滑动这些操作来完成的,这种方式叫图形界面(GUI)。现在豆包能“看懂”屏幕内容,这是一种新的交互方式。 这种变化有点像当年从键盘变成触摸屏那样重要。同时,AI不仅能看,还能记住你常用的内容,比如微信里的专业术语、Excel表格里的数据关系;这样,它就能更懂你在做什么,慢慢变成某个领域的专家,而不是一个通用工具。 其二,我认为很多行业可能会发生变化。 在办公中,AI可以同时分析文档、代码、设计图。比如:金融分析师看K线图时,AI可以帮忙预测走势;作家写文章时,AI还能给出续写建议。这种能力可能催生一种新服务模式,叫做“屏幕即服务”。 教育和医疗也会受到影响。比如:学生做题时,AI能看到他们的解题过程,不再只是看最后答案对不对;医生在看CT片时,AI也能帮忙标注重点,这样一来,远程教学和远程诊断就会变得更高效。 但与此同时,隐私问题也变得更加重要。屏幕是我们最私密的信息来源之一。现在AI能“看到”这些内容,就带来了隐私风险。企业和用户需要找到一个平衡点。 有些行业可能只允许AI看一部分内容,或者通过一些技术手段,让数据使用更加透明。 用户也可能担心AI“窥探”自己的行为。这时就要一些控制机制,让用户清楚知道AI能看到哪些内容,不能看到哪些内容。 科技公司之间的竞争也在加剧。谁能掌握屏幕这个入口,谁就更有机会赢得市场。微软已经在Office里加入AI助手,谷歌则专注于网页内容识别。 而豆包的做法是“全屏接管”,这可能会促使操作系统厂商开放更多权限;将来还可能出现专门的硬件设备,比如带有AI芯片的显示器,或者用AR眼镜来看懂三维空间里的内容。这会带来新的硬件生态。 这件事也引发了一些深层次思考。当AI能一直“看着”我们的工作状态,甚至能感知情绪变化,我们就得考虑一些问题了。比如,AI会不会影响我们的思维方式?如果太依赖它的建议,会不会失去创造力?

0 阅读:4
智远行业评论

智远行业评论

感谢大家的关注