理想 AI talk 第二季 信息整理记录
因内容较长,所以分为几个部分,此为 「一 李想对 DeepSeeK 的看法」
1.距离上次的 AI talk 过去130天,最大的进步是什么?
-我觉得这 130 天我觉得我更高兴看到的是整个中国的进步,包括DeepSeek,包括千问在内的,可以让中国无论是基座模型,还是 reasoning 推理模型,还是后边的多模态,已经跟美国的距离基本上拉近了,或者基本上在一个水平线上了。
而且中国的企业做出来这些模型效率也更高,无论是在预训练上,在训练的层面,还是在后边的整个推理层面,我们做了很多的深层的工程的改造。我觉得也让整个的中国的人工智能领域更有信心。
如果从我们自己个人而言,这也树立了我们把 AI 做得更好的这个信心。今天大家在讲语言模型,但我还是认为语言模型只是世界的一个重要的组成部分,但并不是全部,我们要想去理解物理世界,我们要想让一个终端或者一个机器人能够在物理世界和数字世界里运行,其实要做的工作还有非常多。
我觉得这个其实是让我们也更加坚信,这条路走下去是对的。
2. 那你有变成一个更智能的李想吗?
-我觉得没有那么大的变化。如果从实际的角度而言,人工智能发展这么好,但我每天工作时间并没有减少,还是在增加。
3. 这是为什么?
-我见到的几乎所有人,其实还是在把它(AI)当成一个信息工具来使用,其实AI作为一个信息工具不是完美的,因为它最后一定要给你个next token(下个词元),一定要给你一个结果。而且大家今天使用的时候会先点上联网搜索,先去通过Rag(检索增强生成)联网搜索一些索引信息。但往往其实索引的信息源,就已经失真和不准确了,所以最后推理的过程,(虽然)很认真地在做推理,但是你明显都看到这个过程和结果已经开始有问题了。所以某种程度而言,如果我们不对这套机制进行一个改造的话,它某种程度仍然是在做熵增,在增加大量的无效信息、无效结果、无效结论。
它(AI)确实比原来的使用体验会更好了,但它是个辅助的工具。
AI 什么时候才能真正改变我们的工作的成果以及减少我们的工作时长?我觉得它必须变成「生产工具」。
我自己认为Agent(智能体)最重要的评判条件是它是否是个生产工具、它是否真正能替代我去完成专业的工作、它是否真的在产生有效的生产力、它是否真的在解决我工作中那最重要的 8 小时的时间。
这是是我接下来对Agent(智能体)最重要的衡量,也是我觉得Agent(智能体)的意义所在。
「我觉得人工智能变成生产工具,然后才是真正人工智能爆发的时刻。」
4. 所以最过去130天其实最大的变化是外部的环境?
-对,国际环境在发生重大的变化。然后技术也在发生变化,但技术最大的变化还是中国在人工智能方面带来的变化。美国的变化反而没那么大。
5. 你从DeepSeek身上学到了什么?
- DeepSeek 极简的运用了人的最佳实践。DeepSeek给你展示了一个最佳实践,第一步一定要先搞研究。搞完研究以后其实才搞研发。然后搞完研发以后,第三步是要把能力表达出来。然后第四步是能力变成业务的价值。这四个步骤是个极简的人类最佳实践,但我们经常做着就忘掉了。
包括你可以看国外的像李飞飞,其实她在引用辅助驾驶的时候,也经常会引用我们的关于辅助驾驶方面的这些研究的论文。那我觉得这个其实挺重要。那研究跑通了以后,研发效率会变得非常的高。但是研发又非常在意价值,他能够把价值表达出来,然后变成业务,那我觉得这是一个很重要的过程。
6. 在 DeepSeek 全球爆火的时候,你这个春节是怎么过的?
-春节过得挺好的,还带着孩子去看哪吒2。我印象中DeepSeek R1 是1月20号上线的,然后到后边开源,我们也在研究DeepSeek很多东西为什么做得好,包括整个的训练和推理的效率,也包括这些一个MoE(混合专家模型)模型部署上去对内存占用的这些挑战。
那比较有意思的一点是,我没有上来敢跟模型团队直接聊,我先跟谢炎(理想汽车CTO)聊了一下,我们自己预测的我们到9月份做的模型,能力是否比DeepSeek V3加R1更强?我说至少我听到你们说的东西,我说不如那个强,对吧?
而且它开源开得如此的彻底,我们是否应该基于它的开源,去做我们的 VLA 的L(language 语言)的部分,并且我们基于这个L(language 语言)的部分,比如说其实我在理想同学用的话可能就是个VL(视觉和语言),它没有A(action 行动),对吧?就把vision(视觉)和language(语言)其实放在一起,包括要做成端到端的,然后语音的这样的一个方式。
我们原来本来应该是9月份以后才能做这些工作,我们是否应该站在巨人的肩膀上就去做了?然后谢炎(理想汽车CTO)说肯定应该这么做。
那时候我们比较担心陈伟(理想汽车基座模型负责人)会怎么想,因为这个压力是挺大的。然后我们发现陈伟比我们还坚决。他说这个会加速我们往下一步的这个工作,我们应该以这个为基础,加速VLA(视觉语言行动模型),加速端到端的多模态这样的一个进展,然后研究团队也都在研究我们如何在芯片上也跑到同样的训练和推理的效率,大家都在同步地进行工作。
整个拥抱DeepSeek的这个过程比我们想象得要快,所以这是今天其实我们VLA(视觉语言行动模型)推出的速度也会比原来的预期的要快。
7. 你怎么看梁文锋(DeepSeek创始人)?你觉得他是怎么找到你说的这个人类最佳实践呢?
-我只跟他聊过一次,是去年的9月份,印象特别深,应该是ChatGPT的o1发布前的几天。我自己个人感觉,两个特点,第一他是个特别自律的人。明显你跟他沟通的过程中其实能够看到,第二个是我个人认为其实他是会在全世界范围之内去研究和学习最佳实践和最好的方法论的这样一个人。
8. 怎么理解自律?
-我觉得自律的最大特点就是「能够坚守这些你相信的东西 ,能够坚守这些最佳实践,能跟人性的一些懒惰、走捷径,这些方面做对抗」。
我觉得DeepSeek的出现对我们加速做VLA(视觉语言行动模型)是巨大的帮助。过去我们打算要到今年年底才能做出一个像样的,能够满足我们需求的语言模型,但DeepSeek一开源,我们就加速了 9 个月的时间,所以我们就把自研的整车操作系统理想星环OS给开源了。
没有大家想的那么复杂,我自己内心,包括谢炎(理想汽车CTO)的内心就是DeepSeek给我们带来那么大的帮助,我们应该给对社会贡献点什么,不让行业那么卷。说白了纯粹是感谢DeepSeek。
9. 你有没有想过DeepSeek为什么不是你做的?
-我觉得我只能做最好的自己。
我的人生经历,从最开始做个人网站,到做产品的IT网站,到做汽车网站,最后希望能够改变汽车行业,推出更好的产品,汽车叠加下一代的信息技术。这个其实是我的一个延长线。他(梁文锋 DeepSeek创始人)的延长线其实就是从人工智能开始的,他在浙大学的就是人工智能,那是他的延长线。
本身我也相信,量化交易的公司,对于整个模型的能力,对模型的理解,对于本身工程的能力,不会比任何互联网公司差,甚至可能还要更强。
理想 AI Talk第二季