【东方计算机】更新版DeepSeek-R1性能卓越,市场将对R2产生更高预期 DeepSeek-R1模型在5月28日进行了版本升级,虽然官方声称是“小版本升级”,但更新后的模型在数学、编程与通用逻辑等多个基准测试中取得了优异成绩,整体表现上与国际顶尖的o3与Gemini-2.5-pro相当。 新版本性能表现突出,继续维持最强开源模型地位 更新后的R1在各项基准评测中,全面超越Qwen3-235B模型,与Gemini-2.5-pro和o3这样的全球顶尖模型大致相当,按模型与独立API分析公司Artificial Analysis的分析,R1新版本超越xAI、Meta和Anthropic,与谷歌并列成为全球第二大人工智能实验室,并成为开源领域无可争议的领导者。 更强的推理与思维能力,以及幻觉改善、工具调用能力增强,将有助于AI应用迭代 此前DeepSeek模型幻觉率过高,一定程度上影响其实用性,此次迭代降低了幻觉率,叠加推理、思维能力的提升,以及工具调用能力的增强,R1将对各类Agent类应用形成更有力的支撑,有利于各类AI应用的迭代和落地。 后训练Scaling Law成立,后续V4、R2模型训练及应用需要更多算力支撑 据介绍,此次R1模型仍然使用24年12月发布的V3 Base模型作为基座,但在后训练中投入了更多的算力,从而实现了模型能力的提升,因此,后训练的Scalling Law继续成立,相信此后的V4、R2模型训练需要消耗更多算力。而R1-0528模型发布后,官网再次出现由于访问量太大而无法服务的情况,推理算力也将随着AI应用的发展而增长。 投资建议: 我们认为,此次R1-0528模型的更新,将有助于提升投资者对模型迭代进度的预期,近期对产业略显低迷的情绪将有一定程度修复,并对V4、R2模型的性能表现有更高的期待。 AI应用领域,建议关注税友股份、彩讯股份、卓易信息、鼎捷数智、合合信息、金山办公、汉得信息、每日互动、新致软件。 AI算力领域,建议关注海光信息、寒武纪、海南华铁、协创数据、品高股份、禾盛新材、首都在线、云赛智联、协创数据、铜牛信息。
“换掉我,我就揭发你的婚外情!”近日,美国一款AI竟然学会了勒索人类,还在未经许
【1评论】【4点赞】