DeepSeek跃居全球AI第二1.模型排名与性能DeepSeekR1

春蕴评趣事 2025-05-30 19:20:36

DeepSeek跃居全球AI第二

1. 模型排名与性能

DeepSeek R1 0528版在Artificial Analysis智力指数中得分68分,与Google Gemini 2.5 Pro并列全球第二,仅次于OpenAI o3。关键提升包括:数学竞赛(AIME 2024)涨21分、代码生成(LiveCodeBench)升15分、科学推理(GPQA Diamond)升10分、人类推理考试升6分。

2. 技术优化与架构

模型参数保持671B(有效37B),未改架构,性能提升源于强化学习(RL)优化。RL计算效率高于预训练,适合资源有限团队。推理深度增加,评测任务消耗9900万token(比前版多40%)。

3. API支持与提供商对比

Fireworks(253 t/s)和Parasail(118 t/s)速度领先;Deepinfra延迟最低(0.29s)。价格方面,Deepinfra输入token成本最低($0.50),Hyperbolic输出token成本最低($2.00)。上下文窗口最高支持164k(Nebius等)。

4. 行业影响与评论

开源模型与闭源差距缩小,中美AI实力趋近。网友热议RL的高效性及开源进展,部分期待函数调用支持。DeepSeek在无顶级芯片下实现突破,强化学习成关键。

5. 未来展望

强化学习推动智能提升的趋势明显,开源生态加速竞争。下一轮评测或验证模型持续潜力,技术优化与成本控制仍是焦点。

0 阅读:71
春蕴评趣事

春蕴评趣事

感谢大家的关注