DeepSeek跃居全球AI第二
1. 模型排名与性能
DeepSeek R1 0528版在Artificial Analysis智力指数中得分68分,与Google Gemini 2.5 Pro并列全球第二,仅次于OpenAI o3。关键提升包括:数学竞赛(AIME 2024)涨21分、代码生成(LiveCodeBench)升15分、科学推理(GPQA Diamond)升10分、人类推理考试升6分。
2. 技术优化与架构
模型参数保持671B(有效37B),未改架构,性能提升源于强化学习(RL)优化。RL计算效率高于预训练,适合资源有限团队。推理深度增加,评测任务消耗9900万token(比前版多40%)。
3. API支持与提供商对比
Fireworks(253 t/s)和Parasail(118 t/s)速度领先;Deepinfra延迟最低(0.29s)。价格方面,Deepinfra输入token成本最低($0.50),Hyperbolic输出token成本最低($2.00)。上下文窗口最高支持164k(Nebius等)。
4. 行业影响与评论
开源模型与闭源差距缩小,中美AI实力趋近。网友热议RL的高效性及开源进展,部分期待函数调用支持。DeepSeek在无顶级芯片下实现突破,强化学习成关键。
5. 未来展望
强化学习推动智能提升的趋势明显,开源生态加速竞争。下一轮评测或验证模型持续潜力,技术优化与成本控制仍是焦点。