中国 DeepSeek 发布 R1 推理模型更新
路透社 中国人工智能初创公司 DeepSeek 于周四凌晨发布了其 R1 推理模型的更新,进一步加剧了与美国竞争对手如 OpenAI 的竞争。DeepSeek 在开发者平台 Hugging Face 上推出了 R1-0528,但尚未进行正式公告或发布模型描述。
根据加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员开发的 LiveCodeBench 排行榜,DeepSeek 的更新模型在代码生成方面仅略逊于 OpenAI 的 o4 mini 和 o3 模型,领先于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。今年早些时候,DeepSeek 的发布挑战了有关美国出口管制抑制中国人工智能发展的观点。
自 R1 发布以来,阿里巴巴和腾讯等中国科技巨头也推出了声称超越 DeepSeek 的模型。DeepSeek 预计将推出 R1 的继任者 R2,原定于 5 月发布。