【中国的人工智能公司DeepSeek发布了更新版的人工智能模型,该模型在今年早些时候曾导致美国股市暴跌】
路透社报道——中国人工智能初创公司DeepSeek于周四凌晨发布了其R1推理模型的更新版本,进一步加剧了与美国竞争对手(如OpenAI)的竞争。
DeepSeek在开发者平台Hugging Face上推出了R1-0528,但尚未发布官方公告,也没有公布模型的描述或对比信息。
然而,由加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员开发的LiveCodeBench排行榜显示,DeepSeek更新后的R1推理模型在代码生成方面仅略低于OpenAI的o4 mini和o3推理模型,但领先于xAI的Grok 3 mini和阿里巴巴的Qwen 3。
据彭博社周三早些时候报道,DeepSeek的一位代表在一个微信小组中表示,公司已经完成了所谓的“小规模试验升级”,用户可以开始测试。
今年早些时候,DeepSeek打破了美国出口管制会阻碍中国人工智能发展的观点,该公司发布的人工智能模型不仅与美国领先的行业模型相当,甚至更好,且成本仅为美国模型的一小部分。
今年1月,DeepSeek发布R1模型后,中国以外的科技股在1月暴跌,这也挑战了“扩展人工智能需要巨大的计算能力和投资”的观点。自R1发布以来,中国的科技巨头如阿里巴巴和腾讯也发布了声称超越DeepSeek的模型。
谷歌的Gemini推出了折扣访问层级,而OpenAI则降低了价格,并发布了依赖较少计算能力的o3 mini模型。
尽管如此,DeepSeek仍被广泛预期将发布R1的继任者R2。路透社在3月援引消息人士报道称,R2的发布最初计划在5月。DeepSeek还在3月对其V3大型语言模型进行了升级。