DeepSeek新模型被指套壳DeepSeek新模型疑似借鉴Gemini
DeepSeek新模型疑似用Gemini训练?
最近,DeepSeek发布了新版R1模型“R1-0528”,在多项数学和编程测试中表现不错。但模型刚上线没多久,就被国外开发者质疑“训练数据可能来自Google Gemini”。
据TechCrunch报道,虽没有直接证据能实锤这件事,但相关模型分析图和语言特征对比图已经引发不少讨论:
- 博主Teortaxes表示,在“Slop Landscape”分析图中,DeepSeek-R1-0528与Gemini多个版本模型聚类非常接近;【图1】
- 博主Sam Paech发现,DeepSeek-R1-0528的关键词、短语习惯也明显偏向Gemini的风格,比如喜欢用“flickered”“unblinking”“feels like”等表达;【图2】
- 模型生成的“推理轨迹”也被指出“非常像Gemini的风格”,甚至有开发者直接评价:“这就是Gemini的思路在说话”。【图3】
- 博主Nathan Lambert说,“如果我是DeepSeek,我也会这么干。他们(DeepSeek)资金充裕,但GPU资源短缺,这就相当于借用别人的算力。”【图4】
不过,现阶段各大模型的语言风格趋同其实不罕见,原因之一是网络训练语料本身已被大量AI生成内容“污染”。换句话说,从其他渠道获取的数据,其来源仍然有可能是AI生成。
截至目前,DeepSeek方面尚未对这波争议作出回应。而Gemini团队也暂无公开评论。