【AIGC日报】2025.5.29 | 今日要闻速览: 1. DeepSeek R1模型完成小版本升级,功能优化细节待用户体验 2. 中科院发布天文耀发预测大模型FLARE,恒星耀发预测准确率超70% 3. 腾讯元宝接入微信读书和起点读书,新增流程图生成功能 4. Anthropic为Claude推出语音对话功能,支持英语实时交互 文章配图:Midjourney生成,测试版本:V7; 风格--sref 2186723411,标签:--sref 2186723411;我推荐在插画风格中使用。 1.DeepSeek R1 模型完成小版本试升级 DeepSeek 通过官方交流群宣布,R1 模型已完成小版本试升级,用户可通过官方网页、App 和小程序进行测试,API 接口及使用方式保持不变。 本次更新未公布具体优化内容,需用户自行体验。 来源:IT之家 2.我国推出天文耀发预测大模型 FLARE 中国科学院自动化研究所与国家天文台联合研发出天文耀发预测大模型 FLARE,旨在攻克恒星耀发预测难题。该模型通过整合恒星物理属性(如年龄、自转速度)和历史耀发记录,结合软提示模块与残差记录融合模块,显著提升了光变曲线特征提取能力。 实验采用7160颗恒星的高精度光变曲线数据,FLARE 在准确率、F1值等指标上表现优异,准确率超70%,优于传统MLP、RNN、CNN等模型。其强适应性可精准预测不同恒星及同一恒星不同变化模式下的耀发事件,为探索系外宜居行星和宇宙奥秘提供新工具。 来源:IT之家 3.腾讯元宝打通微信读书、起点读书,搜索可跳转阅读 腾讯元宝宣布与微信读书、起点读书实现功能打通,用户通过搜索可直接跳转至对应平台阅读内容。 该功能已在腾讯元宝 2.18.0 版本中上线,同时新增个性化指令库、自然语言生成流程图等功能,并支持通过 Mermaid 和 UML 进行流程图渲染。 来源:IT之家 4.Anthropic 为 Claude 推出语音对话功能 Anthropic 公司宣布为其 Claude 聊天机器人推出测试版语音模式,用户可通过语音进行完整对话,并支持英语实时交互。 该功能由 Claude Sonnet 4 模型驱动,提供五种语音选项,用户可随时切换文本/语音模式,对话结束后可查看记录和总结。语音对话将计入常规使用限额,免费用户预计可进行 20-30 次对话。 付费订阅用户可使用 Google Workspace 连接器,访问日历和邮件服务(Google Docs 集成仅限企业计划)。 目前 OpenAI 等公司已推出类似功能,但 Anthropic 新增了多语音选择和文档讨论能力。 来源:IT之家 5.Meta 拆分 AI 部门为两大团队,聚焦消费产品与 AGI 研究 Meta 宣布将 AI 部门重组为两大团队:AI 产品团队负责 Facebook、Instagram 等平台的 AI 功能及独立应用开发;AGI Foundations 团队专注通用人工智能基础研究,包括优化 Llama 模型。 此次重组旨在应对 OpenAI、谷歌等竞争对手的技术挑战,未涉及裁员。Meta 近期推出“Llama for Startups”计划,支持初创企业开发生成式 AI 应用,并通过 LlamaCon 活动展示技术布局。 来源:IT之家 6.字节跳动内部将禁用第三方AI工具,改用自研Trae替代 字节跳动安全与风控部门发布邮件称,为防范数据泄露风险,自6月30日起将分批次禁用Cursor、Windsurf等第三方AI开发软件,并启用自研编程助手Trae作为替代方案。 Trae国内版搭载Doubao-1.5-pro模型,支持切换DeepSeek R1和V3模型,提供代码补全、Bug修复及自然语言生成代码功能。其全新Builder模式可通过自然语言描述端到端生成应用,帮助开发者快速搭建项目框架。 海外版Trae此前已集成GPT-4o和Claude-3.5-Sonnet模型。 来源:IT之家 7.腾讯开源语音数字人模型:图片+音频生成动态视频 腾讯混元宣布开源语音数字人模型 HunyuanVideo-Avatar,该模型由腾讯混元视频大模型与腾讯音乐天琴实验室 MuseV 技术联合开发。用户仅需上传人物图像和音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持多景别、多场景应用,适用于短视频创作、电商广告等领域。 目前单主体能力已开源,用户可通过腾讯混元官网体验,支持14秒内音频生成视频,后续将逐步开放更多功能。 来源:IT之家 AI创造营[超话]德里克文ai日报
【AIGC日报】2025.5.29|今日要闻速览: 1.DeepSeek
低价影视
2025-05-29 15:19:36
0
阅读:7