谷歌隐式缓存降低四分之三AI使用成本GeminiAPI用自动缓存让AI更省钱被吐

量子位看科技 2025-05-09 11:24:15

谷歌隐式缓存降低四分之三AI使用成本GeminiAPI用自动缓存让AI更省钱

被吐槽显式缓存成本太高之后，谷歌决定推出“隐式缓存”功能。

谷歌在Gemini API中推出的“隐式缓存”功能，适用于最新的Gemini 2.5 Pro和Gemini 2.5 Flash模型，能在“重复上下文”时节省75%的成本。

谷歌在官方博客中解释：“当你向Gemini 2.5系列模型发送请求时，如果该请求与之前的请求有共同前缀，就可能触发缓存命中，节省的成本会自动返还。”

触发隐式缓存的门槛较低：

- Gemini 2.5 Flash：至少1024个token

- Gemini 2.5 Pro：至少2048个token

缓存技术原本就是AI行业常用的降本手段，比如存储常见问题的答案，避免重复计算。

此前谷歌提供的显式缓存需要开发者手动设置高频提示词，而隐式缓存则是全自动运行，在Gemini 2.5系列模型中默认启用。

不过，TechCrunch等媒体也指出，鉴于谷歌此前关于缓存节省成本的承诺曾引发争议，这项新功能存在几点需要警惕之处：

1. 谷歌建议把重复内容放在请求开头，变动内容放末尾，以提高缓存命中率。

2. 目前没有第三方验证隐式缓存的实际节省效果，需观察早期用户反馈

因此，若开发者希望确保成本节约，仍可继续使用支持Gemini 2.5和2.0模型的显式缓存API。

0 阅读：1

猜你喜欢

为啥苹果死活要赖在中国生产？说出来你可能不信，根本就不是图便宜。你看看郑

为啥苹果死活要赖在中国生产？说出来你可能不信，根本就不是图便宜。你看看郑

【8评论】【16点赞】

苹果供应链管理

美国寻求强制剥离谷歌广告技术产品。美国司法部这次对谷歌的强制分拆令看似重拳

美国寻求强制剥离谷歌广告技术产品。美国司法部这次对谷歌的强制分拆令看似重拳

Google 美国司法部司法部

划重点！从操作系统内核、文件系统，到编程语言、人工智能框架和大模型等全部实现自研

划重点！从操作系统内核、文件系统，到编程语言、人工智能框架和大模型等全部实现自研

【1评论】【2点赞】

编程人工智能华为

谁还敢用美国芯片？英媒又曝出了一件事……难道要上演“美国芯片·全面沦陷”的一

谁还敢用美国芯片？英媒又曝出了一件事……难道要上演“美国芯片·全面沦陷”的一

【2评论】【2点赞】

ai芯片人工智能英伟达英特尔 it芯片人工智能

人工智能潜力无限值得关注

人工智能潜力无限值得关注

【3点赞】

人工智能恒信东方皖新传媒海康威视

【路透社：华为5月大规模出货新AI芯片昇腾910C，替代英伟达芯片】据外媒报道

【路透社：华为5月大规模出货新AI芯片昇腾910C，替代英伟达芯片】据外媒报道

【1点赞】

英伟达华为芯片 ai 互联网公司 it芯片人工智能

苹果iOS18.5即将推送：新增动态彩虹壁纸，系统优化实用升级！苹果近日在发布

苹果iOS18.5即将推送：新增动态彩虹壁纸，系统优化实用升级！苹果近日在发布

【1评论】

苹果 iOS 壁纸

量子位看科技

感谢大家的关注

作者最新文章

1

格灵深瞳发布新亿级数据集格林深瞳助力CLIP刷新SOTA新的亿级大规模图文对数据

2

Gemini也会玩宝可梦Gemini收集到第八个道馆徽章会玩宝可梦的不止Clau

3

陈丹琦在ICLR上主题演讲如何在学术预算下训练语言模型计算资源不足、数据访问受限

4

论文一键转代码论文代码复现工具PaperCoder：论文转代码工具，专治未公开代

5

马斯克筹200亿还债马斯克为新公司筹资200亿美元马斯克筹资200亿刀乐还债？彭

6

数学家们仍在追赶天才拉马努金数学鬼才靠托梦推出4000个公式如果有这么一个人，写

7

今年是AI应用创业最佳时期不到2年，AI PPT赛道第一！像素绽放CEO赵充今

8

o3新玩法火了AI看照片判断地点仅靠一张照片，就能判断出拍摄的地点？这个挑战曾一

9

中年发福真正原因中年发福并非代谢变慢中年发福的真正原因，并非基础代谢变慢？《科学

10

DeepSeekR2最新爆料DeepSeekR2成本下降97.3%DeepSee

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的

2

目前接近完美的6部手机，有你在用的嘛？

3

这么老的苹果还在用

4

上强度了！某些APP装傻充愣，就是不兼容鸿蒙系统，死抱着安卓。工信部看不过眼了，

5

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

6

手机续航排行榜！便宜手机电池越来越大，这是什么套路？手机

7

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

8

刚刚！#一加13T#首销10分钟破两亿！这手机我也用了几天，最大的感受是真爽，单

9

预算2000元适合买什么手机？这次机型供参考，性价比和当年小米1999不相上下。

10

2025年国产四款手机对比：性能与拍照大比拼！你更喜欢哪款手机拍照呢？

科技最新文章

1

华为荣耀得罪谁了，为啥一直被抹黑？荣耀Power首发8000毫安电池，两天充

2

今年5月将推出鸿蒙电脑，以下是一些与鸿蒙电脑相关的上市公司及概念股：（内容来自网

3

1万毫安电池的手机这就要来啦？真我这可太猛了，居然搞出了10％硅含量，能量

4

小米才卖了三天就直接冲上榜一了这要是统计turbo4pro一周的数据，得有多猛？

5

前面说小米智驾免费，华为智驾收费一万，被喷惨了。可是这些人有没有想过，选小米S

6

在新评科技的手机续航测试排行，荣耀Power断崖式领先。当看到这个，它不止简直

7

2025年国产四款手机对比：性能与拍照大比拼！你更喜欢哪款手机拍照呢？

8

惊呆了！英伟达突然宣布！宁愿冒着亏损55亿美元的风险，也要和我们做抵抗

9

目前接近完美的6部手机，有你在用的嘛？

10

整个行业给雷军陪葬了。交通部新规刚落地三天，华为直接掀了桌子。央视直播镜