Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了

admin 商品展示 2

最近的这段时期之内, 如果是仅仅去看谷歌所制作的宣传资料, 那么很大的概率上会让人觉得Gemini已然快要变成无敌的存在了。

对于视频生成而言有Omni, 在图片生成方面存在Nano Banana, Gemini 3.5的Flash性能要比3.1 Pro更为强劲, Gemini Spark能够助力你自动达成任务。从发布会直至官方博客, Gemini予人的感受仿若一位六边形战士, 几乎于每个方向均有进展。

实话说, 在前一阵子雷科技针对Google I/O展开报道之际, 已然给出了高度的赞誉声。然而经过了这段时间段实际使用过后, 小雷却是愈发感觉到Gemini 3.5 Flash表现欠佳。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第1张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:谷歌)

并非是那种在跑分方面表现欠佳的情况, 也不是能力处于垫底状态的那种, 恰恰相反, 它在诸多能力方面依旧是属于行业当中的最先进行列。

核心问题在于, 当宣传当中所提及的各类新功能切实落地到日常实际体验方面的时候, 总是会浮现出一种难以确切言明的别扭感受。你明明清晰知晓它具备很强的能力, 然而却始终感觉它并非那么易于使用;你明明明确知道诸多功能已然上线了, 可是却始终有种自己并未运用到的感觉。

在近期的大模型圈当中, 这种割裂感着实算得上不是很稀罕, 厂商所给予展示出来的是能力能够达到的上限情况, 而用户实际所接触接触收获到那却是实际的体验感受, 先前的那种情况是越发地令人感到惊艳, 然而后面的这种实际体验却不一定是跟随着同步去提升的。

Gemini 3.5 Flash, 它或许是这种矛盾极为显著的代表当中的一个, 存在着太多槽点, 让人不由得不倾吐心中所想, 实在是不吐就难以畅快。

额度、路由、能力,体验都更拧巴了

先说最容易感受到的问题。

额度。

在大会前夕, 也就是I/O 2026大会召开之前, 谷歌偷偷改变了会员订阅的额度规则, 原本是固定消息数, 这种固定消息数的规则被改成了基于计算资源的额度规则, 也就是基于计算资源的配额(compute-based quota)啦。

简而言之, 先前Gemini仅关注互动的次数, 而图像这一大模型的使用计数、视频这一大模型的采用核算、音频这一大模型的运用统计以及文字这一大模型的动用数量是彼此相互独立状的, 且每间隔二十四小时进行一次重置操作。

从体感方面来讲, Pro会员视频在一天之中能够生成5次, 在相同情况下, 它能够生成数量为50张的图片, 并且在此期间文本是根本用不完的。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第2张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

修改过后, 谷歌既设定了每周要有限额, 又设置了每五小时就会重置的临时限额。

当下, 所有的任务用量, 都会与Token消耗等一块儿进行计算 , 倘若使模型思考得较为多, 那么即便它给予你的回复内容并未改变, 所花费的钱也会比之前更多。

问题是开云真人app,开云真人app地址开云app官方最新下载,我怎么知道一个任务会让模型消耗多少算力?

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第3张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

不但如此, 先前按照类别区分的各个功能, 如今都归并为这个用量限额的一部分, 不管是视频, 还是图片, 亦或是深度研究以及Agent, 只要其中一项功能耗尽限额, 接下来的几个小时你就别指望能做别的事情了。

按照我自身的体验经历来说, 使用Omni Flash去生成一个视频, 大概会耗费Pro订阅的三分之一额度, 要是期望对视频进行修改, 那么起码得用到Pro订阅的二分之一额度, 真的是不够使用的。

比额度更影响体验的开云app官方入口网站,其实是路由问题。

这并非是我个人的感受, 最近有不少用户都碰上了类似状况, 早先正常生成图片, 然而聊着聊着, Gemini忽然开始表明自己不能生成图片, 直接告知你自己仅仅是一个文本模型, 对于这类任务毫无办法。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第4张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

最搞笑的是,甚至会出现仅提供文本不出图的情况。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第5张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

这种状况偶尔发生时还能够被理解, 然而当频率升高以后, 用户实际上很难确切弄明白究竟是功能丧失效力了, 还是模型转换错误了。

能力层面其实也有类似的问题。

双子座三点五版本的闪存所带来的感受一直以来都是具备一定能力去完成, 然而却常常在执行过程中表现得不够稳健。面对同一道数学题目或者推理类型的题目, 有时给出的回答堪称相当出色, 可是间隔了几个小时之后再次打听询问, 最终呈现出来的结果或许会全然不一样。

我对几道经典逻辑题做过测试, 好多时候, 其前面的分析进程不存在问题, 推导的链条看上去也极为完整, 然而到了最后的那一步, 常常会出现一些令人费解的失误。最荒唐的是, 它还尤为自信, 答案错误了, 语气却丝毫没有改变。

至于更简单的计算题,该错还是错。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第6张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

明白, 这类状况于聊天而言不会造成太大损害, 然而要是放置到学习、工作乃至编程情境之中, 所占据、引发的效应就全然不同了。

好的AI价格只会越来越贵?

要是讲前面那些问题归属于体验方面, 那么更深层次的问题实际上源自谷歌近期的产品以及定价策略。

要我说,今年谷歌最喜欢讲的故事就是Agent。

发布会过后直至官方的宣传阶段, 差不多所有方面的重点, 皆是围绕Gemini Spark进行的。它能够自动去搜索相关资料, 对各类信息予以整理, 还可以执行各种任务, 甚至能够协助用户达成跨应用的操作, 这样听来看上去就是确实具有十足的未来感, 并且也十分契合大家对于Agent的通常想象状况。

问题在于, 你Gemini Spark居然得是Ultra订阅用户才可以使用, 该订阅的起始价格是每个月99.99美元, 最高级别的订阅在限定时间内的价格是每个月199.99美元(大约是1352.98元)。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第7张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

需清楚, 只花每月二十美元, 就能启用, OpenAI以及那堪称天下无敌的Codex。

于是, 便出现了一种颇为有意思的现象, 大家在观看发布会之际, 觉着Gemini堪称天下无敌, 然而, 当打开产品之后, 第一眼所看到的竟然是升级按钮。

比起功能缺失, 这种落差实际上是更易于对口碑产生影响的, 原因在于用户清楚能力是存在着的, 并且也明白效果是挺好的, 然而自身却恰恰无法碰到。

至于编程的价格,其实也没便宜到哪去。

嘿, 你得清楚, 于I/O 2026大会之上, 谷歌首席执行官皮查伊可是丝毫不曾少提Gemini 3.5 Flash的成本方面的优势哟!

按官方定下的价格标准, Gemini 3.5 Flash在每百万输入Token这块, 收取费用是1.5美元, 然后对于每百万输出Token, 收取的费用为9美元;与之形成对照来讲, Claude Opus 4.7它在API定价方面, 针对每百万输入Token所收费用为5美元, 而GPT - 5.5 Pro呢, 更是直接达到了每百万输入Token需要收费30美元。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第8张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

单看价格表,确实便宜不少,甚至有一种薄利多销的味道。

但价格表此物, 仅作观赏即可, 对于那些确确实实使用模型之人而言, 更为关键的是, 针对完成同一任务究竟需耗费多少资金, 此因素至关重要。

人工分析在智能体评测当中做过合计, Gemini 3.5 Flash跑完一整套任务所需成本超出1500美元, 然而Gemini 3 Flash花费还不到300美元, 两者差距径直达到五倍以上, 哪怕是跟Gemini 3.1 Pro比较, Flash的总体成本也高出不少, 甚至比GPT-5.5还要贵。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第9张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

问题出在哪?

答案很简单:太能聊了。

于Agent测试当中, Gemini 3.5 Flash平均达成一个任务所需的进程要近乎50轮对话, 然而众多竞品仅二十来轮便已结束。切莫轻视这几十轮的差距, 每开展一次全新对话之际, 模型均需再度读取出之前的历史记录, 轮次越多, Token消耗得就越快。

就如同打车那般, 每公里单算的费用着实低廉, 然而却禁不住你围着城区绕上三圈。到了最终结算款项之际, 用户所看到的始终是总的价钱, 而非开始时的起步价。

AI新矛盾:发布强的起飞,使用持续降智

归根结底, 我并非认为Gemini 3.5 Flash是个失败的模型。

实际上, 它仍旧归属于行业第一梯队范畴之内, 其多模态方面具备的能力依旧是十分强大的, 视频生成所展现出来的水平依旧称得上不错, 于搜索整合这一元能力而言, 那依旧是Google所擅长的拿手本事, 众多单独的单项能力, 要是放置到整个行业当中去审视的话, 那么依旧是相当具有竞争力与优势的。

问题在于, 用量限额被强制进行了缩水, 并且, 因为算力短缺, 降智问题频繁出现标点符号。

Gemini 3.5 Flash实测翻车?别被谷歌宣传骗了-第10张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

(图源:雷科技)

不管谷歌怎样去宣传, 一般用户不太在意排行榜, 也罔顾Gemini 3.5 Flash到底省多少算力, 他们在乎的是能否顺利地完成任务, 能否稳定地输出结果;能否不必去研究繁复的规则, 还不用担忧额度何时猛然间归零。

这也是为什么最近越来越多人开始怀念某些老版本模型。

大约半年之前, Google AI Studio会给免费用户每日发放50次Pro模型交互量, 这实在令人唏嘘不已, 真让人万般感慨。

对于Gemini来说,未来最大的希望依然是Agent。

毕竟, 谷歌具备全行业里最为完整的生态资源, 只要在未来, 真的可以打通搜索, 邮件, 日历, 文档以及安卓系统, 使得Agent帮用户去完成更多真实任务, 那其依然是存在机会去建立起其他厂商难以复制的优势的。

仅仅是在当前这个阶段, 小雷对于Gemini 3.5 Flash所给出的评价明显无疑是不会发生改变的。

标签: AI 谷歌 评测 体验 价格

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~