Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了

admin 商品展示 3

xAI推出了Grok 4.3, 却并未将声势提升至最高限度, 就连马斯克都未曾专门发布推文, 如此看来似乎仅仅是一个处于过渡阶段的版本而已。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第1张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

https://x.com/elonmusk/status/2045590599206875216

将模型投放至 API 里, 把价格予以下调促使其降低, 对所欠缺的工具能力加以补充, 告知着开发者能够从旧版 Grok 那儿迁移过来, 这仿佛是一次很安静的产品换挡。

不仅不存在AGI宏大叙事, 而且还缺失了马斯克那类的「即将变革一切」这种状态。正因为如此, 反倒致使Grok 4.3看上去更为真切。

对于普通消费者而言, Grok 4.3 最为关键的改变, 并非在于某个榜单的分数提高了些许, 而是其中的 AI 助手开始于价格方面变得越发低廉, 以及于速度层面表现得更为快捷, 并且在呈现形式上愈发接近于一个能够为人完成文件、表格、演示文稿的合格助手。

然而, Grok 4.3所具备的聪明程度, 依旧没有追赶上, GPT - 5.5以及Claude Opus 4.7。

它是一款性价比很强的新模型,也是一款仍有明显天花板的模型。

对于消费者实际必须去关心留意的, 是它于哪些场景之中能够实现省钱以及省时间的目的, 而在另外哪些场景之下, 会由于判断不够精准、思考时间过长或者表述过多, 进而反倒致使成本上升。

它确实变强了

尤其像一个更会干活的助手

Artificial Analysis, 将Grok 4.3的Intelligence Index, 打到了53分, 它比Grok 4.20 0309 v2高4分, 并且, 它还超过了Claude Sonnet 4.6以及Muse Spark。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第2张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

这般提升并不算是微小的, 特别是在xAI自身的模型系列当中, Grok 4.3现阶段已然处在最强的那一批次里, 是那一档的存在。

更值得看的是代理任务表现。

Grok 4.3得了1500 Elo于GDPval - AA这个地方, 相较于Grok 4.20 0309 v2所获得的1179而言, 它提升了321分, 是这样的一种情况。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第3张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

, 这个榜单, 更为贴近日常「让AI做事」的情形, 像是整理文档, 又或是执行繁杂流程, 再有就是处理真实工作流程, 这对于普通使用者来讲, 是具有现实意义嗯。

让人工智能帮忙撰写周报, 搭建表格, 制定方案, 拆解会议纪要, 生成演示文稿, Grok 4.3展开运用时候的体验会比前代更加完善无误。

Grok 能够创建演示文稿, 还能够创建文档, 也能创建电子表格, 能够在一个计算机环境当中写代码, 能够在该计算机环境运行代码, 此外能在这个计算机环境里面安装依赖, 并且能够由此产出文件。

对于那些不懂得代码的用户而言, 这有着这样的意义, 许多原本得在Excel、PowerPoint以及浏览器之间反复进行切换的操作, 极有可能会被压缩为一句指令。

这同样是AI消费级产品切实应展开竞争的所在, ——用户更为关注的是, 它可不可以将一份报销表完成, 把一份旅行计划条理清晰地排妥当, 把一封语句通顺、语气合适的邮件书写出来。

Grok 4.3 在这部分的进步,是真进步。

更便宜

是这次最直接的产品卖点

Grok 4.3 的价格很有侵略性。

它的API价格, 是每百万输入Tokens为1.25美元, 每百万输出Tokens为2.50美元, 与Grok相比, 输入价格低了约40%, 输出价格低了约60%。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第4张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

经人工分析测算得出, 运行一整套智能指数评测所需要的成本大约是395美元, 相较于Grok 4.20 0309 v2而言, 这种成本算下来的金额还低了大概20%。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第5张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

这会影响消费者,只是方式没那么直观。

不是大多数的普通人会直接去调用 API, 然而那些基于 API 所构建的产品, 他们皆是会去使用的。

为模型调用付费, 体现在 AI 写作工具背后, 体现在客服机器人背后, 体现在语音助理背后, 体现在教育应用背后, 体现在办公插件背后。

在底层模型价格出现下降的状况下, 应用厂商便拥有了降低订阅费的空间, 要么是在同样的价格条件下能够提供更多的使用次数, 要么是能够提供更长的上下文内容, 要么是可以应对更复杂的任务。

Grok 4.3 还有一个优势是速度。

xAI模型页所展示的Artificial Analysis提示该模型是xAI目前当中输出速度最快那些里面的其速度的 196 Tokens/s在很快那一档。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第6张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

对于语音聊天而言, 等待时间会直接影响体验 , 对于实时客服来说如此 , 对于长文生成也是这么回事 , 对于批量内容处理来说同样会造成影响。

然而, 速度存在着一个细节, 这个细节很容易被忽视, 那就是: Grok 4.3的首Token延迟并非是低的。

它会先「想一会儿」,然后快速输出。

在长答案之中, 这般速度优势显著突出;于短对话里面, 用户大概会先察觉到停顿, 而后才察觉到快。

用于客服、语音助手、移动端聊天时开云app在线入口,这个差异会被放大。

它更会说人话

这是 Grok 的隐藏优势

Grok 一直有一个微妙优势:语气更像真人。

Hacker News上有人讲道, 有些英语并非母语的用户觉得, Grok于处理文本语气、正式与否的程度以及精细的人际微妙表达方面, 比起其他模型来, 显得更为自然。

有人将它与GPT、Claude作比较, 觉得Grok在以非正式朋友口吻交流时, 在同事间的沟通方面, 以及在语音输入识别情形下, 其表现更趋近于真实的交流状态。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第7张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

https://news.ycombinator.com/item?id=47972447

Grok 可能受益于 X 平台海量口语化表达训练。

它相比之下更易于捕捉社交网络范畴之内的语气与节奏, 以及松弛感等等;它亦或许会由于这样的情况从而继承社交网络所具有的噪音以及偏见, 还有表达习惯。

对于 C 端用户而言, 这样一种表现为「更自然」的能力, 会使得 Grok 在撰写消息的情境中很讨喜,在口语转写的状况下很讨喜, 在充当语音助手的角色时很讨喜, 在轻办公场景里面也很讨喜。

它未必最聪明开云手机入口app下载,但可能更像一个愿意按你的语气说话的助手。

Yes, BUT...

它无法胜过, GPT - 5.5, 以及Claude Opus 4.7。

Grok 4.3 的最为突出的问题在于, 它看似已然步入第一梯队的边缘地带, 然而却尚未处于最前端的位置。

Grok四点三的智力指数是五十三, GPT五点五是六十, ClaudeOpus四点七是五十七。

这个差距不只是排行榜上的几分。

相对于普通消费者而言, 它会在复杂推理方面有所体现, 会反映于代码调试方面, 会展示在长文核查方面, 会呈现于专业咨询方面, 包括多步骤任务的稳定性表现也均在其中。

在GDPval - AA之上, Grok 4.3有着很大程度的提升, 然而它依旧落后于GPT - 5.5 xhigh 276 Elo , 按照标准的Elo公式来计算, 其面对GPT - 5.5时的预期胜率大约为17%。

它在幻觉控制上也有代价。

Grok 4.3 的 AA - Omniscience 的准确率, 有八点的提升, 然而, Non - Hallucination Rate 却有八分的下降。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第8张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

这里的准确率跟非幻觉率不一样, 准确率是看你答对了多少, 非幻觉率呢, 是关注你没答出来的问题当中, 有多少是模型老老实实承认自己不会的, 不会却还振振有词的那种, 就是称作「幻觉」的数据。

换而言之, Grok 4.3 的知识所覆盖的范围变宽广了, 然而相较而言更加易于出现那种虚幻的、不真实的感觉了。

然而, 消费者最为惧怕的情形便是, AI做出的回答十分流畅, 表现得颇具自信,看上去特别像那么回事, 可最终关键性事实却是错误的。

人类已经很擅长自信地犯错,机器不必急着加入这个传统项目。

这表明, 于医疗、法律、金融、学术以及工程等存在高风险的场景当中, Grok 4.3仍旧得慎重去进行使用。

它适宜协助用户去起草, 适宜协助用户去整理, 适宜协助用户去生成初稿, 适宜从事低风险的辅助活计;而涉及到最终判断的话, GPT - 5.5 以及 Claude Opus 4.7 依旧更为稳妥些。

长上下文和工具能力很好

但消费者买账的是结果

Grok 4.3 给出 100 万 Token 上下文窗口, 这对于长文档而言很有吸引力, 同时对于代码库也比较有吸引力, 并且对于合同同样具有吸引力, 况且对于报告也是挺有吸引力之事, 而且对于资料库也是极具吸引力之举。

Grok 4.3悄然升级:更便宜更快,能帮你做表格和PPT了-第9张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

用户可以丢进去更多材料,让模型在更完整的信息环境里工作。

对研究、办公和创作来说,这是一种实用能力。

它同样支持文本输入以及图像输入, 之后输出文本, 另对工具调用、网页搜索情况、X 搜索、代码执行、文件搜索、RAG 等能力予以增强。

xAI推出了Custom Voices产品, 推出了语音代理产品, 推出了TTS产品, 推出了STT等产品, 将Grok的边界从文字扩展到了语音。

对于普通用户而言, 未来的Grok, 它兴许不单单只是一个聊天的框子, 而是一个具备读取文件能力的, 能够查询网页内容的, 懂得将文字写成表格形式的, 并且能够说话表达的, 也能够听话理解的多模态的助手。

问题在于,功能多不等于体验好。

在消费级AI的竞争之中, 最终会回归到三个朴实无华的标准, 那便是等待的时间要少, 出现差错得少, 此外折腾得也要少。

就 Grok 4.3 而言, 于「少等」这一情况方面取得了显著的进展, 在「少花钱」这一情形之上也有着明显的进步, 然而, 对于「少错」这一状况, 却尚未给出足够强有力的回应。

Grok 4.3 的准确定位:

性价比模型,不是最强模型

一款高性价比的模型, 是 Grok 4.3 最适配的定位, 它属于工作型。

它适宜高频内容制作成效, 语气改动, 长文本初次筛选, 语音类产品作用, 客服场面状况, 批量办公任务实施以及轻量级代理工作流程。

那些对成本敏感的产品, 它适合, 那些对响应速度敏感的产品, 它也适合, 那些对最强推理没有执念的产品, 它同样也适合。

会有不少消费者, 并非每次都得调用最强的模型, 恰似不能只因去买菜就开超跑, 除非有别的意图。

然而, 要是任务有着深度推理的要求, 有着严谨事实核查的要求, 有着复杂代码的要求, 有着数学证明的要求, 有着长期项目记忆的要求, 以及有专业判断的要求, 那么Grok 4.3还不理应成为第一选择。

承担这些高价值的任务不合适, 承担这些高风险的任务也不合适, 然而GPT - 5.5和Claude Opus 4.7却还是更可能适合去做。

这次, xAI 的策略明晰无比, 首先把模型全力做至足够强, 紧接着将其价格予以打降, 借助速度, 还有工具能力来扩展大可用范围之场景。

它未曾获取「最聪慧模型」那一头衔, 然或许会拿走一部分实际之使用流量额。

因为市场并不总奖励最强者开云手机入口官网下载,也奖励够强、够快、够便宜的选择。

Grok 4.3 的意义就在于此, 它将 xAI 从仅仅是一个常常需借助马斯克声量来吸引众人目光而受人关注的模型供应商, 朝着更注重实际, 更务实的 API 和致力于成为消费级工具竞争者方向又助力往前推进了一步。

它看上去蛮不错, 的确是不错;不过还没达到那种能令GPT - 5.5以及Claude Opus 4.7感到紧张的程度, 是这样的情况。

消费者可以期待它降价、提速、让更多 AI 应用变得便宜。

应当记住, 在那些需要具备诚挚的睿智以及切实的可靠之处, Grok 4.3 依旧仅仅身为替换之余选。

标签: Grok4.3 AI助手 性价比 工作型模型 消费级AI

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~