经济观察报 见习记者 刘思璇
从6月起始, 有一名腾讯工作人员发觉, 于内部管理看板这里, 自身所分到的Token(词元)额度出现减少状况。“先前一个月存有2000美元(大概1.35万元人民币)额度, 而本月仅有1400元人民币, 仅仅两天便耗费完毕了。”。
根据经济观察报所做的不完全统计, 当下腾讯各个不同部门的员工, 其人均每月的 Token 额度存在着较大的差异, 具体范围是从 1000 元到 7000 元人民币不等。Token 额度在分配到组之后, 是由组内的管理者再次分给员工个人的。当额度不足的情况出现时, 员工能够向管理者进行“举手申请”来提高额度。
对于员工Token, 当下国内各个大厂主要存在两种分配方式, 其一乃是将额度分配给员工个人, 要是有超额需求的情况, 员工自费之后能够部分进行报销;其二是把额度分配至部门, 作为部门预算其中一部分, 经由管理者在部门内部去分配。
不论分给哪一个, 以何种方式去分, 追根溯源, 所分的皆是用于购买 Token 的资金, 智能体着手工作, 致使 Token 消耗呈现指数级增长, 算力成本亦在对大厂的利润构成挤压, 直至 2026 年年中, 涵盖微软、Meta 等在内的国内外全球顶尖科技大厂均开始踩下内部 AI 无限使用的“刹车”, 针对员工的 AI Token 使用量展开监控、加以限制并实施动态调配。
额度收缩之后, 部分员工忧心自己会回归“古法编程”, 员工正面临着从奢入俭的阵痛, 这种阵痛表现为: 是回归手搓, 又或者是自费加额、花钱打工呢?
“大锅饭”结束了
率先在国内对员工Token控额的互联网大厂里头, 腾讯算其中之一。凭据经济观察报所了解到的情况, 从6月开始, 腾讯多个业务员工的Token额度都出现了下降, 而且部门之间差异相当大: 在对AI需求比较大的混元大模型团队, 员工每月的Token额度大概是7000元;是聚焦在计算机视觉领域的优图实验室, 额度大约为5250元;还有腾讯娱乐外包员工透露, 自己每月Token额度仅仅只有1000元。
由组长进行分配, 额度池是在组内共同使用的那个。有腾讯员工如此表示, 这属于本月施行的暂行办法, 下个月说不定还会有所变动。
本年3月, 于脉脉社区之上, 有消息传出, 腾讯为员工配置了“每人年均22万元Token资源”, 每月涵盖700美元Cursor额度, 700美元Claude额度, 1000美元CodeBuddy额度等若干, 借此激励员工运用AI提升效率, 此消息获多位腾讯员工予以证实。
AI处于狂欢状态的当下, 围绕“Token用量会不会和工作投入度产生关联”的猜测, 变得越发激烈起来。在3月底的时候, 有腾讯的员工, 在脉脉同事圈发布帖子表示, 部分业务正在统计各个部门、各个团队的Token用量, 并且进行排名。有一些员工心怀担忧, 害怕Token消耗得不够充分, 于是在工作时间搭建没有实际意义的工作流, 让Agent反复去完成任务, 处理个人需求, 甚至还“接私活”, 目的是确保Token用量不会落后于他人。
原来腾讯此次对员工Token额度进行调整, 将有意去改变以往那种把Token消耗量当作单一衡量标准的“大锅饭”式模式。据经济观察报所知, 到2026年的时候, 腾讯会持续加大Token投入, 不过不会再按照统一标准分配给员工。部门管理者会依据工作情形, 进行动态资源分配, 要是员工有需求, 是可以申请增加Token量的。同时内部会反对对Token使用量进行排名, 并且不会单纯凭借Token消耗来衡量员工产出。
Token超了怎么办?
腾讯之外开云真人app官网登录app,开云真人app在线登录开运真人app下载苹果版,开运真人app下载开云app在线入口,开云真人官方下载,其他互联网大厂的Token额度配置逻辑不一。
首先, 说一说产研等AI使用程度较高的岗位, 阿里员工在这方面情况是, 每月额度大概约为8000元, 而且不限制模型, 有员工表示处理日常需求“基本够用”;接着, 京东员工呢, 能够不限量调用自家模型, 调用外部模型所产生的费用是分摊到部门的;最后, 美团有员工称, 还没听说明确的Token额度标准, 不过在使用内部AI产品的时候, 常常会遇到“模型变笨”的情况, 怀疑这是由于调用量过多从而被“降级到质量更低的模型”了。
在字节, 员工能够不限量调用TRAE(字节自己研发的AI IDE产品)里的模型, 这里面含有GPT、Gemini、Grok等, 要是有工作方面的需求去调用其他的模型, 所产生的费用可以部分得到报销, 有部门的报销标准是实际支出的50%, 产研岗位一年的报销上限是1000美元, 其他岗位报销上限是300美元。
对于员工Token额度的配置来说, 大厂们当下正在释放出相同的信号, 那就是AI是要用的, 然而Token是必须要管的, 不然成本就有可能会达到失控的程度。
在5月20日, 于2026阿里云峰会的现场, 米哈游《崩坏》系列AI NPC与Gameplay技术团队的负责人郑银河, 分享了团队在探索AI过程时的经历, 存在员工搭建了几十个Agent来共同协作, 并且一晚上就烧掉了大约200万元人民币的Token。
某家AI刚起步的企业里,有研发人员向经济观察报讲, 他所在的团队大概有50人, 在过去一个月里, 团队Token成本大概是20万美元, 平均到每个人的成本达到了4000美元, “主要是拿去做编码用, 那些编码质量好的模型价格都不低。老板要求节约一点, 后续打算换更便宜些的模型。”。
6月初的时候, OpenAI的首席执行官Sam Altman, 在一场直播里面表明, AI支出已然变成企业的重大问题, 然而, “在年初那会儿, 人们对于自己的花销可是相当满意的”。
换低价模型,或自费补额度
“倘若看板之上所记载显示, 要是Token的数量并不充足, 那么便能够去找负责人去增添额度。”有一名身为腾讯员工的人这样讲道, 他每个月所拥有的Token额度大概是3000美元, 在6月的时候看板进行了更新之后, 额度仅仅只有5000元人民币, “发放下来之后仅仅过了三天就已经全部用完了, Agent、Subagent(也就是子智能体)开始运作起来, 额度消耗得极为迅速”。于是乎他朝着上级主管去申请提高额度, 所得到的反馈却是部门的预算存在限制, 提额的申请被予以拒绝。“各个部门的上限并不相同, 这是需要去根据业务的具体情况来判定的。”。
对此, 腾讯此次针对外部模型展开主要的Token额度调整范围, 员工仍然能够不限量地运用腾讯自主研发的混元大模型, 这致使混元调用量出现了一定程度的增长。有员工言, 换回混元之后, 工作效率呈现下降态势, 使用体验也变得更为糟糕, “幻觉极为严重, 且并非专门用于编码的模型, 比不上手动编写”。
因公司配额不足, 致使一位腾讯员工自行掏钱, 去订阅每月需花费200美元的Codex Pro 20x。他进行了一番计算, 说道: “要是使用混元, 基础需求的运行时间会很长, 一旦失败还得重新运行, 这很浪费时间。虽说心里不情愿自费干活, 但总比没有额度可用要强, 而且这个价格也还算可以接受。”。
字节在额度配置相对充裕的情况下, 模型调用并非能随心所欲。有一名字节研发人员透露, 他自己以及身边大部分同事都使用GPT - 5.5, 公司内的模型接口天天都排着长队。尽管该模型在公司付费范围内, 可还是有员工用个人账号自费订阅, 目的是避免因为模型排队致使工作进度有所耽搁。
遇到额度受限状况之后, 员工要返回到AI尚未进入之前的纯人工模式是极为困难的。“工作量已经呈现出上升之态, 并非因为Token减少即可随之下降。并且在运用AI之后, 我极难再回归到以往那种传统方式的编程了。”有一位腾讯员工正由于Token不足而处于困扰之中。
对于企业怎样确定并划分、以及分配额度, 有个情况是, 于将Token与成本、产能挂钩关联起来后呢, 那些大厂还在寻觅答案。
(作者 刘思璇)
标签: AI成本管控 Token额度 大厂管理 员工使用 资源分配
还木有评论哦,快来抢沙发吧~