一个开源小玩具 · 专门戳破 AI 工具的皇帝新衣

让每一个 Token 死得明白

Shit Token On Investment

STOI 含屎量分析
向下滚动,接受残酷真相

当烧 Token
成为一种装逼

大厂在撒钱,模型厂在卖Token,自媒体在骗流量。咱们都在演戏,区别在于有人真信了。

60万亿

Meta 员工 30 天内烧掉的 Token 总量

281亿

单月冠军的个人战绩,可能价值数百万美金

青铜 白银 黄金 绿宝石

工程师像打游戏一样刷成就,只为在内部排行榜上多爬一名

「如果一个年薪 50 万美元的工程师,一年烧不掉 25 万美元的 Token,我会感到极度不安。」

— 黄仁勋 英伟达 CEO(卖卡的当然不安)

「顶尖工程师消耗的 Token 成本已经与工资相当,但换来的是 10 倍生产力提升。」

— 安德鲁·博斯沃思 Meta CTO(反正不是花他的钱)

当全行业都为 Tokenmaxxing 高潮时,STOI 只想冷冷地问一句:

这几十万的账单里,有多少真的变成了代码,又有多少只是烧给了你根本没看完的废话?

"

我们不是在反对 AI,
我们是在反对把浪费包装成创新。

真正的 AI Native,不是账单最高的那个冤大头,
而是能在每一轮对话后说出「这笔钱花得值」的人。

STOI 团队
一个专门拆台的刻薄审计师
THE REALITY CHECK

你以为是魔法,
结果是 Bug

0
%

多轮对话中 cache_read_input_tokens 永远是 0

当我们满怀敬畏地扒开 Claude Code 的底层,没有看到高深莫测的魔法,只看到 System Prompt 里硬编码着一个时间戳——每过一秒,你的上下文缓存就全面击穿。很难不怀疑 Anthropic 这是想赚我们的 Token 钱,太坏了。

我们的拆台标准

不给你什么五星好评,只告诉你钱是怎么没的,以及该找谁算账

01

Cache Efficiency

前缀稳了, Anthropic 只收你 10% 的过路费。前缀一旦有个时间戳在蹦迪,你就是全额冤大头。STOI 专门抓这些内鬼。

02

Feedback Validity

模型输出了三大段文字,你一行没改。这就是无效 token,这就是在空气里烧钱。我们用规则 + LLM 帮你标注每一轮的真实价值。

03

Cost Breakdown

把 cache 命中差、无效输出、上下文膨胀全部换算成美元。让你看到的不是抽象的 token 数,而是真实的「烧钱速度表」。

四层浪费定位法

像查账一样,逐层定位你的 token 都死在了哪里

L1

输入层

JSON 里的缩进、Markdown 装饰符、无意义换行。全是装腔作势的语法噪音。

L2

结果层

重复的 context、过长的 grep 结果。大量你根本不看的信息塞进上下文。

L3

结构层

时间戳、UUID、PID 导致 cache miss。技术债务直接换算成账单。

L4

输出层

Yapping、过度解释、冗余总结。模型在表演,你在付费。

Before / After

一个典型 Claude Code 会话,在被 STOI 戳穿前后的对比

Before · 蒙在鼓里

成本随轮数
线性增长

  • System prompt 里有个时间戳在蹦迪,cache 完全失效
  • 第 12 轮上下文膨胀到 8000+ tokens,一半是没看过的废话
  • 模型每轮都自动总结已做的事,你每次都要付费阅读
After · 死得明白

成本进入
平台期

  • 把动态字段踢出 system prompt,cache 命中率提升到 90%+
  • 执行 /compact,把历史压缩进 3500 tokens
  • 禁用废话总结,平均每轮少付 200–400 tokens 的智商税

让 Claude 自己拆自己的台

STOI 不只是 CLI,它也可以塞进 Claude Code 当 Skill。不用切窗口,直接问它「我这轮是不是又被你坑了」。

M1

stoi_latest

读取你最近一次对话的账单。总 token、cache 命中率、「含屎量」一目了然。

M2

stoi_report

对指定 session 做逐轮审计。哪一轮在灌水,哪一轮该写进耻辱柱。

M3

stoi_insights

横向对比多个 session,发现你的长期恶习和周期性翻车现场。

M4

stoi_overview

列出近期所有 session 的元数据。快速定位哪一笔账单最值得吵架。

M5

stoi_blame

pinpoint 最大的 token 浪费源。精准到具体哪一轮、哪一行 Prompt。

Example Prompt

“Claude,分析一下我上一轮的 token 效率,看看是不是又在废话上浪费钱了。”

Session ID: sess_abc123
Cache Hit Rate: 87%
含屎量: 12%
主要问题:System Prompt 里的时间戳导致前几轮缓存全部失效。建议移除。
STOI

准备好审计你的
Token 效率了吗?

一行命令安装 CLI,或在 Claude 中直接启用 Skill。即刻分析你最近的 Claude Code session。