第 9 章:第一层,Token / 算力:卖底层资源
AI 商业模式的最底层,是 Token 和算力。
这是整个系统的燃料。
没有算力,模型不能训练。
没有推理资源,用户不能调用。
没有 Token 处理,AI 无法理解输入和生成输出。
所以底层资源非常重要。
但重要,不等于一定是最好的生意。
Token / 算力层有几个特点。
第一,它可计量。
输入多少 Token,输出多少 Token,占用多少 GPU 时间,缓存是否命中,延迟多少,成本多少,都可以精确计算。
第二,它可替换。
如果多个模型在某些任务上能力接近,客户可以从一个 API 切到另一个 API。底层越标准化,替换越容易。
第三,它容易价格竞争。
只要有人能用更低成本提供接近能力,价格就会被往下打。开源模型、蒸馏、小模型、推理优化、硬件升级、缓存技术,都会推动单位成本下降。
第四,它客户关系浅。
客户调用底层 API,不等于把业务交给你。客户的数据、流程、用户关系、业务结果可能都不在你这里。
这意味着 Token / 算力层很像能源层。
它是必要条件,但不是全部价值。
卖底层资源能不能赚钱?
能。
尤其在需求爆发、供给紧张、前沿模型稀缺、算力资源有限的阶段,底层资源供应商可以获得很高收入。
云厂商、芯片公司、模型公司,都可能在这一层赚到钱。
但长期看,这一层会越来越难保持超额利润。
原因有三个。
第一,技术会降成本。
推理效率会提升,模型会被压缩,缓存会优化,专用硬件会进步,开源模型会扩散。
第二,客户会多模型路由。
企业不会永远只绑定一个模型。它们会根据任务类型选择不同模型:简单任务用便宜模型,高风险任务用高级模型,低延迟任务用小模型,复杂推理用强模型。
第三,价值会向上迁移。
当 Token 越来越便宜,用户会更关注上层:谁能解决问题?谁能接入流程?谁能保证结果?谁能承担责任?
所以,Token / 算力层是基础设施,不是终局。
如果一家公司只停在这一层,它必须回答一个残酷问题:
当 Token 价格下降 90%,我还能靠什么赚钱?
如果答案只是“调用量会更大”,那还不够。
因为调用量增长可能抵消价格下降,也可能抵消不了。更重要的是,即使收入增长,利润质量也未必好。
更强的答案应该是:
- - 我有前沿模型能力;
- - 我有开发者生态;
- - 我有企业平台;
- - 我有安全与合规能力;
- - 我有数据和工具链;
- - 我能进入客户工作流;
- - 我能提供结果层服务。
否则,卖 Token 就会越来越像卖裸电。
裸电有价值,但不是商业模式的最高层。
---