我建立了一个小型模拟器,以压力测试人工智能推理的单位经济。

我想孤立的问题很简单:在什么假设下,前沿的AI推理才能变得足够赚钱,来证明当前的投资周期?

我的当前看法是,AI推理可以变得非常赚钱,但这并不是因为推理成本降低了。有利的案例需要多个假设在同一时间排列起来:
- 支付的采用速度快
- GPU容量不会超过需求太多
- 部署的模型保持向更低的活跃参数服务架构移动
- 通过率/批处理改善了
- GPU折旧期足够长,资本成本不惩罚
- 实际令牌收入不会崩溃到商品定价

模型中最大的波动因素不是电力。它们是利用率,活跃模型大小,GPU/数据中心折旧,和令牌的折合收入。

这使投资问题从“AI会有用吗?”变成了“谁可以在高到足以支持投资的利润率上,赚取推理收入?”

App:
https://msg32jebwg56opz2avykhcai-profitability-simulator.streamlit.app/

很感兴趣地看到投资的反馈,特别是如果模型错过了主要的成本/收入类别,或者过度估计了如何达到有利的推理收入。