最近的一年里,我不断遇到与AI和工作相关的讨论的同一个问题:大部分讨论都是炒作还是否定。

有一天的新闻是"AI将替换所有人",又有一天就claim"目前还没有相关问题"。在事实上,如果你想要实际地监测时间内的劳动压力这种话题,两边的立场都不是特别有用的。

因此,我建造了一款iOS应用叫做AI作业时钟:https://apps.apple.com/us/app/how-far-ai-jobs-clock/id6761793148

基本的想法很简单:你取出一个等级的AI暴露,聚合它在作业的基础上,转化这个信息形成一个时钟的形式。

我并不想另一个以惊险的头条为生的媒体信息。相反,我想看到一个仪表板。

许多的动机来自于更广泛的方法,让人如Andrej Karpathy这样的做出了帮助的一个框架: 能力在持续进行,而不在一次性的周期里,所以真正想要关注的点在tools越变得可用更便宜变得部署的时候,什么样的效果是最关键的那个。当时的想法应用在作业上不是"有一个demo火爆了吗"而是"什么时候底层的替换压力正在实际发生"

所以,这款应用有两个层次

结构化层

这个层从BLS职业数据开始。我们使用职业数据集作为劳动市场的基础地图:职位的存在、大小、分类和每个职位代表的雇佣数量。

从那里,建造一个职业暴露模型。目标估算了一个职业中核心任务和技能暴露在当前的AI系统中的指数 不是说是否在一夜间的失业,也不是问是否AI对于该领域是一件好事或者坏事 而是问了有多少的替换压力是可能对这个角色造成影响的

然后,这些职业暴露的预测被聚合运用了职位大小,大的职业比小的更重要。这样给我一个覆盖的作业基础上,AI的替换率

每日信号层

结构层应该保持稳定,但这个世界不可能保持稳定。模式的发布、代理工具、企业的部署、法规、产品的领先优势、成本的压缩和可靠性改进对于我这些都很重要,所以我添加了一个每日信号的覆盖层在基础职业模型的基础上

每个信号的处理方法就是将其看作是为压力向前推动的或者为回落减压,添加一个评分。每日的信号overlay层不重写从零开始的劳动模型。因此区别很重要。 我不想将这个产品变成“头条新闻中关于劳动科学的pretending”的东西 BLS支持的职业层给了它权重,日常信号层给出了它的响应能力

这一点很特别:介面

不是以百分比为唯一展示的方式,我将其映射到时钟上。这个框架部分的借鉴来自冷战末期的末日时钟的想法:不是预测机,而是一个对“我们离这个我们要关注的门槛有多远”的信号

基础点:

50%替换暴露 = 00:00 (午夜)

所以,如果总体模型在50%以下,时钟显示还有很多时间的。如果它超过了50%,阅读显示是午夜之后的时间。时间的差距越大,就越是总体模型距离这个门槛相对更远的时候。

我喜欢这个比百分比更好的原因是,当我们想知道到达“当下的门槛”有多近的时候,我们看“什么时候是午夜”就可以很快地捕捉到这样的情绪,而不是为了理解46.8% versus 51.2%到底有多大的不同。

实际上,应用打算展示

时钟
职业排名
品种趋势图
存档的日常信号
一个个人型追踪的名单(你想监测哪些职业)。

我也试着做出明确表达:

这并不是指50%暴露意味着50%的人就将要被辞退

这不是预测失业

这不是工作替代的完美量化

这是一种监测压力的替换模型,只是为了回答一个更窄的问题:是否在被覆盖下的作业中看到了更加容易被AI系统替换、自动化、压缩的证据

这是一个很难的问题,而且我仍然在调试两者。这款应用的部分我更看重的是反馈:

是否职业暴露的框架成立

是否日常信号的覆盖增加了有用的信息或是太多的混乱

是否将总体时间显示到时钟上是否有帮助

是否在模块中我更合理,而在模块中显得不合理

我建造了这个应用时,想要一个更不混乱的AI工作下的监测工具。在这方面,很大的部分人的行为都还是传诵分散的故事还是在ideology上讨论。我想要是这样一个媒介:不完全是主观的、量化的、不完全可信,但可被检查。

这就是实验吧

联系方式:

[email protected]

相关资源:

https://karpathy.ai/jobs/

https://www.jobdoomsday.tech/