AI 发展越来越快,人是否会被 AI 替换掉,如何评估 AI 的能力以及和 AI 相处。现在 AI 发展很快,这是一个阶段性的思考,主要用作记录备份,供后续 review 使用。

最近几年 AI(这里特指以 Transformer 为主的 LLM)发展越来越快,不时会有一些说法:(某些岗位的)人大概还有多久会被替代?

这个问题包含了至少两层意思:

  1. AI 完全替代所有(该岗位)的人
  2. 使用 AI 的人替代了不使用 AI 的人

AI 能否替代人类

这里的职业特指软件工程行业相关职业,相关思路或许可以推广到其他行业

关于 AI 能否替代人类,各方会有不同的观点

  • 会替代的一些依据
    • AI 能够 24 小时学习,人一天学习的时间有限
    • AI 没有情绪
    • AI 也能够思考:这里的思考是指能够把不同的事情联系在一起
  • 不会替代
    • AI 有幻觉
    • AI 不能够思考,只能做一些简单的事情
    • AI 是在「背书」

软件工程相关职业的定位

(大部分)软件工程师是派生职业,并不直接参与交易。公司为了满足用户需求招聘软件工程师进行开发,客户和公司进行交易,公司则是为了促成交易而招聘软件工程师,软件工程师属于公司的成本(当然部分也可能变成资产,这点暂时不表)。公司的目的是为了有足够的利润并长期生存下去,更看重的是(长期的)ROI 以及现金流,产品如果发展的不错,则需要进行更新迭代以及维护(功能,性能,易用性,安全性,稳定性等等各方面),产品发展不行就会进行成本压缩。如果我们认为 AI 可以完全替代软件工程师,等价于 AI 可以自动或者半自动完成前面的功能。

从 2025 年下半年开始 Claude Code 为代表的 Agent 系统出来后,在很多方面已经能够产出可用,好用的代码,Claude Code 的按月订阅最贵是 100$,一年是 1200$ 换成人民币 8000+,但是 8000+ 肯定无法招聘到软件工程师的,Claude Code 相对现在的软件工程师来说便宜太多。

在整个开发的过程中,我们可以粗分为:需求的收集和分析,方案的确认,产品/系统的开发和维护,系统的后续维护等。如果 AI 替代的话,会涉及到几个事情:1)可能替换哪些阶段;2)使用 AI 替换后对整体产品的收益如何,这里面涉及到整个产品周期中各阶段的耗时分布,以及该阶段在整个阶段的耗时占比等各种因素。

AI 的幻觉

现在 AI 的最小单元是 token,会不断产生和当前已有 token 关联度(相对)最大的一个 token,直到最后输出完成。token 的关联情况由训练完成,通过给一系列的输入,训练每个 token 后面可能出现的 token 的概率大小,使用时则从已经训练好的关联度中挑选概率更大的一个 token。

幻觉来自于至少如下几个地方:

  • 训练时的数据有误(过期、错误等)
  • Transformer 预测 token 的时候,最合理的 token 和概率最大(相关)的 token 可能不完全重合
  • 对 context 的理解,比如【李白挺不错】中的【李白】到底指什么?在不同的场合可能会指代不一样, 知识表征的不唯一

我们说 AI 有幻觉是说 AI 相对于人来说有幻觉,从上面几个角度来看,第一个和第二个人也一样会有:信息源有误,逻辑谬误等,第二个人可以通过可以训练一定的降低错误的概率。第三个来说,人在沟通交流的时候可以更好的获取当前信息,因此相对来说比 AI 更好一些,当然现在 Agent 等一些最佳实践也在不断的优化这一点。

AI 能否思考

另外一个出现比较多的点:AI 能否思考,以此判断是否会替换掉人。

有人说 AI 只是「背书」,没有思考,那么我们说的「思考」到底是啥呢?思考往往指通过一定的努力,将已有的信息,以及新接受到的信息进行一定的关联,然后得到一个最终的结果。从这个角度看,可能会涉及到「思考的深度」,也就是说能联系多少信息,然后是否能用「合理」的方式关联起来,现在 AI 在训练的过程中能够将不同信息进行一定程度的关联,同时对输入信息也能够与已有信息进行关联 — 知识储备非常丰富(可以 7*24 小时工作,仅首先与已有的知识),但是在将信息关联起来这一步,人可以在拥有少量数据点的情况下进行关联,AI 的关联由权重决定,如果数据点太少,可能会被忽略掉(不确定这一步能否通过某些方式纠正回来 — 类似人的灵光一现),从这个角度看 AI 是能够一定程度进行思考的,而且可以在有良好数据的领域内进行比较好的「思考」。

另外「思考」可能更多的专注「how」而不是「what」的,比如同样是计算 5 + 7,可能小孩是一步步的进行计算,这个是思考的过程,而大人则直接背答案,机器更多的也是背答案,现在 AI 的思维链是展示思考的一个过程。

然后呢?

在前面我们描述了两个 AI 能否替代人的信息:幻觉和思考。其中有一些 AI 的弱项,在人身上也同样存在,另外 AI 在部分情况下可能比人会更强,因为拥有比人更多的信息,但是也会有一些挑战,比如说对知识的理解,思考的程度等。

从这个角度看,相对比较确定,没有歧义的事情(尤其是已经有人做过),AI 会变的足够好,可能会越来越好,在这些事情上,人类相比 AI 很难有竞争力,而且随着技术的发展,使用 AI 的费用会达到一个平衡。不确定性更高的事情,人相对 AI 则更有优势,因为这些需要(近)实时的综合环境的现有信息,但不排除后续 AI 能在这上面有大的进展。

将确定的方案等转化为代码,这是一个相对比较确定,歧义相对比较少的事情,因此写代码这个过程在未来人类很难和 AI 比(当然部分情况下需要依赖上下文进行调整,但是这种情况整体比例不是很大)。

总体来说 AI 能够比较快的替换掉确定性(歧义较少)的工作,但是对于不确定性较高(歧义较大)的事情,则还需要观察。当然如果觉得 AI 无法做到的话,也可以考虑下

  • 自己用的不是最好的系统(模型,以及周边系统),系统的好坏往往决定了所获得结果的质量
  • 自己的使用方式不太行,AI 也需要人来使用,是否以更符合 AI 的方式来使用
  • 现在的模型还不够好, 有没有可能是因为现在做 AI 的人不够强,所以没法达到理论高度

作为软件工程师来说,整个过程会包括整体的需求收集,拆解,然后转化为更具体的设计,最终实现,并且进行更新和维护。这里面的代码实现是一个相对比较确定,歧义相对比较少的事情,因此写代码这个过程在未来人类很难和 AI 比(当然部分情况下需要依赖上下文进行调整,但是这种情况整体比例不是很大)。为了保证长期的可维护性,还是需要人来进行 review 把关,但是具体每一行代码怎么写,AI 能够一定程度的替代。review 涉及判断和取舍,二元化的评价就是过还是不过,或者代码合并还是不合并,但是不同的 reviewer 能给不同的建议,如果 reviewer 本身的水平更高则能够提出更多具体、有针对性,有指导性的评论,这个是对相关知识颗粒度的掌握,当然现在也有一些说法:品味/taste。这些需要自己见识过好的/美的东西,同时对 好的/美的 东西有足够的追求,这样可以在完成之上能够有更高的要求。另外系统不仅仅是代码,也包括在人脑袋中对系统的理解,这些理解会影响系统整个生命周期内维护的有效性。

写代码的少了,但是软件工程师是否会减少,这个还不能完全说清楚,因为:1)写代码是软件工程师必不可少的一项工作,但软件工程师除了写代码还会有需求分析,架构设计,评审,以及运维和维护等多项工作。可能写代码是最突出(耗时)的工作项,那么可能会减少,另外显示中需求总是做不完的,因此会降本,还是说让大家去完成之前人力不够导致耽搁的需求可能也会不一样。作为派生职业,由更上游决定需求,因此最终会落到自己所在业务的发展情况(或者业务决策者对未来的判断)。作为一个派生职业可能更好的是要从整个商业链上进行 ROI 的分析。另外需要注意的是,如果 AI 使用更多了,那么能留给软件工程师的预算也相对变少了,可能出现「虽然不是 AI 替换人,但是人的失业却是由 AI 造成的」的场景。

在 AI 全面被使用后,能够快速的生产出非常多的东西,所以「质量普通」的东西会泛滥,但是大家对质量的需求肯定会持续存在,或许追求/保持能够产出高质量的产品是一个在 AI 时代对自己相对有利的行动。

不管 AI 能否替代人类,作为一项工具,一定会有很大的提速,而且是系统层面的,因此作为个人来说,尝试和拥抱 AI 是一个更好的决策。由于 AI 会进行提速,因此长远来看整体的效率会变高,同时个体的方差也会变大。

如何评估 AI 的能力

AI 很强,能思考,但这是我们把 AI 作为一个整体,在实际生活中我们会用 AI 来处理一件件具体的事情,而这些事情对应 AI 的各方面,因此更好的是我们对 AI 进行不同方面,不同程度的评估,让我们能对使用的 AI 系统(包括模型,以及外围系统)有一个更好的了解,就像老师对学生学习效果的评估一样,同一个学生同时学习多门功课,每门功课成绩可能不一样,甚至同一门课中不同知识点的学习情况也不一样,我们可以借助 SOLO(Structure of the Observed Learning Outcome) 在我们感兴趣的领域中对 AI 系统进行评估

SOLO 总共分为 5 个等级,每一级都比上一级更有挑战

  • 第一级就是混乱状态,就是随机返回一些结果
  • 第二级能够完成 1 -> 1 的一些推理(上图中的 A)
  • 第三级能够完成 n -> 1 的一些推理 (上图中的 B)
  • 第四级能够完成 n -> 1 的一些推理,且条件之间有约束/协同 (上图中的 C)
  • 第五季能够完成 m -> n 的一些推理 (上图中的 D)

当然实际工作生活中的评估往往比这个更复杂,但是对于自己常用的一些场景,可以尝试用类似的来进行一些评估,这样可以给后续自己选用 AI 系统提供参考。

怎么适应和使用 AI

AI 很强,我们也可以选择合适的 AI 系统来协助的情况下,是否就可以把更多的事情直接委托给 AI 呢?答案是否定的,在 AI 时代某些事情我们更应该自己做,否则我们会慢慢「变傻」,因为我们的每次选择、行动也在锻炼自己的大脑回路,而我们很多事情上的反应会依赖自己的潜意识 — 也就是之前行为、选择上所训练的大脑回路,潜意识的整个流程非常快,快到在我们意识到之前就已经决定了,因此我们想拥有更好的结果,就需要日常对大脑回路进行更好的「训练」,这些训练需要达到一定的程度(必要难度)才能有较好的效果。这个现象也可以一定程度解释:知道这么多知识却过不好一生, 因为我们仅仅「知道」, 但是我们的大脑回路却没有调整过来。

后续,我们会从 AI 获得更多的「结果」,但是这些「结果」是否符合要求,则需要我们进行判断,而对一个事情有足够的判断不仅仅需要有良好的逻辑能力,也需要对所做的事情拥有良好的「直觉」,「直觉」可能就是大脑中已有回路对接受到信息的自动化反应,我们需要在平时有意识的对自己大脑回路进行锻炼,某种程度上说,AI 使得「头脑清晰」变的更加重要了。AI 可以让我们在任何时候,任何地点对自己的大脑进行训练,让因材施教可以真正的落地,也可以加强我们现有的一些生活和工作能力。

对于读书来说,我们可以将同一个主题的不同书籍交给 AI,然后让 AI 进行一些总结和归纳,比如该主题的核心问题,知识主干,以及意见不同的相关论点论据等,也可以对每一个问题使用 AI 进行一些基本的问答,现在 AI 让个性化沉浸式的学习成为现实。但是更具体的仍然需要自己通过查阅书籍进行,因为从书到 AI 再到自己,这条链路中必然会丢失一些信息(每个环节都有自己的「偏见」),尤其是一些细节信息,这些细节信息可能非常重要,如果仅看 AI 的总结/摘要,而不自己进行阅读,效果可能会打折扣。

现在 AI 能够写代码之后,作为软件工程师也可以利用 AI 来帮助自己,而不仅仅是完成原来需要自己手动撰写的代码。比如头脑风暴设计方案,讨论方案的落地计划,快速生成某个原型系统迅速验证自己想法或者熟悉某些系统,甚至完成生产系统中部分(或者全部)代码的撰写。虽然现在 AI 很厉害,如果有完整可控的环境,规定好对应的要求,AI 能够自动完成大部分工作而不需要人的参与,而且质量可以达到一个还不错的程度。但是长期以往,可能在至少两方面会有风险:1)自己对系统/代码的感知能力必然会弱,无法感知到系统中不好的方面 — 这点和前面说的必要难度也有一定关系。在日常工作中可以由 AI 生成代码,但是自己需要对整体做到足够的理解,有一个标准大概是:如果给你足够的时间,是否也能完成该系统,或者比 AI 完成的更好; 2) 系统的维护性可能变差,这部分取决于团队对质量的要求(或者低质量可能带来的风险有多大),如果应用 AI 前的质量要求高,由于应用 AI 导致门槛的将低,那么长期来说可维护性就会变低 — 需要注意的是: 不是所有业务/团队愿意为可维护性做投入。

另外一个保持锻炼自己大脑的活动是写作,写作需要把自己头脑中无序的想法梳理成有序的内容并转化为文字,整个过程中需要不断的对自己想法进行加工,这个过程会强制要求自己进行思考。写作能够将自己的潜意识可视化,让自己有机会对潜意识的想法进行 review,这些潜意识会「主导」我们生活中非常多的事情,甚至我们没有意识到潜意识的存在,这个在和刚学说话的小孩对话中有很明显的感知,比如你对小孩说:XX,把你左边的 YY 拿给我。成年人听到后会有一整套下意识的动作,但是对小孩则不然,他们需要理解 XX 是在叫自己,「左边」是什么意思,「YY」又是哪个物品,然后「拿给我」又是啥意思,在知道这些之后,还需要控制自己的手到 YY 那,然后拿着 YY 再递过来。但是对于成年人来说,这都已经内化成一整套自动化的事情了 — 如果没有自动化,那我们每天处理这些就需要耗费太多的时间和精力了。日常生活和工作中很多看似无关的事情,最终是由同一个潜意识「主导」的,而对相关「潜意识」进行调整之后,则能够同时解决不同场景下的问题, 但是在「看见」潜意识之前,我们甚至无法把他们联系起来,写作可以给我们一个「看见并调整潜意识」的机会,这是其他活动比较难获得的一个好处,现在利用 AI 我们可以加速「看见、调整潜意识」的流程,还能够在「看见,调整」之间增加「压测」并形成一个循环,不断的训练和提高自己。

最后

我们分析现状、展望未来,是为了能够更好的应对未来。分析可能有误,因此要尽可能保留完整的逻辑链条,以及其中关键假设,如果其中相关信息发生了变化,也可以重新进行评估。在分析的时候尽可能从不同的立场分析问题,避免由于自己立场导致的判断错误。

现在看来 AI 进入工作和生活已经是必然的事情,更好的做法是顺应潮流,能够让自己在未来能够发挥更大的作用。

Comments