AI 发展越来越快，人是否会被 AI 替换掉，如何评估 AI 的能力以及和 AI 相处。现在 AI 发展很快，这是一个阶段性的思考，主要用作记录备份，供后续 review 使用。

最近几年 AI（这里特指以 Transformer 为主的 LLM）发展越来越快，不时会有一些说法：（某些岗位的）人大概还有多久会被替代？

这个问题包含了至少两层意思：

AI 完全替代所有（该岗位）的人
使用 AI 的人替代了不使用 AI 的人

AI 能否替代人类

这里的职业特指软件工程行业相关职业，相关思路或许可以推广到其他行业

关于 AI 能否替代人类，各方会有不同的观点

会替代的一些依据
- AI 能够 24 小时学习，人一天学习的时间有限
- AI 没有情绪
- AI 也能够思考：这里的思考是指能够把不同的事情联系在一起
- …
不会替代
- AI 有幻觉
- AI 不能够思考，只能做一些简单的事情
- AI 是在「背书」
- …

软件工程相关职业的定位

(大部分)软件工程师是派生职业，并不直接参与交易。公司为了满足用户需求招聘软件工程师进行开发，客户和公司进行交易，公司则是为了促成交易而招聘软件工程师，软件工程师属于公司的成本（当然部分也可能变成资产，这点暂时不表）。公司的目的是为了有足够的利润并长期生存下去，更看重的是（长期的）ROI 以及现金流，产品如果发展的不错，则需要进行更新迭代以及维护（功能，性能，易用性，安全性，稳定性等等各方面)，产品发展不行就会进行成本压缩。如果我们认为 AI 可以完全替代软件工程师，等价于 AI 可以自动或者半自动完成前面的功能。

从 2025 年下半年开始 Claude Code 为代表的 Agent 系统出来后，在很多方面已经能够产出可用，好用的代码，Claude Code 的按月订阅最贵是 100$，一年是 1200$ 换成人民币 8000+，但是 8000+ 肯定无法招聘到软件工程师的，Claude Code 相对现在的软件工程师来说便宜太多。

在整个开发的过程中，我们可以粗分为：需求的收集和分析，方案的确认，产品/系统的开发和维护，系统的后续维护等。如果 AI 替代的话，会涉及到几个事情：1）可能替换哪些阶段；2）使用 AI 替换后对整体产品的收益如何，这里面涉及到整个产品周期中各阶段的耗时分布，以及该阶段在整个阶段的耗时占比等各种因素。

AI 的幻觉

现在 AI 的最小单元是 token，会不断产生和当前已有 token 关联度（相对）最大的一个 token，直到最后输出完成。token 的关联情况由训练完成，通过给一系列的输入，训练每个 token 后面可能出现的 token 的概率大小，使用时则从已经训练好的关联度中挑选概率更大的一个 token。

幻觉来自于至少如下几个地方：

训练时的数据有误（过期、错误等）
Transformer 预测 token 的时候，最合理的 token 和概率最大（相关）的 token 可能不完全重合
对 context 的理解，比如【李白挺不错】中的【李白】到底指什么？在不同的场合可能会指代不一样, 知识表征的不唯一

我们说 AI 有幻觉是说 AI 相对于人来说有幻觉，从上面几个角度来看，第一个和第二个人也一样会有：信息源有误，逻辑谬误等，第二个人可以通过可以训练一定的降低错误的概率。第三个来说，人在沟通交流的时候可以更好的获取当前信息，因此相对来说比 AI 更好一些，当然现在 Agent 等一些最佳实践也在不断的优化这一点。

AI 能否思考

另外一个出现比较多的点：AI 能否思考，以此判断是否会替换掉人。

有人说 AI 只是「背书」，没有思考，那么我们说的「思考」到底是啥呢？思考往往指通过一定的努力，将已有的信息，以及新接受到的信息进行一定的关联，然后得到一个最终的结果。从这个角度看，可能会涉及到「思考的深度」，也就是说能联系多少信息，然后是否能用「合理」的方式关联起来，现在 AI 在训练的过程中能够将不同信息进行一定程度的关联，同时对输入信息也能够与已有信息进行关联 — 知识储备非常丰富（可以 7*24 小时工作，仅首先与已有的知识），但是在将信息关联起来这一步，人可以在拥有少量数据点的情况下进行关联，AI 的关联由权重决定，如果数据点太少，可能会被忽略掉（不确定这一步能否通过某些方式纠正回来 — 类似人的灵光一现），从这个角度看 AI 是能够一定程度进行思考的，而且可以在有良好数据的领域内进行比较好的「思考」。

另外「思考」可能更多的专注「how」而不是「what」的，比如同样是计算 5 + 7，可能小孩是一步步的进行计算，这个是思考的过程，而大人则直接背答案，机器更多的也是背答案，现在 AI 的思维链是展示思考的一个过程。

然后呢？

在前面我们描述了两个 AI 能否替代人的信息：幻觉和思考。其中有一些 AI 的弱项，在人身上也同样存在，另外 AI 在部分情况下可能比人会更强，因为拥有比人更多的信息，但是也会有一些挑战，比如说对知识的理解，思考的程度等。

从这个角度看，相对比较确定，没有歧义的事情（尤其是已经有人做过），AI 会变的足够好，可能会越来越好，在这些事情上，人类相比 AI 很难有竞争力，而且随着技术的发展，使用 AI 的费用会达到一个平衡。不确定性更高的事情，人相对 AI 则更有优势，因为这些需要（近）实时的综合环境的现有信息，但不排除后续 AI 能在这上面有大的进展。

将确定的方案等转化为代码，这是一个相对比较确定，歧义相对比较少的事情，因此写代码这个过程在未来人类很难和 AI 比（当然部分情况下需要依赖上下文进行调整，但是这种情况整体比例不是很大）。

总体来说 AI 能够比较快的替换掉确定性（歧义较少）的工作，但是对于不确定性较高（歧义较大）的事情，则还需要观察。当然如果觉得 AI 无法做到的话，也可以考虑下

自己用的不是最好的系统（模型，以及周边系统），系统的好坏往往决定了所获得结果的质量
自己的使用方式不太行，AI 也需要人来使用，是否以更符合 AI 的方式来使用
现在的模型还不够好, 有没有可能是因为现在做 AI 的人不够强，所以没法达到理论高度

作为软件工程师来说，整个过程会包括整体的需求收集，拆解，然后转化为更具体的设计，最终实现，并且进行更新和维护。这里面的代码实现是一个相对比较确定，歧义相对比较少的事情，因此写代码这个过程在未来人类很难和 AI 比（当然部分情况下需要依赖上下文进行调整，但是这种情况整体比例不是很大）。为了保证长期的可维护性，还是需要人来进行 review 把关，但是具体每一行代码怎么写，AI 能够一定程度的替代。review 涉及判断和取舍，二元化的评价就是过还是不过，或者代码合并还是不合并，但是不同的 reviewer 能给不同的建议，如果 reviewer 本身的水平更高则能够提出更多具体、有针对性，有指导性的评论，这个是对相关知识颗粒度的掌握，当然现在也有一些说法：品味/taste。这些需要自己见识过好的/美的东西，同时对好的/美的东西有足够的追求，这样可以在完成之上能够有更高的要求。另外系统不仅仅是代码，也包括在人脑袋中对系统的理解，这些理解会影响系统整个生命周期内维护的有效性。

写代码的少了，但是软件工程师是否会减少，这个还不能完全说清楚，因为：1）写代码是软件工程师必不可少的一项工作，但软件工程师除了写代码还会有需求分析，架构设计，评审，以及运维和维护等多项工作。可能写代码是最突出（耗时）的工作项，那么可能会减少，另外显示中需求总是做不完的，因此会降本，还是说让大家去完成之前人力不够导致耽搁的需求可能也会不一样。作为派生职业，由更上游决定需求，因此最终会落到自己所在业务的发展情况(或者业务决策者对未来的判断)。作为一个派生职业可能更好的是要从整个商业链上进行 ROI 的分析。另外需要注意的是，如果 AI 使用更多了，那么能留给软件工程师的预算也相对变少了，可能出现「虽然不是 AI 替换人，但是人的失业却是由 AI 造成的」的场景。

在 AI 全面被使用后，能够快速的生产出非常多的东西，所以「质量普通」的东西会泛滥，但是大家对质量的需求肯定会持续存在，或许追求/保持能够产出高质量的产品是一个在 AI 时代对自己相对有利的行动。

不管 AI 能否替代人类，作为一项工具，一定会有很大的提速，而且是系统层面的，因此作为个人来说，尝试和拥抱 AI 是一个更好的决策。由于 AI 会进行提速，因此长远来看整体的效率会变高，同时个体的方差也会变大。

如何评估 AI 的能力

AI 很强，能思考，但这是我们把 AI 作为一个整体，在实际生活中我们会用 AI 来处理一件件具体的事情，而这些事情对应 AI 的各方面，因此更好的是我们对 AI 进行不同方面，不同程度的评估，让我们能对使用的 AI 系统（包括模型，以及外围系统）有一个更好的了解，就像老师对学生学习效果的评估一样，同一个学生同时学习多门功课，每门功课成绩可能不一样，甚至同一门课中不同知识点的学习情况也不一样，我们可以借助 SOLO(Structure of the Observed Learning Outcome) 在我们感兴趣的领域中对 AI 系统进行评估

SOLO 总共分为 5 个等级，每一级都比上一级更有挑战

第一级就是混乱状态，就是随机返回一些结果
第二级能够完成 1 -> 1 的一些推理（上图中的 A)
第三级能够完成 n -> 1 的一些推理 (上图中的 B）
第四级能够完成 n -> 1 的一些推理，且条件之间有约束/协同（上图中的 C）
第五季能够完成 m -> n 的一些推理（上图中的 D）

当然实际工作生活中的评估往往比这个更复杂，但是对于自己常用的一些场景，可以尝试用类似的来进行一些评估，这样可以给后续自己选用 AI 系统提供参考。

怎么适应和使用 AI

AI 很强，我们也可以选择合适的 AI 系统来协助的情况下，是否就可以把更多的事情直接委托给 AI 呢？答案是否定的，在 AI 时代某些事情我们更应该自己做，否则我们会慢慢「变傻」，因为我们的每次选择、行动也在锻炼自己的大脑回路，而我们很多事情上的反应会依赖自己的潜意识 — 也就是之前行为、选择上所训练的大脑回路，潜意识的整个流程非常快，快到在我们意识到之前就已经决定了，因此我们想拥有更好的结果，就需要日常对大脑回路进行更好的「训练」，这些训练需要达到一定的程度（必要难度）才能有较好的效果。这个现象也可以一定程度解释：知道这么多知识却过不好一生, 因为我们仅仅「知道」, 但是我们的大脑回路却没有调整过来。

后续，我们会从 AI 获得更多的「结果」，但是这些「结果」是否符合要求，则需要我们进行判断，而对一个事情有足够的判断不仅仅需要有良好的逻辑能力，也需要对所做的事情拥有良好的「直觉」，「直觉」可能就是大脑中已有回路对接受到信息的自动化反应，我们需要在平时有意识的对自己大脑回路进行锻炼，某种程度上说，AI 使得「头脑清晰」变的更加重要了。AI 可以让我们在任何时候，任何地点对自己的大脑进行训练，让因材施教可以真正的落地，也可以加强我们现有的一些生活和工作能力。

对于读书来说，我们可以将同一个主题的不同书籍交给 AI，然后让 AI 进行一些总结和归纳，比如该主题的核心问题，知识主干，以及意见不同的相关论点论据等，也可以对每一个问题使用 AI 进行一些基本的问答，现在 AI 让个性化沉浸式的学习成为现实。但是更具体的仍然需要自己通过查阅书籍进行，因为从书到 AI 再到自己，这条链路中必然会丢失一些信息（每个环节都有自己的「偏见」），尤其是一些细节信息，这些细节信息可能非常重要，如果仅看 AI 的总结/摘要，而不自己进行阅读，效果可能会打折扣。

现在 AI 能够写代码之后，作为软件工程师也可以利用 AI 来帮助自己，而不仅仅是完成原来需要自己手动撰写的代码。比如头脑风暴设计方案，讨论方案的落地计划，快速生成某个原型系统迅速验证自己想法或者熟悉某些系统，甚至完成生产系统中部分（或者全部）代码的撰写。虽然现在 AI 很厉害，如果有完整可控的环境，规定好对应的要求，AI 能够自动完成大部分工作而不需要人的参与，而且质量可以达到一个还不错的程度。但是长期以往，可能在至少两方面会有风险：1）自己对系统/代码的感知能力必然会弱，无法感知到系统中不好的方面 — 这点和前面说的必要难度也有一定关系。在日常工作中可以由 AI 生成代码，但是自己需要对整体做到足够的理解，有一个标准大概是：如果给你足够的时间，是否也能完成该系统，或者比 AI 完成的更好; 2) 系统的维护性可能变差，这部分取决于团队对质量的要求（或者低质量可能带来的风险有多大），如果应用 AI 前的质量要求高，由于应用 AI 导致门槛的将低，那么长期来说可维护性就会变低 — 需要注意的是: 不是所有业务/团队愿意为可维护性做投入。

另外一个保持锻炼自己大脑的活动是写作，写作需要把自己头脑中无序的想法梳理成有序的内容并转化为文字，整个过程中需要不断的对自己想法进行加工，这个过程会强制要求自己进行思考。写作能够将自己的潜意识可视化，让自己有机会对潜意识的想法进行 review，这些潜意识会「主导」我们生活中非常多的事情，甚至我们没有意识到潜意识的存在，这个在和刚学说话的小孩对话中有很明显的感知，比如你对小孩说：XX，把你左边的 YY 拿给我。成年人听到后会有一整套下意识的动作，但是对小孩则不然，他们需要理解 XX 是在叫自己，「左边」是什么意思，「YY」又是哪个物品，然后「拿给我」又是啥意思，在知道这些之后，还需要控制自己的手到 YY 那，然后拿着 YY 再递过来。但是对于成年人来说，这都已经内化成一整套自动化的事情了 — 如果没有自动化，那我们每天处理这些就需要耗费太多的时间和精力了。日常生活和工作中很多看似无关的事情，最终是由同一个潜意识「主导」的，而对相关「潜意识」进行调整之后，则能够同时解决不同场景下的问题, 但是在「看见」潜意识之前，我们甚至无法把他们联系起来，写作可以给我们一个「看见并调整潜意识」的机会，这是其他活动比较难获得的一个好处，现在利用 AI 我们可以加速「看见、调整潜意识」的流程，还能够在「看见，调整」之间增加「压测」并形成一个循环，不断的训练和提高自己。

最后

我们分析现状、展望未来，是为了能够更好的应对未来。分析可能有误，因此要尽可能保留完整的逻辑链条，以及其中关键假设，如果其中相关信息发生了变化，也可以重新进行评估。在分析的时候尽可能从不同的立场分析问题，避免由于自己立场导致的判断错误。

现在看来 AI 进入工作和生活已经是必然的事情，更好的做法是顺应潮流，能够让自己在未来能够发挥更大的作用。

AI 能思考吗