AI Evolution

小结

如果说人类科技史是一场漫长的马拉松,那么人工智能无疑是最后一公里的疯狂冲刺。在这短短七十多年里,我们从好奇“机器能思考吗”到现在随手让 AI 写个全栈应用,这段旅程堪称科技界最刺激的过山车。

让我们回顾一下这趟奇妙之旅的关键节点:

一切始于 1950 年,图灵抛出了那个著名的问题“机器能思考吗?”并设计了图灵测试。这就像是人类第一次认真问自己:“嘿,我们能不能造个电子脑袋出来?”

当时人们的想象力很有限:“能玩国际象棋的机器?那一定是超级智能了!”——几十年后的今天,我们却在抱怨:“这 AI 怎么连我代码里的 bug 都找不出来,太笨了!”

60-70 年代,研究者们兴致勃勃地认为只要给机器装上逻辑推理引擎,它就能变聪明。他们像给孩子讲道理一样,一条一条地教计算机各种 IF-THEN 规则。

但问题是,现实世界的规则太复杂了,“常识”这种东西居然无法用逻辑公式表达!就像你无法向外星人精确描述“为什么人在哭的时候可能是开心的”。后来研究者们发现,单靠逻辑和规则,连识别一只猫都很困难。

于是,人工智能迎来了第一个“寒冬”,研究经费被砍,热情消退,落寞的如同被父母发现期末考试不及格的熊孩子。

90 年代,研究者们灵光一闪:“与其教计算机规则,不如教它自己学习规则!”这是机器学习的核心思想,像是从“直接告诉孩子答案”转变为“教孩子解题方法”。

统计学习方法横空出世,决策树、支持向量机、朴素贝叶斯等算法开始解决实际问题。机器开始展现出智能的曙光,但依然需要人类精心设计特征,就像必须手把手教孩子“猫有尖耳朵、胡须和尾巴”,而不能指望它自己领悟。

2012 年,CNN 在 ImageNet 图像识别比赛中一鸣惊人,标志着深度学习时代的彻底到来。这就像是给孩子看足够多的猫咪照片,它自己就能总结出“什么样子是猫”!

深度学习最了不起的地方在于自动提取特征的能力。研究者们构建了模仿人脑结构的多层神经网络,通过反向传播算法训练,解决了梯度消失等难题。李飞飞教授的 ImageNet 数据集提供了丰富的“视觉养料”,卷积神经网络展现了惊人的图像识别能力,而循环神经网络则开始处理序列数据。

深度学习虽然强大,但也有局限,它需要海量数据、计算资源高、可解释性差,且长距离依赖问题仍是难题。就像是养了一个超级聪明但完全不知道它在想什么的孩子。

2017 年,谷歌团队的一篇论文,Transformer 登上世界舞台,让人们看到了解决序列数据的长距离依赖问题的曙光。而这一伟大创新来源于“自注意力机制”,它让模型能够灵活关注输入序列中的任何部分,不受位置限制。想象一下,之前的模型阅读长文章就像是戴着望远镜从左往右看,而 Transformer 则拥有全景视角,可以自由地在文章的任何部分之间来回跳跃,理解远距离的关联。

由此,BERT、GPT 等预训练语言模型相继问世,NLP 领域迎来革命。模型不再是简单的“词袋”,而是真正开始理解语言的上下文和语义。它们通过“预训练+微调”的范式,在海量文本上学习语言知识,再针对特定任务进行调整,实现了前所未有的通用性和性能。

随着模型参数规模从数亿增长到数千亿,大模型展现出了令人惊讶的“涌现能力”。但强大的生成能力也带来了新问题:如何让模型听懂人类指令?如何让模型输出符合人类价值观?如何让模型生成格式可控的内容?

指令微调教会模型理解并执行人类指令。对齐优化让模型输出符合人类价值观的内容,避免有害、不实或偏见的回应。可控生成通过提示词工程等技术,让模型输出特定格式、风格的内容。

正是这些技术,让原本只会“自由发挥”的大模型变成了听话又有用的AI助手。

但即使是经过驯服的大模型,依然有其局限性。它不能连接网络查询实时信息,不能调用外部工具执行操作,甚至连基本的数学计算都可能出错。于是,围绕大模型构建完整 AI 系统的生态技术应运而生:

  • RAG 给模型配上“外挂知识库”,解决知识时效性和专业领域问题。就像给学生开卷考试,不用背诵所有知识,需要时可以翻书查阅。
  • Function Calling 让模型能够理解何时需要调用外部工具,并生成正确的调用格式,使 AI 从“只会说话”变成“会做事”。
  • MCP 统一了不同 AI 系统与外部工具交互的标准,解决了各家大模型接口不一致的问题,让万物互联成为可能。
  • Agent 这种具备自主规划、执行、反思能力的 AI 系统,能够自动拆解复杂任务并循环执行直至完成目标。
  • A2A 让不同专长的 AI Agent 协同工作,如同一个数字化团队,解决单一智能体难以完成的复杂任务。

回顾这段 AI 发展史,我们发现每一次技术突破都源于对前一个难题的不断探索。从最初的符号主义到现代的大模型生态,AI 技术正朝着更加通用、实用、可控的方向发展。

我们无法确认当前的 AI 是否像前几次人工智能寒冬那样草草收场,但可以遇见的是今天的 AI,已经可以解决人们的很多痛点,也在逐步改变人们的生活方式,这也正是我们要了解、拥抱它的原因所在。

Edit on GitHub

Last updated on

On this page

No Headings