跳转到内容

什么是 AI

建议学习 25 分钟更新于 2026/5/31

AI 是 Artificial Intelligence 的缩写,中文通常叫人工智能。

如果用一句话解释:

AI 是让机器具备类似人类智能能力的一组技术,包括理解语言、识别模式、学习经验、推理决策和生成内容。

它不是某一个单独工具,也不是某一个模型,而是一整套技术体系。机器学习、自然语言处理、神经网络、大语言模型、生成式 AI、向量数据库和 RAG,都可以放在 AI 这条线里理解。

这篇笔记参考 Elastic 的 AI 入门文章,按开发者和架构学习的视角重新整理一遍。

AI 的目标,是让计算机完成一些原本需要人类智能才能完成的任务。

例如:

  • 理解自然语言。
  • 识别图片、语音和视频。
  • 从历史数据中学习规律。
  • 根据上下文进行推理。
  • 自动生成文本、图片、音频、视频或代码。
  • 在复杂环境中辅助决策。

所以 AI 不只是“聊天机器人”。聊天只是 AI 的一种表现形式。

更完整地看,AI 融合了多个学科:

  • 计算机科学。
  • 数据科学。
  • 统计学。
  • 语言学。
  • 神经科学。
  • 心理学。
  • 逻辑学。

这些学科共同回答一个问题:

能不能让机器从数据和环境中学习,并完成更复杂的任务?

AI 不是突然出现的。

它经历了很长的发展过程,只是近几年因为算力、数据、算法和大模型同时成熟,才真正进入大众视野。

Alan Turing 在论文《Computing Machinery and Intelligence》中提出了一个经典问题:

机器能思考吗?

图灵测试的核心思想是:如果人类无法通过对话判断对方是人还是机器,那么这台机器就表现出了某种智能。

John McCarthy 在达特茅斯会议上正式提出 Artificial Intelligence 这个术语。

从这个时间点开始,AI 逐渐成为一个独立研究方向。

ELIZA 是早期比较著名的聊天机器人,它可以模拟心理咨询师和用户对话。

虽然它并不真正理解语言,但已经展示了机器与人类自然语言交互的可能性。

专家系统是早期 AI 的一个重要方向。

它主要依赖规则库:

如果满足条件 A,就执行结论 B

这种方式在某些领域有效,但问题也很明显:规则很难覆盖真实世界的复杂情况,维护成本也高。

AI 历史上经历过多次低谷。

原因主要是:

  • 算力不够。
  • 数据不足。
  • 预期过高。
  • 实际落地效果不理想。
  • 投资和研究热度下降。

这段时期通常被称为 AI 寒冬。

随着互联网数据增长和计算能力提升,机器学习开始广泛应用。

典型场景包括:

  • 推荐系统。
  • 搜索排序。
  • 用户画像。
  • 风控模型。
  • 语音助手。
  • 异常检测。

这个阶段的 AI 更偏向“从数据中学习规律”。

ChatGPT 的出现,让生成式 AI 快速进入大众市场。

AI 不再只是做分类、预测和推荐,而是开始生成内容:

  • 写文章。
  • 写代码。
  • 生成图片。
  • 总结文档。
  • 回答问题。
  • 辅助办公。
  • 参与软件开发。

这也是当前 AI 热潮的核心背景。

AI 重要,不只是因为它“看起来聪明”,而是因为它能改变处理信息和完成工作的方式。

很多重复性工作可以交给 AI 辅助处理。

例如:

  • 日志分析。
  • 客服问答。
  • 文档总结。
  • 数据分类。
  • 内容生成。
  • 告警归因。

这些任务以前需要大量人工时间,现在可以通过 AI 提高处理效率。

AI 能从大量数据中发现人不容易直接看出来的模式。

例如:

  • 风险评估。
  • 需求预测。
  • 用户行为分析。
  • 异常检测。
  • 根因分析。

它不能替代人的最终判断,但可以提供更丰富的信息和建议。

AI 还能降低创造成本。

以前做一个原型、写一份文档、生成一段代码、整理一批资料,都需要比较长时间。现在 AI 可以参与草稿、分析、生成和迭代,让人把更多精力放在判断、设计和创造上。

理解 AI,可以先抓住三类核心技术。

机器学习的核心是:

让机器从数据中学习规律

传统程序通常是人写好规则:

输入 -> 人写的规则 -> 输出

机器学习则是:

数据 -> 模型学习规律 -> 面对新输入做预测

常见应用包括:

  • 推荐系统。
  • 情感分析。
  • 欺诈检测。
  • 异常检测。
  • 预测分析。

自然语言处理,也就是 NLP,目标是让机器理解和生成人类语言。

常见应用包括:

  • 聊天机器人。
  • 语音识别。
  • 机器翻译。
  • 语义搜索。
  • 文档摘要。
  • 智能客服。

大语言模型本质上也是 NLP 方向的重要成果,只是它的能力已经远远超过早期的文本分类和关键词匹配。

神经网络是一类受到人脑神经元启发的模型结构。

它通过多层参数连接,从数据中学习复杂模式。

深度学习就是基于多层神经网络发展起来的技术体系。图像识别、语音识别、自然语言理解、生成式 AI,都和深度学习密切相关。

AI 可以按能力范围分成几类。

狭义 AI 也叫 ANI,是当前最常见的 AI。

它擅长完成特定任务,但不能真正跨领域理解世界。

例如:

  • 推荐算法。
  • 人脸识别。
  • 语音助手。
  • 搜索排序。
  • 图像分类模型。

它们在单个任务上可能很强,但离开任务边界后能力就会明显下降。

通用 AI 也叫 AGI。

它指的是像人一样具备广泛认知能力的 AI,可以学习不同领域任务,并进行跨领域迁移。

目前 AGI 仍然是长期目标,还没有真正实现。

生成式 AI 是当前最热门的方向。

它能够生成新内容,例如:

  • 文本。
  • 图片。
  • 音频。
  • 视频。
  • 代码。

大语言模型、文本生成图片模型、视频生成模型,都属于生成式 AI 的代表。

生成式 AI 的关键变化在于:AI 不只是识别和预测,还可以参与创造。

AI 已经进入很多行业。

  • 数据分析。
  • 报表生成。
  • 智能客服。
  • 知识库问答。
  • 流程自动化。
  • 异常流量检测。
  • 威胁识别。
  • 告警聚合。
  • 攻击行为分析。
  • 安全日志检索。
  • 日志分析。
  • 指标异常检测。
  • 根因定位。
  • 故障总结。
  • 自动生成排查建议。
  • 辅助诊断。
  • 医学影像分析。
  • 药物研发。
  • 个性化治疗建议。
  • 欺诈检测。
  • 风险评估。
  • 智能投顾。
  • 交易异常识别。
  • 质量检测。
  • 预测性维护。
  • 库存预测。
  • 商品推荐。
  • 客户行为分析。

AI 很强,但并不完美。

AI 从数据中学习。如果训练数据本身存在偏见,模型也可能学习并放大这些偏见。

例如招聘、风控、推荐、内容审核等场景,都需要格外关注数据公平性。

AI 需要大量数据。

这会带来问题:

  • 数据是否经过授权。
  • 用户隐私是否被保护。
  • 训练数据是否包含敏感信息。
  • 生成内容是否涉及版权。

这些都不是纯技术问题,而是技术、法律和伦理共同交织的问题。

AI 会替代一部分重复性工作,也会创造新的工作方式。

更现实的变化可能不是“所有岗位消失”,而是很多岗位的工作内容会被重塑。

会使用 AI 的人,可能会比完全不用 AI 的人更有优势。

很多深度学习模型像黑盒。

它能给出结果,但很难解释为什么这样判断。

在医疗、金融、安全等高风险领域,可解释性非常重要。否则模型结果很难被审计和信任。

八、Search + AI:为什么 RAG 很重要

Section titled “八、Search + AI:为什么 RAG 很重要”

Elastic 的文章特别强调 Search 和 AI 的结合。

这个方向很关键。

AI 擅长理解、总结和生成,但它不一定知道你的私有数据,也可能出现幻觉。

Search 擅长从大量数据中找到相关信息,但它本身不负责像人一样组织答案。

两者结合,就形成了现在很常见的 RAG:

RAG = Retrieval-Augmented Generation
RAG = 检索增强生成

可以理解为:

先检索相关资料
再把资料交给大模型
最后由大模型生成回答

流程大概是:

用户问题
-> 搜索 / 向量检索
-> 找到相关文档
-> 拼接上下文
-> 大模型生成答案

这样做的好处是:

  • 回答可以基于真实资料。
  • 可以接入企业内部知识库。
  • 可以减少模型胡编。
  • 可以让答案带来源依据。
  • 数据更新不一定要重新训练模型。

所以在企业级 AI 应用里,RAG 是非常重要的一种架构方式。

如果从开发者视角看,可以把 AI 的发展链路理解成:

Machine Learning
-> Deep Learning
-> Neural Networks
-> NLP
-> LLM
-> Generative AI
-> Search + RAG

也可以更工程化地理解成:

数据
-> 模型
-> 推理服务
-> 搜索 / 向量数据库
-> 业务系统
-> 用户体验

AI 不只是模型本身。

真正落地时,还要考虑:

  • 数据怎么来。
  • 文档怎么切分。
  • 向量怎么生成。
  • 检索怎么召回。
  • Prompt 怎么组织。
  • 模型怎么部署。
  • 成本怎么控制。
  • 权限怎么隔离。
  • 答案怎么评估。

这些才是 AI 应用从 Demo 走向生产系统时真正要面对的问题。

AI 是一个很大的概念。

它可以是机器学习,可以是自然语言处理,可以是大语言模型,也可以是生成式 AI 应用。

但最核心的理解可以先记住一句话:

AI 是让机器从数据中学习,并完成理解、判断、生成和决策任务的技术体系。

当前最值得关注的方向,是生成式 AI 和 Search/RAG 的结合。

因为单纯的大模型并不能解决所有问题。它需要搜索、数据、权限、知识库和工程系统配合,才能在真实业务里产生稳定价值。