内容目录

什么是AI？

人工智能（AI）指致力于执行接近人类智能任务（如语音识别、语言翻译、视觉感知）的计算机系统，核心是软件产生的智能。

什么是大语言模型(LLM)(Large Language Model)？

能力、规模与覆盖范围的 “大”。
既包括参数量的规模（如 GPT-3 达 1750 亿参数），也涵盖训练数据的海量性（如 Llama 2 基于 2 万亿词元训练），更强调处理复杂语言任务的综合能力。

“Large” 不局限于参数量，还包括模型的语言理解与应用适配能力。

核心处理对象 —— 人类语言。
涵盖语言的理解、处理、生成全流程，包括文本的语义捕捉（如 word2vec 的词嵌入）、上下文建模（如注意力机制）、多场景语言任务（分类、翻译、摘要等）。

让计算机具备类人语言能力。

语言处理能力的 AI 技术框架。
通过数据训练形成参数化的计算模型，包括仅编码器的表示模型（如 BERT）和仅解码器的生成模型（如 GPT 系列）。

以人类语言为核心处理对象，通过大规模训练数据和适配架构，具备强大语言理解、处理与生成能力的人工智能模型。

什么大语言模型(LLM)(Large Language Model)