内容目录
什么是AI?
人工智能(AI)指致力于执行接近人类智能任务(如语音识别、语言翻译、视觉感知)的计算机系统,核心是软件产生的智能。
什么是大语言模型(LLM)(Large Language Model)?
Large
能力、规模与覆盖范围的 “大”。
既包括参数量的规模(如 GPT-3 达 1750 亿参数),也涵盖训练数据的海量性(如 Llama 2 基于 2 万亿词元训练),更强调处理复杂语言任务的综合能力。
“Large” 不局限于参数量,还包括模型的语言理解与应用适配能力。
Language
核心处理对象 —— 人类语言。
涵盖语言的理解、处理、生成全流程,包括文本的语义捕捉(如 word2vec 的词嵌入)、上下文建模(如注意力机制)、多场景语言任务(分类、翻译、摘要等)。
让计算机具备类人语言能力。
Model
语言处理能力的 AI 技术框架。
通过数据训练形成参数化的计算模型,包括仅编码器的表示模型(如 BERT)和仅解码器的生成模型(如 GPT 系列)。
大语言模型
以人类语言为核心处理对象,通过大规模训练数据和适配架构,具备强大语言理解、处理与生成能力的人工智能模型。
什么大语言模型(LLM)(Large Language Model)