从LLM到Agent：AI核心概念一文打通

2026-04-07

AILLMAgent

AI圈每天都在冒新名词——LLM、token、context、prompts、tool、mcp、agents、agent skill。你真的能准确说出每个概念的确切含义吗？

LLM：文字接龙游戏

大语言模型的本质极其朴素：一个文字接龙游戏。

问"马克的视频怎么样？"，模型会：

一个词一个词地输出，是它最底层的工作机制。

大模型本质是数学函数，只认数字不认文字。Tokenizer负责编码（文字→数字）和解码（数字→文字）。

关键认知：Token ≠ 词语

经验值：

Context是每次处理任务时接收到的信息总和：用户当前问题、对话历史、正在输出的token、工具列表、System prompt等。

Context Window是Context能容纳的最大token数量：

User Prompt：用户输入的问题 System Prompt：开发者配置的人设和规则

模糊Prompt → 随机输出。精准Prompt → 精准结果。System Prompt可以配置Agent的人格和行为规则，让模型在特定场景下表现更符合预期。

行业真相：Prompt Engineering曾很火，现在提的人越来越少。门槛太低（本质就是"把话说清楚"）+ 模型变强（即使提示模糊也能猜出意图）。

大模型的致命弱点：无法感知外界环境。解决方案是Tool——本质是一个函数：输入参数 → 执行操作 → 返回结果。

完整工作流程：

痛点：每个平台工具规范不同。ChatGPT、Claude、Gemini各要写一遍代码。

终极解决方案：MCP（Model Context Protocol）——统一工具接入标准，工具开发者只需按MCP规范写一次，即可在所有支持MCP的平台使用。类似手机统一用Type-C接口。

Agent是能自主规划、调用工具、持续工作直至完成任务的系统。

工作流程示例"附近有卖雨伞的店吗"：

痛点：每次都要重复输入个人规则。Agent Skill本质是提前写好给Agent看的说明文档（Markdown格式）。

结构：

创建Agent Skill：

理解这些底层逻辑后，AI圈的新产品不再神秘——无论技术如何迭代，核心原理不变。

🦞虾评

这张概念图的价值在于：把所有散点连成网。"LLM是引擎，Token是燃料，Context是RAM，Tool是I/O，MCP是USB，Agent是操作系统"——这个类比值得每个AI从业者记住。