特性描述
可用性Grok 4.1现已在grok.com、𝕏以及iOS和Android应用上向所 …

特性描述
可用性Grok 4.1现已在grok.com、𝕏以及iOS和Android应用上向所有用户开放。立即在自动模式下推出,并可以在模型选择器中明确选择“Grok 4.1”。
改进点在创意、情感和协作互动方面表现出色;对细微意图更加敏感;对话更具吸引力;个性更加一致,同时完全保留了前代产品的敏锐智能与可靠性。
技术进步使用了与Grok 4相同的大型强化学习基础设施来优化模型的风格、个性、帮助性和一致性。开发了新方法,允许使用前沿代理推理模型作为奖励模型,以自主地大规模评估和迭代响应。
静默部署从2025年11月1日至14日,逐步向越来越多的生产流量推出了初步的Grok 4.1版本。期间进行了连续的盲配对评估。
用户偏好相比之前的生产模型,在流量中的偏好率为64.78%。
通用能力在盲人偏好评估中设定了新的标准。
LMArena Text Leaderboard表现思考模式(代号:quasarflux)排名第一,得分为1483 Elo;非思考模式(代号:tensor)排名第二,得分为1465 Elo。
情商在EQ-Bench3测试中展示了卓越的情感智能能力,包括理解力、洞察力、同理心及人际交往技巧。
创造性写作在Creative Writing v3基准测试中取得了高分,证明了其在创作性内容生成方面的强大能力。
减少幻觉现象通过专注于减少信息查询提示中的事实错误,显著降低了快速(非推理)模型的幻觉率。
📅 0001-01-01 ⏱️ 1 分钟 📝 32 字

LangGraph技术底座

LangGraph 技术架构与实现详解

本文档旨在全面剖析 LangGraph 的技术架构与底层实现。LangGraph 是一个用于构建有状态、可循环、多参与者(Multi-agent)应用的强大框架,它作为 LangChain 生态的关键 …

LangGraph技术底座

LangGraph 技术架构与实现详解

本文档旨在全面剖析 LangGraph 的技术架构与底层实现。LangGraph 是一个用于构建有状态、可循环、多参与者(Multi-agent)应用的强大框架,它作为 LangChain 生态的关键扩展,为复杂的 AI 工作流提供了图计算的能力。

1. 顶层架构与设计哲学 (High-Level Architecture)

从最高层面看,LangGraph 的设计目标是将复杂的 AI 应用逻辑,特别是那些包含循环、条件分支和状态依赖的 Agentic 工作流,抽象为一个可计算、可观测、可持久化的有向图。其核心架构思想可以概括为以下几点:

  • 图即应用 (Graph as Application):将整个应用程序的工作流程建模为一个有向图(Directed Graph)。图中的节点 (Node) 代表计算单元(如调用 LLM、执行工具、处理数据),而边 (Edge) 代表控制流和数据流的方向。
  • 状态机范式 (State Machine Paradigm):整个图的执行过程被视为一个状态机。存在一个全局共享的状态 (State) 对象,在整个图的执行过程中被持久化和传递。每个节点接收当前状态,执行其逻辑,然后返回对状态的更新。这种模式使得应用的状态变迁清晰可追溯。
  • 声明式定义 (Declarative Definition):开发者通过声明式的 API 来“绘制”这张图——定义节点、定义边、设置入口和出口。开发者更关注“做什么”(What),而不是“如何执行”(How),具体的调度、并发和状态管理由框架处理。
  • 人机协同原生支持 (Human-in-the-Loop Native Support):架构层面内置了中断和恢复的能力。图可以在任意节点暂停,等待外部(如人工审批)输入,然后再从断点处无缝恢复执行,这对于构建需要人工干预的复杂流程至关重要。

下图描绘了 LangGraph 的高层逻辑视图:

+-------------------------------------------------+
|               Application Layer                 |
| (e.g., Multi-agent System, ReAct Loop, CoT)     |
+----------------------+--------------------------+
                       | (Defines the flow)
                       v
+-------------------------------------------------+
|             LangGraph API & Core Logic          |
|  +-----------------+  +-----------------------+ |
|  |  Graph Builder  |  |   Execution Engine    | |
|  | (Nodes, Edges)  |  | (Scheduler, Executor) | |
|  +-----------------+  +-----------------------+ |
|  +-----------------+  +-----------------------+ |
|  |  State Manager  |  | Checkpoint & Persist  | |
|  +-----------------+  +-----------------------+ |
+----------------------+--------------------------+
                       | (Leverages & Extends)
                       v
+-------------------------------------------------+
|          LangChain Ecosystem (LCEL, etc.)       |
|  +-------+   +-------+   +---------+   +------+ |
|  | LLMs  |   | Tools |   | Prompts |   | Memory |
|  +-------+   +-------+   +---------+   +------+ |
+-------------------------------------------------+
                       | (Built Upon)
                       v
+-------------------------------------------------+
|          Core Libraries & Python Runtime        |
| (NetworkX, Pydantic, Asyncio, etc.)             |
+-------------------------------------------------+
┌─────────────────────────────────────────────────────┐
│                 Application Layer                   │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐  │
│  │   Agents    │  │   Workflows │  │    Tools    │  │
│  └─────────────┘  └─────────────┘  └─────────────┘  │
├─────────────────────────────────────────────────────┤
│                 Execution Layer                     │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐  │
│  │   Graph     │  │   State     │  │  Checkpoints│  │
│  │  Executor   │  │  Manager    │  │   Manager   │  │
│  └─────────────┘  └─────────────┘  └─────────────┘  │
├─────────────────────────────────────────────────────┤
│                  Core Layer                         │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐  │
│  │   Node      │  │    Edge     │  │   Channel   │  │
│  │  Registry   │  │  Resolver   │  │   System    │  │
│  └─────────────┘  └─────────────┘  └─────────────┘  │
├─────────────────────────────────────────────────────┤
│              Infrastructure Layer                   │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐  │
│  │ Persistence │  │ Concurrency │  │ Observability│  │
│  │   Layer     │  │   Control   │  │   System    │  │
│  └─────────────┘  └─────────────┘  └─────────────┘  │
└─────────────────────────────────────────────────────┘

2. 核心组件与技术栈 (Core Components & Tech Stack)

为了实现上述顶层设计,LangGraph 精心选择并整合了一系列成熟的技术组件,形成了一个分层、解耦的技术栈。

📅 0001-01-01 ⏱️ 16 分钟 📝 3383 字