OpenAgent (oa) 技术文档

基于 Ink + AI SDK 的终端 AI Agent 客户端 (TUI)

1. 项目概述

OpenAgent（简称 oa）是一个运行在终端中的 AI Agent 客户端，基于 Ink（React 渲染终端 UI）和 AI SDK（流式文本生成 + 工具调用）构建。用户可以在终端中输入文本与 AI 对话，AI 可以调用内置工具读取/写入文件、执行 Bash 命令、搜索网络等。

核心特性

流式对话：实时显示 AI 生成的文本和推理过程
工具调用：11 个内置工具 + skill 动态工具，支持文件操作、命令执行、网络请求等
交互式审批：写入类操作需要用户确认，支持"始终批准"偏好持久化
会话管理：自动保存/加载对话历史，支持多会话切换
@ 文件引用：输入 @ 可引用项目文件，自动内联文件内容
斜杠命令：15 个内置命令，支持补全和参数
主题系统：3 套终端主题可切换（dark / light / mayday）
国际化：内置中文/英文，支持第三方语言扩展包
Skill 系统：支持从 ~/.agents/skills/ 加载扩展技能
Channel 插件：通过插件系统接入微信、Telegram 等消息平台，实现远程控制
自更新：/update 命令一键检查并更新到最新版本

2. 技术栈

类别	技术	版本
运行时	Node.js	>= 22
语言	TypeScript	5.x
UI 框架	Ink 7 + React 19	—
AI SDK	Vercel AI SDK (`ai`)	最新
Provider	`@ai-sdk/openai-compatible`	—
Markdown	`marked`	—
包管理	pnpm (workspaces)	>= 10.32.1
构建工具	tsup (esbuild)	8.x
代码规范	ESLint + Prettier	—
提交规范	commitlint + commitizen	—
Git Hooks	Husky + lint-staged	—

3. 项目结构

完整项目结构参见 project-structure.md。

4. 架构总览

4.1 分层架构

block-beta
    columns 1
    block:Terminal["Terminal (终端)"]
        columns 1
        block:Ink["Ink (React TUI)"]
            columns 3
            Input["Input\nComponents"] Messages["Messages\nRender"] Status["Status\nBars"]
            block:Hook["useChatStream (Hook) — 状态机: idle → streaming → awaiting"]
                columns 1
            end
            block:App["App.tsx (编排)"]
                columns 1
            end
        end
        block:Engine["Engine Layer"]
            columns 3
            runAgent["runAgent\n(streamText)"] provider["provider\n(OpenAI compat.)"] skill["skill\nloader"]
            block:Tools["Tools Registry — read / write / edit / bash / grep / ..."]
                columns 1
            end
        end
        block:External["External Services"]
            columns 3
            AIAPI["AI API\n(OpenAI compat.)"] Search["Search\n(DuckDdg / API)"] FS["Filesystem\n(Node fs)"]
        end
    end

    Input --> Hook
    Messages --> Hook
    Hook --> App
    App --> Engine
    Engine --> External

4.2 组件树

graph TD
    App["App"]
    App --> ThemeProvider["ThemeProvider (主题上下文)"]
    ThemeProvider --> AppContent["AppContent"]

    AppContent --> Header["Header — 顶部状态栏"]
    AppContent --> MessageList["MessageList — 历史消息列表"]
    AppContent --> Streaming["流式消息实时渲染"]
    AppContent --> Input["Input — 主输入（模式切换调度器）"]
    AppContent --> StatusBar["StatusBar — 底部状态栏"]

    MessageList --> UserMessage["UserMessage — 用户消息"]
    MessageList --> PartRenderer["PartRenderer — AI 回复片段分发"]

    PartRenderer --> TextPart["TextPart — 文本 (Markdown)"]
    PartRenderer --> ReasoningPart["ReasoningPart — 推理过程"]
    PartRenderer --> ToolCallPart["ToolCallPart — 工具调用展示"]
    PartRenderer --> FilePart["FilePart — 文件片段"]

    Input --> ApprovalDialog["ApprovalDialog — 工具审批弹窗"]
    Input --> SessionPicker["SessionPicker — 会话选择弹窗"]
    Input --> ThemePicker["ThemePicker — 主题选择弹窗"]
    Input --> CommandInput["CommandInput — 命令输入 + CommandPalette"]
    Input --> FileMentionInput["FileMentionInput — @文件引用 + FilePicker"]
    Input --> TextInput["TextInput — 普通文本输入"]

5. 启动流程

flowchart TD
    A["node dist/index.js (或 pnpm dev)"] --> B["src/index.tsx<br/>render(&lt;App /&gt;)"]
    B --> C["App.tsx — 状态初始化<br/>1. process.cwd()<br/>2. ThemeProvider (默认 mayday)<br/>3. AppContent"]
    C --> D["AppContent"]

    D --> D1["useFileIndex(cwd)<br/>git ls-files → FileEntry[]<br/>fallback: walkFs()"]
    D --> D2["isConfigReady() 检查<br/>未配置时追加欢迎提示消息"]
    D --> D3["useChatStream({ fileIndex, cwd })<br/>messages / displayMessages / status<br/>send / approvePendingTool / ..."]
    D --> D4["useInput(handleKeyboard)<br/>Ctrl+R → showReasoning<br/>Ctrl+O → showToolDetails<br/>Ctrl+C / Esc → 取消"]
    D --> D5["渲染: Header → Messages → Input → StatusBar"]

6. 配置系统

6.1 配置来源与优先级

flowchart TD
    A["环境变量 (最高优先级)"] -->|合并（env 覆盖文件值）| B["配置文件 ~/.openagent/config.json"]
    B -->|缺失值抛出异常| C["最终配置对象"]

6.2 配置项

配置项	环境变量	必填	默认值	说明
`providers`	—	是	`[]`	供应商列表，每个包含 `name`、`baseUrl`、`apiKey`、`models`
`activeModel`	—	是	—	当前激活模型，格式 `"供应商名/模型名"`
`maxSteps`	`OPENAGENT_MAX_STEPS`	否	20	Agent 最大执行步数 (1-20)
`channels`	—	否	`[]`	Channel 插件包名列表，如 `["@oagent/weixin"]`
`locale.lang`	—	否	`zh`	界面语言（`zh` / `en`）
`locale.plugins`	—	否	`[]`	第三方语言扩展包名列表

环境变量 OPENAGENT_BASE_URL、OPENAGENT_API_KEY、OPENAGENT_MODEL 可作为单供应商快捷覆盖（会创建名为 env 的临时供应商）。

6.3 配置文件格式

{
    "providers": [
        {
            "name": "OpenAI",
            "baseUrl": "https://api.openai.com/v1",
            "apiKey": "sk-xxx",
            "models": ["gpt-4o", "gpt-4o-mini"]
        },
        {
            "name": "Anthropic",
            "baseUrl": "https://api.anthropic.com",
            "apiKey": "sk-ant-xxx",
            "models": ["claude-sonnet-4-20250514"]
        }
    ],
    "activeModel": "OpenAI/gpt-4o",
    "maxSteps": 20,
    "channels": ["@oagent/weixin"],
    "locale": {
        "lang": "zh",
        "plugins": []
    }
}

6.4 导出函数

isConfigReady(): boolean                  // 检查 providers 非空且 activeModel 有效
getApiKey(): string                       // 获取当前激活供应商的 API Key
getBaseUrl(): string                      // 获取当前激活供应商的 Base URL
getModelName(): string                    // 获取当前激活的模型名（不含供应商前缀）
getActiveProviderName(): string           // 获取当前激活供应商的名称
getProviders(): ProviderConfig[]          // 获取所有供应商列表
getAllModelOptions(): string[]             // 获取所有 "供应商名/模型名" 格式的选项
setActiveModel(provider, model): void     // 切换当前激活的模型
getMaxSteps(): number                     // 获取最大步数（默认 20，范围 1-20）
getConfiguredChannels(): string[]         // 获取已配置的 Channel 插件列表
getConfigSummary()                        // 获取配置摘要（含 provider、API Key 脱敏）
saveConfig(config): void                  // 保存配置到文件
reloadConfig(): void                      // 重新加载配置

6.5 全局常量

APP_NAME = 'Open Agent' — 应用名称
CONFIG_PATH — 配置文件完整路径（~/.openagent/config.json）
MAX_FILE_SIZE = 1024 * 1024 — 文件读取和 grep 的大小上限（1MB）
DEFAULT_MAX_STEPS = 20 — 默认最大步数
SKIP_DIRS — 文件索引和 grep/glob 时跳过的目录：node_modules, .git, dist, .next, .coverage, .cache, out

6.6 目录工具函数

getOpenAgentDir() 返回 ~/.openagent 目录路径，所有读写该目录的代码统一使用此函数。

7. Engine 系统

7.1 概述

Engine 系统是 OpenAgent 的核心，负责与 AI 模型交互。它基于 Vercel AI SDK 的 streamText 实现流式文本生成和工具调用。Engine 模块位于 packages/core/src/engine/，包含五个子模块：

engine/agents/ — runAgent() 函数（核心 AI 循环）
engine/tools/ — 11 个内置工具 + 共享工具逻辑
engine/skill/ — 外部 Skill 加载（~/.agents/skills）
engine/config/ — Provider 配置和系统提示词生成
engine/middleware/ — AI SDK 中间件（429 限流重试通知）

7.2 Provider

位于 engine/config/provider.ts，使用 @ai-sdk/openai-compatible 创建兼容 OpenAI API 的 provider：

import { createOpenAICompatible } from '@ai-sdk/openai-compatible';

export function getProvider() {
    return createOpenAICompatible({
        name: 'custom',
        apiKey: getApiKey(),
        baseURL: getBaseUrl()
    });
}

7.3 runAgent

export async function runAgent(messages: ModelMessage[], abortSignal?: AbortSignal, opts?: { maxRetries?: number }): Promise<ReturnType<typeof streamText>>;

核心调用逻辑：

const result = streamText({
    model: getProvider()(getModelName()),
    stopWhen: stepCountIs(getMaxSteps()),
    system: getSystemPrompt(),
    messages,
    tools: {
        skill, // 动态 skill 工具（从 ~/.agents/skills/ 加载）
        ...tools // 10 个内置工具
    },
    abortSignal,
    maxRetries: opts?.maxRetries ?? 10,
    onError: ({ error }) => console.error('[runAgent] stream error:', error)
});

model: 通过 provider 和配置的模型名创建
stopWhen: 最多执行 maxSteps 步
system: 系统提示词（每次调用时动态生成），包含基础提示和项目上下文（从 AGENTS.md 文件读取）
messages: 对话历史
tools: skill 工具 + 10 个内置工具（skill 在 runAgent 中动态注入，不在 tools 对象中静态定义）
abortSignal: 支持用户取消
maxRetries: 默认 10 次重试，可通过 opts 覆盖
onError: 流式错误日志回调

系统提示词由 system-prompt.ts 的 getSystemPrompt() 函数动态生成，每次 streamText 调用时执行，包含两部分：

基础提示：描述 OA 的身份、能力和工作方式
项目上下文：从当前工作目录的 AGENTS.md 文件读取（如果存在），提供项目特定的指导信息

7.4 Skill 系统

import { createSkillTool } from 'bash-tool';

const getSkill = async () => {
    const { skill } = await createSkillTool({
        skillsDirectory: path.join(os.homedir(), '.agents', 'skills')
    });
    return { skill };
};

Skills 存放在 ~/.agents/skills/ 目录下，使用 bash-tool 包的 experimental_createSkillTool 加载。

7.5 Middleware

位于 engine/middleware/retry-notification.ts，提供 429 限流重试通知中间件：

export function createRetryNotificationMiddleware(maxRetries: number): LanguageModelMiddleware;

基于 AI SDK 的 LanguageModelMiddleware 接口实现
捕获 429 状态码错误，从响应头提取重试延迟时间（支持 retry-after-ms 和 Retry-After）
通过全局回调 setRetryCallback() 通知 UI 层显示重试信息（Tips 组件）
指数退避计算与 AI SDK 内部逻辑保持一致

8. 工具系统

8.1 工具注册表

所有工具在 packages/core/src/engine/tools/index.ts 中注册：

export const tools = {
    read_file: readFileTool,
    read_directory: readDirectoryTool,
    write_file: writeFileTool,
    edit_file: editFileTool,
    execute_bash: executeBashTool,
    grep: grepTool,
    glob: globTool,
    fetch: fetchTool,
    web_search: webSearchTool,
    ask_user_question: askUserQuestionTool,
    date: dateTool
};

8.2 工具详细说明

read_file — 读取文件

属性	值
参数	`path: string`, `startLine?: number`, `endLine?: number`
审批	无需
限制	最大文件大小 1MB
返回	`{ path, content, startLine, endLine, totalLines }`

read_directory — 读取目录

属性	值
参数	`path: string`
审批	无需
返回	`{ path, entries: [{ name, isDirectory, isFile, path }] }`

write_file — 写入文件

属性	值
参数	`path: string`, `content: string`, `overwrite?: boolean`
审批	需要
返回	`{ path, bytes, created, overwritten }`

edit_file — 编辑文件

属性	值
参数	`path: string`, `old_string: string`, `new_string: string`, `replace_all?: boolean`
审批	需要
验证	`old_string` 必须存在且唯一（除非 `replace_all`）
返回	`{ path, replacements, totalLines }`

execute_bash — 执行 Bash 命令

属性	值
参数	`command: string`, `timeout?: number`
审批	动态判断：只读命令无需审批，写入命令需要
限制	最大输出 1MB，默认超时 30s
返回	`{ command, exitCode, stdout, stderr, truncated }`

只读命令集 (READONLY_COMMANDS)：ls, cat, grep, diff, find（无 -exec）、git（只读子命令）、npm list、node -v 等 40+ 命令。

危险命令模式 (DANGEROUS_PATTERNS)：

模式	说明
`rm -rf /`	递归删除根目录
`mkfs.*`	格式化磁盘
`dd.*of=/dev/`	直接写入设备
`sudo`	提权执行
`su -`	切换用户
`shutdown` / `reboot`	关机/重启
`:(){ ... }`	Fork 炸弹
`> /dev/sd`	覆盖磁盘设备

grep — 搜索文件内容

属性	值
参数	`pattern`, `path`, `caseSensitive?`, `recursive?`, `glob?`, `context?`, `head_limit?`, `output_mode?`
审批	无需
限制	最大 200 匹配，单文件最大 1MB
支持	正则表达式、上下文行、glob 过滤、三种输出模式

glob — 文件匹配

属性	值
参数	`pattern: string`, `path?: string`
审批	无需
限制	最大 200 匹配
支持	``, `?`, `*` 通配符

fetch — HTTP 请求

属性	值
参数	`url`, `method?`, `headers?`, `body?`, `prompt?`
审批	无需
安全	SSRF 防护（阻止内网/本地地址）
限制	最大响应 50KB
特性	`prompt` 参数支持关键词聚焦

web_search — 网络搜索

属性	值
参数	`query: string`, `max_results?: number` (最大 10，默认 5)
审批	无需
后端	(1) 配置 API (`OPENAGENT_SEARCH_API_URL`/`OPENAGENT_SEARCH_API_KEY`) (2) DuckDuckGo HTML 抓取
返回	`{ query, results: [{ title, url, snippet }], provider }`

ask_user_question — 向用户提问

属性	值
参数	`question: string`, `options: string[]` (2-4 个), `header?: string`
审批	需要
返回	`{ question, options, header, status: 'awaiting_user_selection' }`

date — 获取当前日期时间

属性	值
参数	无
审批	无需
返回	`{ iso, date, time, timezone, dayOfWeek, timestamp }`

用于 AI 在回答时间敏感问题前获取当前日期时间信息。

8.3 工具审批流程

flowchart TD
    A["AI 模型决定调用工具"] --> B{"needsApproval 检查"}
    B -->|read_file / read_directory<br/>grep / glob / fetch / web_search| C["直接执行"]
    B -->|write_file / edit_file<br/>ask_user_question| D["弹出 ApprovalDialog"]
    B -->|execute_bash| E{"只读命令?"}
    E -->|是| C
    E -->|否| D
    D -->|批准| F["继续执行"]
    D -->|拒绝| G["跳过并返回拒绝原因"]

9. 命令系统

9.1 命令接口

interface SlashCommand {
    name: string; // 如 '/help'
    description: string; // 人类可读描述
    run: (ctx: CommandContext) => void | Promise<void>;
}

9.2 CommandContext

命令执行时接收的上下文对象，包含应用状态和回调：

interface CommandContext {
    rawInput: string; // 原始输入
    args: string[]; // 解析后的参数
    cwd: string; // 当前工作目录
    fileIndexCount: number; // 索引文件数
    messages: ModelMessage[]; // 当前对话消息
    displayMessages: UIMessage[]; // 当前 UI 消息
    pendingApproval: boolean; // 是否有待审批
    appendMessages: (items) => void; // 追加消息
    setSession: (msgs, display) => void; // 设置会话
    resetSession: () => void; // 重置会话
    saveCurrentSession: () => Promise<void>; // 保存会话
    cancelResponse: () => void; // 取消响应
    reloadFileIndex: () => Promise<number>; // 重新加载文件索引
    exit: () => void; // 退出
    listCommands: () => SlashCommand[]; // 列出命令
    showSessionPicker: (sessions) => void; // 显示会话选择器
    themeName: ThemeName; // 当前主题名
    setThemeName: (name) => void; // 设置主题
    showThemePicker: () => void; // 显示主题选择器
    showConfigPicker: () => void; // 显示配置选择器
}

9.3 命令解析流程

flowchart TD
    A["用户输入 /help config"] --> B["parseCommandInput()<br/>→ name=help, args=config"]
    B --> C["findCommand(help)<br/>→ helpCommand"]
    C --> D["helpCommand.run(ctx)<br/>→ 输出命令帮助信息"]

9.4 全部命令

命令	说明
`/help [命令名]`	列出所有命令，或显示指定命令的帮助
`/status`	显示 cwd、文件索引数、消息数、审批状态
`/config`	打开配置选择器，编辑配置文件
`/approvals`	管理工具审批偏好（execute_bash/write_file/edit_file）
`/theme [主题名]`	打开主题选择器或直接设置主题
`/tools`	列出所有内置工具名
`/channel`	管理消息渠道（start/stop/login/logout/status），支持微信、Telegram
`/locale [语言]`	查看当前语言或切换语言（zh/en）
`/reload`	重新扫描工作目录，刷新文件索引
`/cancel`	停止当前流式响应
`/sessions`	列出并恢复已保存会话
`/clear`	保存当前会话后重置
`/update`	检查并更新 oa 到最新版本
`/exit`	保存会话、停止所有渠道、退出 TUI

10. Hook 系统

10.1 useChatStream

核心聊天状态机，管理对话的完整生命周期。

状态机

stateDiagram-v2
    [*] --> idle
    idle --> streaming: send()
    streaming --> idle: 响应完成
    streaming --> awaiting_approval: 工具调用需要审批
    awaiting_approval --> streaming: approvePendingTool()<br/>alwaysApprovePendingTool()<br/>denyPendingTool()<br/>selectQuestionOption()

导出接口

interface UseChatStreamResult {
    messages: ModelMessage[]; // 模型对话历史
    displayMessages: UIMessage[]; // UI 展示消息
    status: ChatStatus; // 'idle' | 'streaming' | 'awaiting_approval'
    usage: UsageInfo | null; // token 使用统计
    modelId: string; // 模型 ID
    pendingApproval: PendingToolApproval | null; // 待审批工具信息
    send: (text: string) => Promise<void>; // 发送消息
    approvePendingTool: () => Promise<void>; // 批准待审批工具
    alwaysApprovePendingTool: () => Promise<void>; // 批准并记住偏好
    denyPendingTool: (reason?) => Promise<void>; // 拒绝待审批工具
    selectQuestionOption: (option) => Promise<void>; // 选择问题选项
    appendMessages: (items) => void; // 追加消息
    setSession: (msgs, display) => void; // 设置会话
    reset: () => void; // 重置
    cancel: () => void; // 取消
}

流式事件处理

AI SDK 的流包含 13 种事件类型：

事件	处理方式
`text-start`	创建新的文本 part
`text-delta`	追加文本增量
`text-end`	标记文本完成
`reasoning-start`	创建推理 part
`reasoning-delta`	追加推理增量
`reasoning-end`	标记推理完成
`tool-input-start`	创建工具调用 part
`tool-input-delta`	追加工具参数增量
`tool-input-available`	工具参数完整可用
`tool-approval-request`	设置 `awaiting_approval` 状态
`tool-input-error`	工具参数解析错误
`tool-output-available`	工具执行结果可用
`tool-output-error`	工具执行错误
`tool-output-denied`	工具调用被拒绝
`file`	文件附件
`error`	通用错误

send() 流程

flowchart TD
    A["send(text)"] --> B{"isConfigReady()?"}
    B -->|否| B1["显示错误提示并返回"]
    B -->|是| C["追加用户消息 + 空 AI 消息到 displayMessages"]
    C --> D["展开 @mentions → expandMentions(text, fileIndex, cwd)"]
    D --> E["过滤 system 消息，追加用户消息到 messages"]
    E --> F["streamMessages(messages)"]

    F --> F1["runAgent(messages, abortSignal)"]
    F1 --> F1a["getProvider + getModelName"]
    F1 --> F1b["getSkill()"]
    F1 --> F1c["streamText({ model, tools, stopWhen })"]

    F --> F2["遍历 toUIMessageStream() 事件<br/>按事件类型更新 displayMessages"]
    F --> F3["await result.response → 合并到 messages"]
    F --> F4["await result.totalUsage → 更新 usage 统计"]

10.2 useFileIndex

interface UseFileIndexResult {
    fileIndex: FileEntry[]; // 文件条目列表
    status: FileIndexStatus; // 'indexing' | 'ready' | 'error'
    reload: () => Promise<number>; // 手动刷新
}

组件挂载时异步加载 loadFileIndex(cwd)
支持 reload() 手动刷新
通过 cancelled 标志实现安全取消

10.3 useLocaleSetup

export function useLocaleSetup(): void;

启动时加载 config.json 中 locale.plugins 配置的语言扩展包
通过动态 import() 加载第三方语言包，调用其 register() 函数注册语言
设置当前语言为 locale.lang 配置值（默认 zh）
语言扩展包加载失败不阻塞启动

11. UI 组件体系

11.1 Input 组件（模式切换调度器）

Input 组件通过 useInputMode hook 管理输入模式状态机，模式判断优先级从高到低：

flowchart TD
    A{"pendingApproval ≠ null?"} -->|是| M1["approval"]
    A -->|否| B{"sessionPicker ≠ 空?"}
    B -->|是| M2["session"]
    B -->|否| C{"themePickerOpen?"}
    C -->|是| M3["theme"]
    C -->|否| D{"configPickerOpen?"}
    D -->|是| M4["config"]
    D -->|否| E{"disabled?"}
    E -->|是| M5["disabled"]
    E -->|否| F{"输入以 '/' 开头且无空格?"}
    F -->|是| M6["command"]
    F -->|否| G{"@mention 激活中?"}
    G -->|是| M7["file"]
    G -->|否| M8["text"]

覆盖层模式（approval / session / theme / config）统一由 OverlaySlot 组件分发：

approval → ApprovalDialog
session → SessionPicker
theme → ThemePicker
config → ConfigPicker（内含 ProviderPicker → ModelPicker 子层级）

审批对话框 (ApprovalDialog)

标准工具审批有三种选项（上下键选择，Enter 确认）：

选项	行为
批准执行	调用 `approvePendingTool()`，批准本次调用
始终批准此类操作	调用 `alwaysApprovePendingTool()`，写入偏好并批准
拒绝	调用 `denyPendingTool()`，拒绝本次调用

ask_user_question 工具显示问题选项列表，支持自定义输入（选择"✏️ 自定义输入..."后进入 TextInput 模式）。

11.2 MessageList

interface MessageListProps {
    messages: UIMessage[]; // UI 消息列表
    showReasoning: boolean; // 是否显示推理过程
    showToolDetails: boolean; // 是否展开工具调用详情
}

使用 React.memo 优化渲染
遍历每条消息，用户消息渲染 UserMessage，AI 消息遍历 parts 渲染 PartRenderer

11.3 PartRenderer 与工具调用分组

PartRenderer 按 part.type 分发到具体渲染器。在渲染前，parts 经过 groupToolParts 函数分组：

graph LR
    subgraph Collapsible["可折叠工具 (Collapsible)"]
        direction TB
        C1[read_file] --> C2[read_directory] --> C3[grep] --> C4[glob] --> C5[fetch] --> C6[web_search]
    end
    subgraph Individual["不可折叠工具 (Individual)"]
        direction TB
        I1[edit_file] --> I2[write_file] --> I3[execute_bash] --> I4[ask_user_question]
    end

    Collapsible -->|连续出现时折叠为| Group["ToolCallGroup<br/>Ctrl+O 切换展开/折叠"]
    Individual -->|始终单独渲染| Single["ToolCallPart"]

分组逻辑：连续的可折叠工具合并为一个 ToolCallGroup（中间跳过 reasoning 片段），Ctrl+O 切换展开/折叠状态。

part.type	渲染组件	说明
`text`	`TextPart` → `Markdown`	文本内容，支持 Markdown
`reasoning`	`ReasoningPart` → `Markdown`	推理过程（暗色显示）
`dynamic-tool` (单个)	`ToolCallPart`	单个工具调用及结果
`dynamic-tool` (分组)	`ToolCallGroup` → `ToolCallPart[]`	多工具调用折叠展示
`file` / `source` / `source-url`	`FilePart`	文件片段

11.4 ToolCallPart 状态图标

状态	图标	含义
`input-streaming`	`⋯`	正在接收参数
`input-available`	`○`	参数就绪
`approval-requested`	`◔`	等待用户审批
`approval-responded`	`◉`	已审批
`output-available`	`●`	结果可用
`output-error` / `output-denied`	`▲`	错误或被拒绝

11.5 Markdown 渲染

Markdown.tsx 支持的元素：

段落、标题 (h1-h6)
代码块（带语法高亮）
行内代码
有序/无序列表（支持嵌套）
引用块
水平分割线
表格（自适应终端宽度）
粗体、斜体、删除线、链接、图片

性能优化：快速路径检测 — hasMarkdownSyntax() 为 false 时直接渲染纯文本。

11.6 MarkdownTable

自动适应终端宽度
当行内容需要超过 4 行换行时，回退为垂直（key-value）布局
使用 ANSI 转义序列直接渲染（非逐单元格 React 组件），提高性能

12. 主题系统

12.1 主题定义

interface Theme {
    accent: string; // 强调色
    accentDim: string; // 暗强调色
    suggestion: string; // 建议色
    success: string; // 成功色
    warning: string; // 警告色
    error: string; // 错误色
    inactive: string; // 非活跃色
    subtle: string; // 微妙色
    text: string; // 文本色
    textDim: string; // 暗文本色
    border: string; // 边框色
    surface: string; // 表面色
    syntax: SyntaxColors; // 语法高亮色
}

interface SyntaxColors {
    keyword: string;
    string: string;
    comment: string;
    function: string;
    number: string;
    type: string;
    operator: string;
    punctuation: string;
}

12.2 内置主题

主题	风格
`dark`	VS Code 暗色风格
`light`	VS Code 亮色风格
`mayday`	五月天配色（蓝强调、橙辅助、绿成功、黄警告、红错误、粉建议）默认主题

12.3 主题使用

// 提供主题上下文，默认主题为 'mayday'
<ThemeProvider>
    <AppContent />
</ThemeProvider>

// 在组件中使用
const { theme, themeName, setThemeName, toggleTheme } = useTheme();

// ThemedText — 自动解析主题色名
<ThemedText color="accent">强调文字</ThemedText>

// ThemedBox — 自动解析边框和背景色
<ThemedBox borderColor="border" backgroundColor="surface">...</ThemedBox>

12.4 颜色解析

resolveColor('accent', theme); // → theme.accent (hex)
resolveColor('#ff0000', theme); // → '#ff0000' (直接返回)
resolveColor(undefined, theme); // → undefined

13. 国际化系统（i18n）

13.1 概述

@oagent/i18n 包提供国际化支持，内置中文（zh）和英文（en）两个语言包，支持通过第三方语言扩展包扩展更多语言。

13.2 核心 API

// 翻译函数，key 支持点分路径，params 支持插值
t(key: string, params?: Record<string, string>): string

// 获取/设置当前语言
getLocale(): string
setLocale(lang: string): void

// 注册语言包（第三方扩展包调用）
registerLocale(code: string, label: string, messages: Record<string, string>): void

// 获取所有已注册语言
getSupportedLocales(): Array<{ code: string; label: string; source: string }>

13.3 语言扩展包

语言扩展包需导出 register(localeCode) 函数，内部调用 registerLocale() 注册语言。在 config.json 中配置：

{
    "locale": {
        "lang": "ja",
        "plugins": ["@oagent/locale-ja"]
    }
}

启动时 useLocaleSetup hook 自动加载扩展包并设置语言。

13.4 翻译键命名规范

command.* — 命令输出文本
tool.* — 工具相关文本
ui.* — UI 组件文本
update.* — 自更新相关文本

14. 工具函数

14.1 files.ts — 文件索引

interface FileEntry {
    path: string;       // 相对于 cwd 的路径
    type: 'file' | 'dir';
}

// 加载文件索引：优先 git ls-files，回退 walkFs()
loadFileIndex(cwd: string): Promise<FileEntry[]>

// 模糊匹配文件：基于评分排序
filterFiles(index: FileEntry[], query: string, limit?: number): FileEntry[]

// 检测 @mention 激活
getActiveMention(value: string): { start: number; query: string } | null

// 展开 @mentions：替换为 <file path="...">content</file>
expandMentions(text: string, index: FileEntry[], cwd: string): Promise<string>

模糊匹配评分规则（从高到低）：

精确词干匹配
精确文件名匹配
文件名以 query 开头
词干以 query 开头

14.2 safe-path.ts — 路径安全

const ROOT_DIR = path.resolve(process.env.OPENAGENT_WORK_DIR || process.cwd());

// 写入路径解析：阻止目录穿越和符号链接逃逸
resolveSafePath(relPath: string): string

// 读取路径解析：不做工作目录限制，相对路径基于 ROOT_DIR 解析
resolveReadPath(filePath: string): string

resolveSafePath：检查路径是否在 ROOT_DIR 内，使用 fs.realpathSync 检测符号链接逃逸，拒绝 .. 路径穿越（用于写入操作）
resolveReadPath：不做工作目录限制，允许读取任意路径（用于只读操作）
ROOT_DIR 支持通过 OPENAGENT_WORK_DIR 环境变量覆盖（用于微信机器人等子进程场景）

14.3 sessions.ts — 会话持久化

interface SavedSession {
    version: number; // 版本号（当前 1）
    sessionId: string; // 会话 ID
    savedAt: string; // ISO 时间戳
    cwd: string; // 绝对路径
    branch: string; // Git 分支或 'default'
    displayMessages: UIMessage[];
}

存储路径：~/.openagent/sessions/<sessionId>.json

每个会话一个 JSON 文件，以 sessionId 命名
历史记录追加到 ~/.openagent/history.jsonl（JSONL 格式，每行一条记录）
listSessions() 读取 history.jsonl，按 sessionId 分组，过滤掉仅含命令的空会话

14.4 highlight.ts — 语法高亮

基于单一正则表达式的语法高亮器，支持：

注释：JS //、Python #、C /* */
字符串：单引号、双引号、反引号
数字
关键字：JS + Python
类型名：PascalCase
函数名：后跟 ( 的标识符
标点和运算符

14.5 markdown.ts — Markdown 处理

// 快速检测是否包含 Markdown 语法（检查前 500 字符）
hasMarkdownSyntax(text: string): boolean

// 使用 marked 词法分析器解析 Markdown
lexMarkdown(text: string): Token[]

14.6 summarize-args.ts — 参数摘要

将工具参数对象转换为 key=value 格式的摘要字符串，值超过 40 字符时截断。用于 UI 中工具调用的简洁展示。

14.7 uid.ts — 唯一 ID

import { randomUUID } from 'node:crypto';
export const uid = randomUUID;

14.8 errors.ts — 错误信息提取

// 从 unknown 错误中提取可读的错误信息
getErrorMessage(error: unknown): string

统一处理 catch (error) 中 error 类型不确定的场景，替代重复的 error instanceof Error ? error.message : String(error)。

14.9 exec.ts — 共享命令执行

import { execFile } from 'node:child_process';
import { promisify } from 'node:util';
export const execFileAsync = promisify(execFile);

files.ts 和 sessions.ts 共用的 execFile promisify 封装。

14.10 fs.ts — 文件系统工具

// 确保目录存在（同步/异步）
ensureDirSync(dir: string): void
ensureDir(dir: string): Promise<void>

// 读取 JSON 文件，不存在或解析失败时返回 null
readJsonFile<T>(filePath: string): T | null

// 写入 JSON 文件，自动创建父目录
writeJsonFile(filePath: string, data: unknown, indent?: number): void

config/index.ts 和 approval-store.ts 的文件读写统一使用这些函数。

14.11 walk.ts — 目录遍历

interface WalkEntry {
    relativePath: string;  // 相对于基准目录的路径
    fullPath: string;      // 绝对路径
    entry: Dirent;         // fs.Dirent 对象
}

// 异步目录遍历生成器
walkDirectory(dir, baseDir, options?): AsyncGenerator<WalkEntry>

统一 grep、glob、files.ts 的目录遍历逻辑：

自动过滤 SKIP_DIRS 和隐藏文件（filterHidden 可配置）
通过 shouldRecurse 控制是否递归子目录
yield 所有条目（文件和目录），调用方按需过滤

15. 数据流详解

15.1 用户输入 → AI 响应

flowchart TD
    A["用户输入"] --> B{"以 '/' 开头?"}
    B -->|是| CMD["parseCommandInput()<br/>findCommand()<br/>cmd.run(ctx)"]
    B -->|否| C{"isConfigReady()?"}
    C -->|否| C1["提示\"配置未完善，请 /config\""]
    C -->|是| D["send(text)"]
    D --> E["expandMentions(text)<br/>@file → &lt;file&gt;content&lt;/file&gt;"]
    E --> F["追加消息到<br/>messages[] (ModelMessage)<br/>displayMessages[] (UIMessage)"]
    F --> G["streamMessages(messages)"]
    G --> H["runAgent(messages)<br/>streamText({ model, tools, stopWhen, abortSignal })"]
    H --> I["遍历 toUIMessageStream() 事件"]
    I --> I1["text-delta → 更新文本"]
    I --> I2["reasoning-delta → 更新推理"]
    I --> I3["tool-* → 更新工具调用状态"]
    I --> I4["tool-approval → awaiting_approval"]
    I --> I5["error → 显示错误"]
    I1 & I2 & I3 & I4 & I5 --> J["响应完成<br/>合并到 messages[]<br/>更新 usage 统计<br/>status → idle"]

15.2 工具审批流程

flowchart TD
    A["AI 调用需要审批的工具"] --> B["streamText 发出 tool-approval-request 事件"]
    B --> C["useChatStream<br/>status = awaiting_approval<br/>pendingApproval = { toolCallId, toolName, input }"]
    C --> D["Input.tsx 渲染 ApprovalDialog"]

    D --> E{"工具类型"}
    E -->|ask_user_question| F["显示问题 + 选项"]
    E -->|其他工具| G["显示 批准 / 始终批准 / 拒绝"]

    F -->|选择选项| H["selectQuestionOption()"]
    F -->|Esc| I["denyPendingTool()"]

    G -->|批准| J["approvePendingTool()"]
    G -->|始终批准| K["alwaysApprovePendingTool()<br/>写入偏好到 approvals/global.json"]
    G -->|拒绝| L["denyPendingTool()"]

    H & I & J & K & L --> M["发送 tool-result 或 tool-approval-response"]
    M --> N["继续 streamMessages()"]

15.3 会话持久化流程

flowchart LR
    subgraph clear["/clear"]
        C1[saveCurrentSession] --> C2[saveSession] --> C3[写入 JSON 文件] --> C4[resetSession]
    end
    subgraph exit["/exit"]
        E1[saveCurrentSession] --> E2[saveSession] --> E3[写入 JSON 文件] --> E4[exit]
    end
    subgraph sessions["/sessions"]
        S1[listSessions] --> S2[showSessionPicker] --> S3[用户选择会话] --> S4[saveCurrentSession] --> S5[loadSession] --> S6[setSession]
    end

15.4 @ 文件引用流程

flowchart TD
    A["用户输入 请查看 @src/App"] --> B["Input.tsx 检测到 @mention<br/>getActiveMention → start=4, query=src/App"]
    B --> C["filterFiles(fileIndex, src/App)<br/>→ 匹配文件列表（按评分排序）"]
    C --> D["FilePicker 显示匹配列表"]
    D -->|Tab / Enter| E["选择文件，替换为路径"]
    D -->|继续输入| F["更新匹配列表"]
    E --> G["用户提交 请查看 @src/App.tsx"]
    G --> H["expandMentions<br/>→ 请查看 file path=... 文件内容"]
    H --> I["发送给 AI 模型"]

15.5 双消息状态

系统维护两个并行的消息数组：

block-beta
    columns 2
    block:msgs["messages: ModelMessage[] (AI SDK 对话历史)"]
        columns 1
        M0["system messages"]
        M1["user message 1"]
        M2["assistant resp 1 (含工具调用)"]
        M3["tool result"]
        M4["assistant resp 2"]
    end
    block:disp["displayMessages: UIMessage[] (UI 展示)"]
        columns 1
        D0[" "]
        D1["user message 1"]
        D2["assistant resp 1<br/>parts: text / tool-call / tool-result"]
        D3[" "]
        D4["user message 2"]
    end

    M1 <-->|同步| D1
    M4 <-->|同步| D4

    style D0 fill:none,stroke:none
    style D3 fill:none,stroke:none

messages 来源：AI 模型，用途：发送给模型
displayMessages 来源：UI 实时更新，用途：渲染给用户
用户输入同时写入两者，AI 响应完成后合并到 messages，流式更新 displayMessages
messages 是 AI 的对话真相，发送给模型
displayMessages 是 UI 的展示真相，实时渲染
用户输入同时写入两者
AI 响应完成后合并到 messages，流式更新 displayMessages

16. 安全机制

16.1 路径安全

目录穿越防护：resolveSafePath() 阻止 .. 路径穿越
符号链接防护：检查 realpath 是否仍在工作目录内
工作目录沙箱：所有文件操作限制在 process.cwd() 内

16.2 命令执行安全

只读/写入分离：READONLY_COMMANDS 集合区分安全命令
危险模式检测：DANGEROUS_PATTERNS 阻止破坏性命令
动态审批：写入类命令需要用户确认
超时限制：默认 30 秒超时
输出限制：最大 1MB 输出

16.3 网络安全

SSRF 防护：fetch 工具阻止 localhost 和内网地址
- 阻止 127.0.0.0/8、10.0.0.0/8、172.16.0.0/12、192.168.0.0/16
- 阻止 169.254.0.0/16（链路本地）
- 阻止 IPv6 私有地址
- DNS 解析检查
响应大小限制：最大 50KB

16.4 文件大小限制

读取文件：最大 1MB
grep 匹配：最大 200 条，单文件最大 1MB
glob 匹配：最大 200 条
文件索引：最大 5000 条目

16.5 配置安全

API Key 在 /config 输出中脱敏显示（前 4 位 + ... + 后 4 位）
配置文件存储在用户主目录 ~/.openagent/，不提交到项目仓库

17. 构建与开发

17.1 开发命令

pnpm install          # 安装依赖
pnpm start            # 运行（tsx packages/core/src/index.tsx）
pnpm build            # 递归编译所有子包
pnpm lint             # ESLint 检查
pnpm lint:fix         # ESLint 自动修复
pnpm typecheck        # TypeScript 类型检查（递归所有子包）
pnpm test             # 运行测试
pnpm format           # Prettier 格式化
pnpm pack:dry         # 本地打包预检
pnpm version:all patch # 统一升级版本号（patch/minor/major）
pnpm publish:all       # 发布所有包（自动检查版本一致性）

17.2 构建配置

各子包使用独立的 tsup.config.ts，统一构建参数：

参数	值	说明
格式	ESM	ES Module 输出
平台	Node	Node.js 运行时
目标	Node 22	最低支持版本
代码拆分	关闭	单文件输出
输出目录	dist/	各子包独立 dist

pnpm build 按依赖顺序递归构建：@oagent/channels → @oagent/i18n → @oagent/core → @oagent/weixin → @oagent/telegram。

17.3 开发工具链

flowchart TD
    A["Git Commit"] --> B["Husky Hooks"]
    B --> C["pre-commit → lint-staged"]
    C --> C1["ESLint --fix"]
    C --> C2["Prettier --write"]
    B --> D["commit-msg → commitlint"]
    D --> D1["检查 conventional commit"]

17.4 TypeScript 配置

Target: ES2022
Module: ESNext
Module Resolution: bundler
JSX: react-jsx
路径别名: @/* → ./packages/core/src/*
各子包有独立 tsconfig.json，通过 references 关联

18. 扩展指南

18.1 添加新命令

在 packages/core/src/commands/ 下创建新文件
实现 SlashCommand 接口：

import { SlashCommand } from './registry';

const myCommand: SlashCommand = {
    name: '/mycommand',
    description: '命令描述',
    run: (ctx) => {
        // ctx 包含应用状态和回调
        ctx.appendMessages([
            {
                id: uid(),
                role: 'assistant',
                parts: [{ type: 'text', text: '命令执行结果' }]
            }
        ]);
    }
};

export default myCommand;

在 packages/core/src/commands/index.ts 的 COMMANDS 数组中注册

18.2 添加新工具

在 packages/core/src/engine/tools/ 下创建新文件
使用 AI SDK 的 tool({...}) 定义：

import { tool } from 'ai';
import { z } from 'zod';

export const myTool = tool({
    description: '工具描述',
    parameters: z.object({
        param1: z.string().describe('参数描述'),
        param2: z.number().optional()
    }),
    execute: async ({ param1, param2 }) => {
        // 工具逻辑
        return { result: 'success' };
    }
});

在 packages/core/src/engine/tools/index.ts 的 tools 对象中注册

注意：审批逻辑由 AI SDK 内置机制处理，不需要在工具定义中设置 needsApproval。需要审批的工具在 useChatStream 中通过 tool-approval-request 事件触发。审批偏好持久化在 approval-store.ts 中管理，支持 execute_bash、write_file、edit_file 三个工具的偏好设置。审批文件存储在 ~/.openagent/approvals/ 目录下：TUI 全局使用 global.json，每个 Channel 使用独立的 {channelId}.json（如 weixin.json），通过 AsyncLocalStorage 上下文隔离实现互不干扰。

18.3 添加新主题

在 packages/core/src/ui/text/theme.tsx 的 themes 对象中添加新主题定义：

export const themes: Record<ThemeName, Theme> = {
    // ... 现有主题
    mytheme: {
        accent: '#ff6600',
        accentDim: '#cc5200',
        // ... 其他颜色
        syntax: {
            /* ... */
        }
    }
};

然后更新 ThemeName 类型：

export type ThemeName = 'dark' | 'light' | 'mayday' | 'mytheme';

18.4 开发 Channel 插件

Channel 插件用于接入消息平台（微信、Telegram 等），实现远程与 AI 对话。

架构

graph LR
    subgraph SDK["@oagent/channels SDK"]
        S1[Channel 接口]
        S2[ChannelManager]
        S3[SessionManager]
    end
    subgraph Plugins["Channel 插件"]
        P1["@oagent/weixin"]
        P2["@oagent/telegram"]
    end
    subgraph Host["主应用"]
        H1["config.json channels 字段"]
        H2["/channel 命令 动态加载插件"]
        H3["依赖注入 runAgent"]
    end

    Host -->|动态导入 + register| Plugins
    Plugins -->|实现| SDK

创建插件包

创建 npm 包，依赖 @oagent/channels
导出 register 函数：

// packages/my-channel/src/index.ts
import type { ChannelManager } from '@oagent/channels';
import type { RunAgentFn } from './types.js';

export function register(manager: ChannelManager, opts: { runAgent: RunAgentFn }): void {
    manager.register(new MyChannel(opts));
}

实现 Channel 接口：

import type { Channel, ChannelStartOpts, ChannelStatus } from '@oagent/channels';

export class MyChannel implements Channel {
    readonly id = 'my-channel';
    readonly name = 'My Channel';
    status: ChannelStatus = 'idle';

    isConfigured(): boolean {
        // 检查是否已配置（如 token 是否存在）
        return true;
    }

    getStatusInfo(): string[] {
        return ['状态信息'];
    }

    async start(opts: ChannelStartOpts): Promise<void> {
        this.status = 'running';
        try {
            // 启动消息监控
            // 收到消息时调用 opts.onMessage({ type, channelId, userId, text })
            // 使用 opts.runAgent 调用 AI
        } finally {
            this.status = 'idle';
        }
    }

    async stop(): Promise<void> {
        this.status = 'idle';
    }
}

依赖注入

插件通过 register 函数的 opts 参数接收宿主应用的能力：

参数	类型	说明
`runAgent`	`(messages, signal) => ...`	调用 AI Agent
`enableAutoApprove`	`() => Promise<void>`	启用工具自动审批

使用插件

安装插件：pnpm add @oagent/my-channel
配置 ~/.openagent/config.json：

{
    "channels": ["@oagent/my-channel"]
}

TUI 中使用：/channel start my-channel

FilesExpand file tree

technical.md

Latest commit

History