feat: 开发对话功能

This commit is contained in:
2026-04-11 16:54:09 +08:00
parent 5151379726
commit 8c2ea4488b
8 changed files with 466 additions and 167 deletions

View File

@@ -0,0 +1,149 @@
# OpenCode 对话功能实现路径
本文档旨在提供一个在 OpenCode 平台中实现对话功能的完整技术路径涵盖会话管理、消息发送以及利用事件流SSE进行流式渲染的详细步骤和建议。
## 1. 核心概念回顾
在 OpenCode 中实现对话功能,主要依赖以下几个核心接口:
* **`POST /session`**: 用于创建新的对话会话,获取 `sessionID`
* **`POST /session/:id/prompt_async`**: 用于异步发送用户消息到指定会话,服务器会立即返回,不等待 AI 响应完成。
* **`GET /event`**: 作为 SSEServer-Sent Events接口用于实时接收服务器产生的各类事件包括 AI 消息的生成和更新。
* **`GET /session/:id/message`**: 用于获取指定会话的历史消息记录。
## 2. 对话生命周期与接口调用顺序
以下是实现一个完整的流式对话功能的推荐流程:
### 步骤 1: 初始化 - 创建会话
在用户开始对话之前,需要为其创建一个新的会话。每个会话都有一个唯一的 `sessionID`,用于标识和管理该对话的上下文。
* **接口**: `POST /session`
* **用途**: 启动一个新的对话。
* **请求体示例**: `{
"title": "我的新对话"
}` (标题可选)
* **响应**: 返回一个 `Session` 对象,其中包含 `id` 字段,即 `sessionID`。
```json
{
"id": "some-session-id",
"title": "我的新对话",
"createdAt": "2023-01-01T12:00:00Z",
"updatedAt": "2023-01-01T12:00:00Z"
}
```
### 步骤 2: 建立事件监听
为了实现 AI 响应的流式渲染,客户端需要连接到 `/event` 接口,持续监听服务器发出的事件。这将允许您实时接收 AI 生成的文本片段。
* **接口**: `GET /event`
* **用途**: 接收服务器发送的实时事件流SSE
* **机制**: 客户端建立一个持久的 HTTP 连接,服务器通过此连接推送事件。您需要一个支持 SSE 的客户端库来处理这个连接。
* **过滤**: 客户端需要根据 `sessionID` 和 `messageID`(稍后从 `prompt_async` 的响应中获取或从事件流中识别)来过滤和处理相关事件。
**伪代码示例 (JavaScript)**:
```javascript
const eventSource = new EventSource('/event');
eventSource.onmessage = (event) => {
const data = JSON.parse(event.data);
// 根据事件类型和 sessionID 过滤事件
if (data.type === 'message.updated' && data.sessionID === currentSessionId) {
// 处理消息更新事件,例如追加 AI 生成的文本片段到 UI
console.log('Received message update:', data.message.parts);
// 假设 data.message.parts[0].text 包含最新文本
// updateUIWithStreamingText(data.message.parts[0].text);
}
// 其他事件处理,例如 message.created, session.updated 等
};
eventSource.onerror = (error) => {
console.error('EventSource failed:', error);
eventSource.close();
};
```
### 步骤 3: 发送用户消息
当用户输入消息后,通过 `prompt_async` 接口将其发送到服务器。这个接口会立即返回,不会阻塞客户端,让流式渲染可以同时进行。
* **接口**: `POST /session/:id/prompt_async`
* **用途**: 异步发送用户消息,触发 AI 响应生成。
* **路径参数**: `:id` 为当前会话的 `sessionID`。
* **请求体示例**: `{
"parts": [
{ "text": "你好OpenCode" }
],
"model": "your-model-id", // 可选,指定使用的模型
"agent": "your-agent-id" // 可选,指定使用的代理
}`
* **响应**: `204 No Content`。这意味着服务器已接收请求并开始处理,但不会立即返回 AI 的完整响应。
**伪代码示例 (JavaScript)**:
```javascript
async function sendUserMessage(sessionId, messageText) {
const response = await fetch(`/session/${sessionId}/prompt_async`, {
method: 'POST',
headers: { 'Content-Type': 'application/json' },
body: JSON.stringify({
parts: [{ text: messageText }]
})
});
if (response.status === 204) {
console.log('User message sent successfully, awaiting streaming response via /event.');
// 此时前端可以显示用户消息,并准备接收 AI 的流式响应
} else {
console.error('Failed to send user message:', response.statusText);
}
}
```
### 步骤 4: 处理流式响应与渲染
在步骤 2 中建立的 `/event` 监听器会接收到 AI 生成消息的实时更新。您需要解析这些事件,并将 AI 生成的文本片段逐步显示在用户界面上。
* **事件类型**: 主要关注 `message.updated` 事件,其 `message` 字段会包含 `parts` 数组,其中包含 AI 正在生成的文本。
* **渲染逻辑**: 每次收到新的文本片段时,将其追加到 AI 消息的显示区域,而不是替换。
* **完成标志**: 当 AI 消息生成完成时,通常会有一个特定的事件或 `message.updated` 事件中的状态标志来指示。例如,当 `message.updated` 事件中的 `message.status` 变为 `completed` 或 `final` 时,表示流式输出结束。
### 步骤 5: 获取历史消息 (可选)
如果用户重新加载页面或需要查看之前的对话记录,可以使用此接口获取会话的所有历史消息。
* **接口**: `GET /session/:id/message`
* **用途**: 获取指定会话的所有消息。
* **路径参数**: `:id` 为当前会话的 `sessionID`。
* **查询参数**: `limit?` (可选) 用于限制返回的消息数量。
* **响应**: 返回一个消息数组,每个元素包含 `info: Message` 和 `parts: Part[]`。
## 3. 完整流程图
```mermaid
graph TD
A[用户打开应用] --> B{是否已有会话?}
B -- 否 --> C[调用 POST /session]
C --> D[获取 sessionID]
B -- 是 --> D[使用现有 sessionID]
D --> E[建立 GET /event SSE 连接]
E --> F[用户输入消息]
F --> G[调用 POST /session/:id/prompt_async]
G --> H[前端显示用户消息]
H --> I[通过 SSE 接收 message.updated 事件]
I -- 文本片段 --> J[实时渲染 AI 响应]
I -- 消息完成 --> K[AI 响应渲染完成]
K --> F
subgraph 历史消息
L[用户请求历史消息] --> M[调用 GET /session/:id/message]
M --> N[显示历史消息]
end
```
## 4. 总结
在 OpenCode 中实现流式对话功能,关键在于**分离消息发送和消息接收**。通过 `POST /session/:id/prompt_async` 异步发送消息,并通过 `GET /event` 实时监听服务器的总线事件来获取 AI 生成的文本片段,从而实现流畅的流式问答体验。`GET /event` 接口是您实现流式渲染的正确选择,因为它提供了所有会话相关的实时更新,包括 AI 消息的逐字生成过程。