VoicePilotCore 是一个智能语音控制电脑助手,包含三个主要部分:
- 后端服务 (Go + Gin)
- 桌面端应用 (Tauri + React)
- 终端应用 (Wails + Vue)
graph TB
subgraph "客户端层"
D[Tauri 桌面应用]
T[Wails 终端应用]
end
subgraph "后端服务"
S[Go 后端服务]
end
subgraph "核心引擎"
LLM[LLM 引擎]
V[语音引擎]
E[执行引擎]
end
D --> S
T --> S
S --> LLM
S --> V
S --> E
graph LR
H[Handler] --> S[Service]
S --> LLM[LLM]
S --> T[Tools]
LLM --> E[Executor]
E --> TG[Task Manager]
- Handler: API 请求处理
- Service: 业务逻辑
- LLM: 大模型集成 (DeepSeek)
- Tools: Function Tools (系统控制/文件操作)
- Executor: 智能执行器
- Task Manager: 任务编排
graph TB
UI[React UI] --> API[Tauri API]
API --> BACKEND[后端服务]
- React 18 + TypeScript
- Tauri 2.0
- Zustand 状态管理
- Tailwind CSS
graph TB
V[Vue UI] --> W[Wails API]
W --> G[Go Core]
- Vue 3 + TypeScript
- Wails
- Pinia 状态管理
sequenceDiagram
U->>C: 语音输入
C->>S: 发送请求
S->>LLM: 分析意图
LLM->>S: 返回结果
S->>T: 执行操作
T->>S: 返回结果
S->>C: 返回响应
C->>U: 语音输出
- 陈挺 - 整体架构设计与核心前后端开发
- 王悦然 - 后端模块与 Function Tools 开发
- 赵双 - Office 三件套 LLM 操作工具与后端基础模块
负责模块:
- 整体架构设计与技术选型
- 前后端联调与集成
- AI 通话功能实现
- Function Tools 核心框架设计
- WebRTC 实时语音通信
- 桌面端应用开发
主要贡献:
- 项目整体架构设计
- 前后端通信协议设计和多种AI语音通话方式的实现
- LLM 集成与调用逻辑
- 语音识别与合成集成
- 桌面宠物功能开发
负责模块:
- Go 后端核心模块开发
- Function Tools 具体实现
- 系统控制相关工具
- 多媒体控制功能
- 文件操作工具
- 终端应用开发
主要贡献:
- 后端服务架构实现
- Function Tools 体系设计
- 系统 API 集成与封装
- 终端应用功能开发
- 任务调度与编排
负责模块:
- Office 三件套(Word/Excel/PowerPoint)LLM 操作工具
- 后端基础模块开发
- 文档处理与格式化
- 模板管理功能
- 文件 I/O 操作
主要贡献:
- Office 文档处理工具开发
- Word/Excel/PPT 的操作封装
- AI 辅助文档生成功能
- 模板系统设计与实现
- 文件存储与管理
graph LR
CT[陈挺<br/>架构/前端/AI通话] --> JS[赵双<br/>Office工具/基础模块]
CT --> WYR[王悦然<br/>Function Tools/后端模块]
WYR --> JS
style CT fill:#4CAF50
style WYR fill:#2196F3
style JS fill:#FF9800



