01
产品认知深度
面试权重最高 · CodeBuddy与WorkBuddy全维度解析
一、产品定位全景:CodeBuddy vs WorkBuddy
1.1 一句话定位
CodeBuddy 是腾讯云推出的 AI 代码编辑器,面向开发者,核心场景是代码编写、调试、重构、工程管理。它的本质是一个「写代码的AI同事」。
WorkBuddy 是腾讯推出的 全场景职场AI智能体桌面工作台,面向各类职能角色(不限于开发者),核心场景是文档处理、数据分析、报告生成、自动化办公。它的本质是一个「全能型职场AI助手」。
面试关键点:两者不是竞争关系,而是互补关系。CodeBuddy聚焦「代码领域」,WorkBuddy聚焦「通用职场」。一个是开发者的编程伙伴,一个是所有职场人的工作助理。
1.2 核心差异对比表
| 维度 |
CodeBuddy |
WorkBuddy |
| 目标用户 |
开发者、程序员、工程师 |
所有职场人(产品、运营、市场、管理等) |
| 使用形态 |
IDE/编辑器(独立桌面应用) |
桌面工作台 + 小程序入口 |
| 核心能力 |
代码补全、智能重构、Bug修复、工程分析 |
任务执行、文档生成、数据分析、多模态生成 |
| 操作对象 |
代码文件、项目工程、Git仓库 |
本地文件、网络资源、第三方服务 |
| 技术栈要求 |
需要编程基础 |
零技术门槛,自然语言交互 |
| 扩展方式 |
插件体系 |
Skill + MCP + 连接器 + 自动化 |
| 交付物 |
代码、项目、功能模块 |
文档、报告、PPT、数据可视化、网站 |
| 上下文 |
项目代码库上下文 |
用户文件 + 网络 + 记忆系统 + 连接器数据 |
1.3 产品形态深度理解
CodeBuddy 的产品形态
CodeBuddy 是一个完整的代码编辑器(AI Code Editor),而不仅仅是一个插件。它具备:
- 代码智能补全:基于上下文的实时代码建议
- 内联编辑:在代码中直接进行AI辅助修改
- 对话式编程:通过对话描述需求,AI生成代码
- 项目理解:分析整个代码库结构,提供架构级建议
- 终端集成:可以执行命令、运行测试、管理依赖
- Git集成:代码版本管理、提交、分支操作
WorkBuddy 的产品形态
WorkBuddy 是一个桌面工作台(Desktop Workstation),核心理念是「用一句话完成工作」:
- 任务驱动:用户描述需求,AI自主规划和执行
- 本地文件访问:授权读写本地文件,支持批量处理
- 多模态交互:支持文本、图片、文件等多种输入
- 工具调用:通过工具链完成复杂操作
- 连接器生态:对接腾讯文档、腾讯会议、GitHub等第三方服务
- 自动化编排:支持定时任务和重复性工作自动化
1.4 用户画像与使用场景对照
CodeBuddy 典型场景
- 开发者需要快速写一个REST API → CodeBuddy内通过对话描述需求,直接生成代码
- 重构一个老旧模块 → AI理解整个项目后提供重构建议并执行
- 修复测试用例失败 → AI分析报错,定位问题,生成修复方案
- 学习新框架 → 通过对话方式边学边写,AI即时解答
WorkBuddy 典型场景
- 产品经理写周报 → 一句话描述本周工作,自动生成格式化周报
- 运营分析数据 → 上传Excel,自动分析趋势并生成可视化图表
- 制作汇报PPT → 描述主题和要点,自动生成完整演示文稿
- 批量处理文件 → 自动重命名、格式转换、整理归档
- 深度调研 → 对某个话题进行多维度深度研究并输出报告
1.5 两者的协同关系
在实际工作流中,CodeBuddy和WorkBuddy可以形成互补:
- 开发者视角:用CodeBuddy写代码,用WorkBuddy写文档、分析需求、做调研
- 全栈视角:CodeBuddy负责代码实现,WorkBuddy负责项目管理和沟通协作
- 团队视角:技术同学用CodeBuddy,非技术同学用WorkBuddy,各取所需
面试易错点:不要说"WorkBuddy是CodeBuddy的非技术版本"。它们的定位、架构和能力模型完全不同。WorkBuddy有自己独立的Skill体系、记忆系统、连接器生态,不是简单的"阉割版"。
二、WorkBuddy 核心架构深度解析
2.1 整体架构层次
WorkBuddy 的系统架构可以分为以下几个核心层次:
┌─────────────────────────────────────────────────────┐
│ 用户交互层 │
│ (桌面客户端 / 微信小程序 / Web界面) │
├─────────────────────────────────────────────────────┤
│ 智能体引擎层 │
│ (大模型推理 / 任务规划 / 工具选择 / 上下文管理) │
├─────────────────────────────────────────────────────┤
│ 能力扩展层 │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ Skill │ │ MCP │ │ 连接器 │ │ 自动化 │ │
│ │ 技能系统 │ │ 协议层 │ │ 系统 │ │ 系统 │ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
├─────────────────────────────────────────────────────┤
│ 基础能力层 │
│ (文件系统 / 命令执行 / 网络访问 / 多模态处理) │
├─────────────────────────────────────────────────────┤
│ 数据持久层 │
│ (记忆系统 / 会话管理 / 配置存储 / 任务历史) │
└─────────────────────────────────────────────────────┘
2.2 智能体引擎核心机制
WorkBuddy的核心是一个Agent Loop(智能体循环),这是区别于传统对话AI的关键特征:
- 分析上下文:理解用户意图和当前状态
- 思考规划:推理是否需要更新计划、推进阶段或执行动作
- 选择工具:根据计划选择下一个要调用的工具
- 执行动作:在沙箱环境中执行操作
- 接收观察:获取执行结果作为新的观察
- 迭代循环:重复以上步骤直到任务完成
- 呈现结果:将最终交付物展示给用户
核心理解:WorkBuddy不是"一问一答"的对话机器人,而是"接受任务→自主执行→交付结果"的智能体。它会自己拆解任务、选择工具、处理异常、迭代优化,直到产出用户满意的交付物。
2.3 三种工作模式
WorkBuddy提供三种工作模式,适配不同场景需求:
| 模式 |
名称 |
行为 |
适用场景 |
| Craft |
你说我做 |
直接执行任务,读写文件、运行命令、生成内容 |
目标明确的执行类任务 |
| Plan |
先想后做 |
先分析设计方案,用户确认后再执行 |
复杂任务需要确认方向 |
| Ask |
只聊不动 |
只回答问题、读取信息,不修改任何文件 |
咨询、分析、讨论 |
2.4 工具调用体系
WorkBuddy拥有丰富的内置工具:
- 文件操作:Read(读取文件)、Write(写入文件)、Edit(编辑文件)
- 搜索工具:Glob(文件模式匹配)、Grep(内容搜索)
- 命令执行:Bash/PowerShell(系统命令)
- 网络工具:WebFetch(获取网页)、WebSearch(搜索引擎)
- 任务管理:TaskCreate/TaskUpdate/TaskList
- 多智能体:Agent(启动子智能体)、SendMessage(消息通信)
- 可视化:show_widget(内联SVG/HTML渲染)
- 媒体生成:ImageGen(文生图)、ImageEdit(图片编辑)
- 自动化:automation_update(定时任务管理)
三、Skill 技能机制全解
3.1 什么是 Skill
Skill(技能)是WorkBuddy的扩展能力单元,本质上是一个结构化的Markdown指令文件(SKILL.md),它告诉AI在特定场景下应该如何行动。
可以把Skill理解为:给AI一份「岗位手册」,让它在遇到特定类型的任务时,按照手册中的流程和规范来执行,而不是凭通用知识随意发挥。
3.2 Skill 的存储层级
| 层级 |
存储路径 |
作用域 |
说明 |
| 用户级 |
~/.workbuddy/skills/ |
当前用户所有项目 |
个人通用技能,跨项目复用 |
| 项目级 |
{workspace}/.workbuddy/skills/ |
当前项目 |
项目专用技能,团队成员共享 |
| 内置级 |
系统内置 |
全局 |
产品出厂自带的基础技能 |
| 插件级 |
插件系统 |
已安装插件 |
通过插件市场安装的技能 |
3.3 SKILL.md 文件结构
一个标准的SKILL.md文件由 frontmatter(元数据)和 body(指令内容)组成:
---
title: "技能名称"
description: "技能描述,决定何时触发"
agent_created: true # 是否由AI创建(可修改/删除的标志)
allowed-tools: # 可选:限制该skill可使用的工具
- Read
- Write
- Bash
---
# 技能指令正文
## 触发条件
描述何时应该使用这个技能...
## 执行流程
1. 第一步做什么
2. 第二步做什么
...
## 注意事项
- 避免xxx
- 优先xxx
3.4 Skill 触发机制
Skill的触发有多种方式:
- 自动触发:AI根据用户请求的语义,匹配到合适的skill的description,自动加载执行
- 斜杠命令触发:用户输入
/skill-name 直接调用
- 前置/后置hook:某些skill在特定操作前后自动触发
触发匹配逻辑:AI会将用户请求的意图与所有可用skill的description字段进行语义匹配。description写得越精准、触发词越明确,匹配就越准确。这就是为什么好的skill必须有清晰的description。
3.5 Skill 的能力边界控制
通过 allowed-tools 字段可以限制skill能使用的工具范围:
- 如果不声明,skill可以使用所有可用工具
- 声明后,skill只能使用列表中的工具
- 这是安全机制的一部分,防止skill进行越权操作
3.6 Skill 的生命周期管理
- 创建:通过SkillManage工具创建,或手动在skills目录下添加SKILL.md
- 修改:只有
agent_created: true 的skill可以被AI修改
- 删除:同上限制,且需要用户确认
- 自动维护:AI在使用skill时会自动检查并修复问题(拼写错误、过时信息等)
3.7 Skill 生态与分类
当前WorkBuddy的skill生态涵盖多个领域:
| 分类 |
代表Skill |
能力说明 |
| 办公文档 |
pptx, docx, xlsx, pdf |
生成/编辑Office文档和PDF |
| 开发工具 |
github, cloudbase, web-development |
代码托管、云开发、前端开发 |
| 内容生产 |
content-factory, novel-writer, humanizer |
多格式内容批量生产 |
| 信息获取 |
deep-research, tavily, news-summary |
深度调研、搜索、新闻聚合 |
| 金融数据 |
stock-analyzer, westockdata, neodata |
股票分析、金融数据查询 |
| 平台集成 |
tencent-docs, tencent-meeting, ima-skills |
对接腾讯生态服务 |
| 浏览器 |
playwright-browser-automation, web-access |
网页自动化操作 |
3.8 面试必知:Skill相关高频问题
Q:Skill和MCP有什么区别?
A:Skill是「行为指令」——告诉AI在特定场景下怎么做事。MCP是「能力通道」——让AI能调用外部工具/服务。一个是"做事的方法论",一个是"做事的工具通道"。它们经常配合使用:一个Skill可能指导AI通过MCP调用某个外部API。
四、MCP 协议与连接器体系
4.1 什么是 MCP
MCP(Model Context Protocol,模型上下文协议)是一种标准化协议,用于让AI模型与外部工具和服务进行通信。它定义了AI如何发现、调用和接收外部工具的结果。
简单理解:MCP就像USB接口标准,有了它,任何工具/服务只要实现MCP协议,就能被AI调用,无需为每个工具单独写集成代码。
4.2 MCP 配置方式
WorkBuddy的MCP配置文件位于:~/.workbuddy/mcp.json
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"],
"env": {}
},
"custom-server": {
"url": "http://localhost:3000/mcp",
"headers": {
"Authorization": "Bearer xxx"
}
}
}
}
4.3 MCP 服务器类型
| 类型 |
通信方式 |
配置字段 |
适用场景 |
| stdio |
标准输入/输出 |
command + args |
本地CLI工具(如playwright, sqlite) |
| HTTP/SSE |
HTTP请求 + 服务端事件 |
url + headers |
远程服务API |
4.4 连接器(Connector)体系
连接器是WorkBuddy内置的第三方服务集成模块,与MCP的区别在于:
- 连接器:官方预制的、开箱即用的集成(如腾讯文档、腾讯会议、GitHub等),用户只需OAuth授权即可使用
- MCP:开放协议,用户可以自行配置任何实现了MCP协议的服务
当前WorkBuddy支持的连接器包括:
- EdgeOne Pages:静态网站部署
- GitHub:代码仓库管理
- 腾讯文档:在线文档协作
- 腾讯会议:会议管理
- 腾讯问卷:问卷调查
- 金山文档:文档处理
- Notion:知识管理
- TAPD:项目管理
- QQ邮箱:邮件管理
- 微云:云存储
- 腾讯乐享:企业知识库
- 企查查:企业信息查询
4.5 MCP与连接器的协同
理解要点:连接器是"官方精装"——产品团队预先实现好的集成,用户零配置。MCP是"毛坯自装"——开放协议,用户自己配置外部服务。两者都让AI获得了调用外部服务的能力,只是接入方式和维护责任不同。
五、自动化(Automation)系统
5.1 自动化是什么
WorkBuddy的自动化系统允许用户创建定时执行的任务——让AI按照设定的时间表自动完成重复性工作,无需人工每次触发。
5.2 自动化类型
| 类型 |
配置方式 |
说明 |
| 定时循环(Recurring) |
rrule(RFC 5545标准) |
按cron规则重复执行,如每天、每周 |
| 单次定时(Once) |
scheduledAt(ISO 8601时间) |
在指定时间执行一次 |
5.3 自动化配置要素
- name:自动化名称
- prompt:要执行的指令内容
- scheduleType:once 或 recurring
- rrule:循环规则(DAILY/HOURLY/WEEKLY/MONTHLY/YEARLY)
- scheduledAt:单次执行时间
- cwds:工作目录
- validFrom / validUntil:有效期范围
- status:ACTIVE 或 PAUSED
5.4 自动化存储机制
自动化数据存储在SQLite数据库中:~/.workbuddy/workbuddy.db
automations 表:自动化定义
automation_runtime_state 表:运行时状态(上次/下次执行时间)
automation_runs 表:执行历史记录
重要安全规则:删除自动化只能通过automation_update工具进行,绝对不能用rm、sqlite3等命令直接操作数据库文件。这是产品的安全边界。
5.5 典型自动化场景
- 每日新闻推送:每天早上8点自动爬取并总结行业新闻
- 周报自动生成:每周五下午自动汇总本周工作记录生成周报
- 定时数据监控:每小时检查某个数据指标,异常时告警
- 文件定期备份:每天自动整理和备份指定文件夹
- 会议提醒:指定时间提醒用户准备会议材料
六、记忆系统与上下文管理
6.1 为什么需要记忆系统
AI模型本身是无状态的——每次新对话都是"失忆"状态。WorkBuddy的记忆系统解决了这个问题,让AI能够:
- 记住用户的偏好和习惯
- 延续上一次对话的工作进度
- 积累项目相关的知识和决策
- 在不同任务间传递上下文信息
6.2 记忆的层次结构
| 层次 |
位置 |
生命周期 |
内容类型 |
| 会话记忆 |
对话上下文窗口 |
当前会话 |
本次对话的内容 |
| 工作记忆 |
.workbuddy/memory/ |
跨会话持久 |
每日工作日志 + 长期记忆 |
| 身份记忆 |
~/.workbuddy/ |
全局持久 |
SOUL.md / IDENTITY.md / USER.md |
| 事实记忆 |
云端存储 |
永久 |
通过conversation_search检索 |
6.3 工作记忆文件结构
.workbuddy/memory/
├── MEMORY.md # 长期记忆(就地更新)
├── 2026-05-15.md # 今日工作日志(追加写入)
├── 2026-05-14.md # 昨日工作日志
└── ... # 更早的日志(30天后归档到MEMORY.md)
6.4 身份系统三件套
- SOUL.md:AI的"灵魂"——定义性格、价值观、行为准则、沟通风格
- IDENTITY.md:AI的"身份"——名字、形象、签名emoji
- USER.md:用户画像——用户信息、偏好、项目背景
6.5 跨任务记忆同步
WorkBuddy的每个任务都有独立的上下文(任务隔离),这带来了信息孤岛问题。解决方案:
- 工作记忆文件:通过共享的memory目录实现跨任务信息传递
- conversation_search:搜索历史对话中的信息
- 自定义Skill:如cross-task-sync skill,在会话开始时自动拉取、结束时自动写入
面试价值点:如果被问到"WorkBuddy怎么解决多任务信息隔离",能回答出三层方案(工作记忆文件 → conversation_search → 自定义同步Skill)会展示深度理解。
七、工作模式与权限体系
7.1 沙箱安全机制
WorkBuddy的操作都在沙箱环境中执行,具有安全边界:
- 文件权限:只能访问用户授权的工作目录
- 命令限制:高危操作需要用户确认
- 网络隔离:外部请求有限制和审计
- 个人文件保护:对Desktop、Downloads等个人目录有特殊保护规则
7.2 权限层级
| 操作类型 |
权限要求 |
说明 |
| 读取项目文件 |
默认允许 |
工作区内的文件可直接读取 |
| 写入/修改文件 |
默认允许(工作区内) |
在授权的工作目录内操作 |
| 执行命令 |
需要确认(部分) |
高危命令需用户确认 |
| 网络访问 |
默认允许 |
网页抓取、API调用等 |
| 个人文件操作 |
高危-需确认 |
Desktop等目录有严格保护 |
| 外部发送 |
最高-需确认 |
邮件、消息等对外操作必须确认 |
7.3 Plan Mode 的价值
Plan模式(计划模式)是WorkBuddy的安全阀之一:
- 在执行复杂或有风险的任务前,先制定计划给用户审查
- 用户可以审批、拒绝或修改计划
- 在团队协作中,teammember可以被设为需要计划审批模式
- 这确保了人类始终对AI的行为有控制权
八、多模态内容生成能力
8.1 支持的生成类型
| 类型 |
说明 |
触发方式 |
| 文生图 |
根据文字描述生成图片 |
"生成一张..."、"画一个..." |
| 文生视频 |
根据文字描述生成视频 |
"生成一段视频..." |
| 文生3D |
从文字描述生成3D模型 |
"生成一个3D模型..." |
| 图生3D |
从图片生成3D模型 |
上传图片 + "转为3D" |
| 图片编辑 |
对已有图片进行AI编辑 |
上传图片 + 编辑指令 |
| 图片特效 |
对图片/视频施加特效 |
"添加特效..." |
8.2 内联可视化
WorkBuddy还支持在对话中直接渲染SVG图表和HTML交互组件:
- 图表:柱状图、折线图、饼图等数据可视化
- 流程图:架构图、流程图、状态机图
- 交互组件:表单、计算器等HTML Widget
- UI原型:界面设计原型展示
九、产品边界认知:能做什么与不能做什么
9.1 WorkBuddy 能做的
- ✅ 读写本地文件和目录
- ✅ 执行系统命令和脚本
- ✅ 访问互联网、抓取网页、调用API
- ✅ 生成文档(Word/PPT/Excel/PDF)
- ✅ 数据分析和可视化
- ✅ 多模态内容生成(图片/视频/3D)
- ✅ 通过连接器操作第三方服务
- ✅ 定时自动执行任务
- ✅ 代码编写和项目开发(在WorkBuddy内也可以)
- ✅ 多智能体协作(Agent/Team机制)
9.2 WorkBuddy 不能/不应该做的
- ❌ 不能突破沙箱访问未授权的系统资源
- ❌ 不能在用户未确认的情况下执行高危外部操作
- ❌ 不能保证100%准确——AI有幻觉风险
- ❌ 不能替代需要物理操作的任务(如硬件维修)
- ❌ 不能处理涉及政治敏感、色情暴力等违规内容
- ❌ 不能直接操作手机App(需要额外MCP桥接)
- ❌ 不能访问用户未主动提供的私密信息
- ❌ 不能保证实时性——网络信息可能有延迟
9.3 常见误解与正确理解
| 用户误解 |
正确理解 |
| "WorkBuddy就是ChatGPT的桌面版" |
WorkBuddy是智能体,能自主执行任务,不只是对话 |
| "AI能直接帮我操作微信" |
需要通过MCP/连接器桥接,不能直接控制桌面App |
| "每次打开都要重新介绍自己" |
通过记忆系统持久化用户信息,不需要每次重复 |
| "Skill装多了会让AI变笨" |
Skill只在触发时加载,不会占用常驻上下文 |
| "自动化就是crontab" |
自动化的prompt是AI指令,比crontab灵活得多 |
十、面试高频问答精析
Q1:请介绍一下CodeBuddy和WorkBuddy的关系
参考答案:CodeBuddy和WorkBuddy是腾讯Buddy系列的两个产品,定位互补而非竞争。CodeBuddy是AI代码编辑器,面向开发者,解决"写代码"的问题;WorkBuddy是全场景职场AI工作台,面向所有职场人,解决"办公任务"的问题。技术上它们共享底层AI能力,但产品形态、目标用户、核心场景完全不同。一个开发者可能同时使用两者——用CodeBuddy写代码,用WorkBuddy做调研、写文档、管理项目。
Q2:WorkBuddy的Skill机制是怎么工作的?
参考答案:Skill是WorkBuddy的能力扩展单元,本质是一个SKILL.md文件,包含元数据(触发条件、工具权限)和指令正文(执行流程、注意事项)。触发时,AI会将skill内容加载到上下文中,按照指令执行任务。Skill分为用户级(~/.workbuddy/skills/)和项目级(项目内.workbuddy/skills/),还有内置和插件级。用户可以通过斜杠命令手动触发,也可以由AI根据语义自动匹配触发。Skill的关键价值是把经验和方法论编码化,让AI不只是靠通用知识做事,而是按照特定领域的最佳实践来执行。
Q3:MCP和连接器有什么区别?各自适用什么场景?
参考答案:连接器是产品官方预制的第三方服务集成,用户只需OAuth授权就能用,典型如腾讯文档、腾讯会议、GitHub等。MCP是开放协议,允许用户自行配置任何实现了MCP标准的工具服务。两者的区别类似"预装软件vs自己装软件"——连接器开箱即用但选择有限,MCP灵活但需要用户自行配置(写mcp.json)。实际使用中,常用的大平台走连接器,小众或自定义需求走MCP。
Q4:WorkBuddy的记忆系统是怎么设计的?
参考答案:记忆系统分多个层次:会话记忆(当前对话的上下文窗口)→ 工作记忆(.workbuddy/memory/目录下的日志文件和MEMORY.md)→ 身份记忆(SOUL.md/USER.md等全局配置)→ 事实记忆(云端存储的conversation_search可检索内容)。工作记忆通过每日追加日志来记录工作进展,通过MEMORY.md保存长期稳定信息。这解决了AI无状态的问题,让跨会话、跨任务的信息能被保留和复用。
Q5:你认为WorkBuddy和传统AI对话工具(如ChatGPT)最大的区别是什么?
参考答案:最根本的区别是"对话→智能体"的范式跃迁。传统AI对话工具是被动响应——你问一句它答一句。WorkBuddy是主动执行——你描述一个目标,它自主规划步骤、调用工具、处理异常、迭代优化、直到产出可验收的交付物。举个例子:你跟ChatGPT说"帮我做个周报",它给你一段文字;你跟WorkBuddy说同样的话,它会读取你的工作记录、组织内容、生成Word文档、保存到指定位置。一个是"给建议",一个是"交结果"。
Q6:如果用户说"WorkBuddy总是不记得我之前说过的话",你怎么处理?
参考答案:先判断问题属于哪个层面:
1. 同一会话内忘记 → 可能是上下文窗口超限,建议缩短对话或新建任务
2. 跨会话忘记 → 检查memory目录是否正常写入、MEMORY.md/USER.md是否有对应记录
3. 跨任务忘记 → 这是任务隔离的设计,建议使用cross-task-sync类skill或在MEMORY.md中维护关键信息
4. 完全没记忆功能 → 可能是客户端版本过旧或配置异常
核心是让用户理解记忆系统的工作原理和边界,而不是简单回复"这是产品限制"。