01

产品认知深度

面试权重最高 · CodeBuddy与WorkBuddy全维度解析

目录

  1. 产品定位全景:CodeBuddy vs WorkBuddy
  2. WorkBuddy 核心架构深度解析
  3. Skill 技能机制全解
  4. MCP 协议与连接器体系
  5. 自动化(Automation)系统
  6. 记忆系统与上下文管理
  7. 工作模式与权限体系
  8. 多模态内容生成能力
  9. 产品边界认知:能做什么与不能做什么
  10. 面试高频问答精析

一、产品定位全景:CodeBuddy vs WorkBuddy

1.1 一句话定位

CodeBuddy 是腾讯云推出的 AI 代码编辑器,面向开发者,核心场景是代码编写、调试、重构、工程管理。它的本质是一个「写代码的AI同事」。

WorkBuddy 是腾讯推出的 全场景职场AI智能体桌面工作台,面向各类职能角色(不限于开发者),核心场景是文档处理、数据分析、报告生成、自动化办公。它的本质是一个「全能型职场AI助手」。

面试关键点:两者不是竞争关系,而是互补关系。CodeBuddy聚焦「代码领域」,WorkBuddy聚焦「通用职场」。一个是开发者的编程伙伴,一个是所有职场人的工作助理。

1.2 核心差异对比表

维度 CodeBuddy WorkBuddy
目标用户 开发者、程序员、工程师 所有职场人(产品、运营、市场、管理等)
使用形态 IDE/编辑器(独立桌面应用) 桌面工作台 + 小程序入口
核心能力 代码补全、智能重构、Bug修复、工程分析 任务执行、文档生成、数据分析、多模态生成
操作对象 代码文件、项目工程、Git仓库 本地文件、网络资源、第三方服务
技术栈要求 需要编程基础 零技术门槛,自然语言交互
扩展方式 插件体系 Skill + MCP + 连接器 + 自动化
交付物 代码、项目、功能模块 文档、报告、PPT、数据可视化、网站
上下文 项目代码库上下文 用户文件 + 网络 + 记忆系统 + 连接器数据

1.3 产品形态深度理解

CodeBuddy 的产品形态

CodeBuddy 是一个完整的代码编辑器(AI Code Editor),而不仅仅是一个插件。它具备:

WorkBuddy 的产品形态

WorkBuddy 是一个桌面工作台(Desktop Workstation),核心理念是「用一句话完成工作」:

1.4 用户画像与使用场景对照

CodeBuddy 典型场景

  1. 开发者需要快速写一个REST API → CodeBuddy内通过对话描述需求,直接生成代码
  2. 重构一个老旧模块 → AI理解整个项目后提供重构建议并执行
  3. 修复测试用例失败 → AI分析报错,定位问题,生成修复方案
  4. 学习新框架 → 通过对话方式边学边写,AI即时解答

WorkBuddy 典型场景

  1. 产品经理写周报 → 一句话描述本周工作,自动生成格式化周报
  2. 运营分析数据 → 上传Excel,自动分析趋势并生成可视化图表
  3. 制作汇报PPT → 描述主题和要点,自动生成完整演示文稿
  4. 批量处理文件 → 自动重命名、格式转换、整理归档
  5. 深度调研 → 对某个话题进行多维度深度研究并输出报告

1.5 两者的协同关系

在实际工作流中,CodeBuddy和WorkBuddy可以形成互补:

面试易错点:不要说"WorkBuddy是CodeBuddy的非技术版本"。它们的定位、架构和能力模型完全不同。WorkBuddy有自己独立的Skill体系、记忆系统、连接器生态,不是简单的"阉割版"。

二、WorkBuddy 核心架构深度解析

2.1 整体架构层次

WorkBuddy 的系统架构可以分为以下几个核心层次:

┌─────────────────────────────────────────────────────┐
│                  用户交互层                           │
│  (桌面客户端 / 微信小程序 / Web界面)                 │
├─────────────────────────────────────────────────────┤
│                  智能体引擎层                         │
│  (大模型推理 / 任务规划 / 工具选择 / 上下文管理)     │
├─────────────────────────────────────────────────────┤
│                  能力扩展层                           │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐  │
│  │  Skill  │ │   MCP   │ │ 连接器  │ │ 自动化  │  │
│  │ 技能系统 │ │  协议层  │ │  系统   │ │  系统   │  │
│  └─────────┘ └─────────┘ └─────────┘ └─────────┘  │
├─────────────────────────────────────────────────────┤
│                  基础能力层                           │
│  (文件系统 / 命令执行 / 网络访问 / 多模态处理)      │
├─────────────────────────────────────────────────────┤
│                  数据持久层                           │
│  (记忆系统 / 会话管理 / 配置存储 / 任务历史)        │
└─────────────────────────────────────────────────────┘

2.2 智能体引擎核心机制

WorkBuddy的核心是一个Agent Loop(智能体循环),这是区别于传统对话AI的关键特征:

  1. 分析上下文:理解用户意图和当前状态
  2. 思考规划:推理是否需要更新计划、推进阶段或执行动作
  3. 选择工具:根据计划选择下一个要调用的工具
  4. 执行动作:在沙箱环境中执行操作
  5. 接收观察:获取执行结果作为新的观察
  6. 迭代循环:重复以上步骤直到任务完成
  7. 呈现结果:将最终交付物展示给用户
核心理解:WorkBuddy不是"一问一答"的对话机器人,而是"接受任务→自主执行→交付结果"的智能体。它会自己拆解任务、选择工具、处理异常、迭代优化,直到产出用户满意的交付物。

2.3 三种工作模式

WorkBuddy提供三种工作模式,适配不同场景需求:

模式 名称 行为 适用场景
Craft 你说我做 直接执行任务,读写文件、运行命令、生成内容 目标明确的执行类任务
Plan 先想后做 先分析设计方案,用户确认后再执行 复杂任务需要确认方向
Ask 只聊不动 只回答问题、读取信息,不修改任何文件 咨询、分析、讨论

2.4 工具调用体系

WorkBuddy拥有丰富的内置工具:

三、Skill 技能机制全解

3.1 什么是 Skill

Skill(技能)是WorkBuddy的扩展能力单元,本质上是一个结构化的Markdown指令文件(SKILL.md),它告诉AI在特定场景下应该如何行动。

可以把Skill理解为:给AI一份「岗位手册」,让它在遇到特定类型的任务时,按照手册中的流程和规范来执行,而不是凭通用知识随意发挥。

3.2 Skill 的存储层级

层级 存储路径 作用域 说明
用户级 ~/.workbuddy/skills/ 当前用户所有项目 个人通用技能,跨项目复用
项目级 {workspace}/.workbuddy/skills/ 当前项目 项目专用技能,团队成员共享
内置级 系统内置 全局 产品出厂自带的基础技能
插件级 插件系统 已安装插件 通过插件市场安装的技能

3.3 SKILL.md 文件结构

一个标准的SKILL.md文件由 frontmatter(元数据)和 body(指令内容)组成:

---
title: "技能名称"
description: "技能描述,决定何时触发"
agent_created: true          # 是否由AI创建(可修改/删除的标志)
allowed-tools:               # 可选:限制该skill可使用的工具
  - Read
  - Write
  - Bash
---

# 技能指令正文

## 触发条件
描述何时应该使用这个技能...

## 执行流程
1. 第一步做什么
2. 第二步做什么
...

## 注意事项
- 避免xxx
- 优先xxx

3.4 Skill 触发机制

Skill的触发有多种方式:

  1. 自动触发:AI根据用户请求的语义,匹配到合适的skill的description,自动加载执行
  2. 斜杠命令触发:用户输入 /skill-name 直接调用
  3. 前置/后置hook:某些skill在特定操作前后自动触发
触发匹配逻辑:AI会将用户请求的意图与所有可用skill的description字段进行语义匹配。description写得越精准、触发词越明确,匹配就越准确。这就是为什么好的skill必须有清晰的description。

3.5 Skill 的能力边界控制

通过 allowed-tools 字段可以限制skill能使用的工具范围:

3.6 Skill 的生命周期管理

3.7 Skill 生态与分类

当前WorkBuddy的skill生态涵盖多个领域:

分类 代表Skill 能力说明
办公文档 pptx, docx, xlsx, pdf 生成/编辑Office文档和PDF
开发工具 github, cloudbase, web-development 代码托管、云开发、前端开发
内容生产 content-factory, novel-writer, humanizer 多格式内容批量生产
信息获取 deep-research, tavily, news-summary 深度调研、搜索、新闻聚合
金融数据 stock-analyzer, westockdata, neodata 股票分析、金融数据查询
平台集成 tencent-docs, tencent-meeting, ima-skills 对接腾讯生态服务
浏览器 playwright-browser-automation, web-access 网页自动化操作

3.8 面试必知:Skill相关高频问题

Q:Skill和MCP有什么区别?
A:Skill是「行为指令」——告诉AI在特定场景下怎么做事。MCP是「能力通道」——让AI能调用外部工具/服务。一个是"做事的方法论",一个是"做事的工具通道"。它们经常配合使用:一个Skill可能指导AI通过MCP调用某个外部API。

四、MCP 协议与连接器体系

4.1 什么是 MCP

MCP(Model Context Protocol,模型上下文协议)是一种标准化协议,用于让AI模型与外部工具和服务进行通信。它定义了AI如何发现、调用和接收外部工具的结果。

简单理解:MCP就像USB接口标准,有了它,任何工具/服务只要实现MCP协议,就能被AI调用,无需为每个工具单独写集成代码。

4.2 MCP 配置方式

WorkBuddy的MCP配置文件位于:~/.workbuddy/mcp.json

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": ["@playwright/mcp@latest"],
      "env": {}
    },
    "custom-server": {
      "url": "http://localhost:3000/mcp",
      "headers": {
        "Authorization": "Bearer xxx"
      }
    }
  }
}

4.3 MCP 服务器类型

类型 通信方式 配置字段 适用场景
stdio 标准输入/输出 command + args 本地CLI工具(如playwright, sqlite)
HTTP/SSE HTTP请求 + 服务端事件 url + headers 远程服务API

4.4 连接器(Connector)体系

连接器是WorkBuddy内置的第三方服务集成模块,与MCP的区别在于:

当前WorkBuddy支持的连接器包括:

4.5 MCP与连接器的协同

理解要点:连接器是"官方精装"——产品团队预先实现好的集成,用户零配置。MCP是"毛坯自装"——开放协议,用户自己配置外部服务。两者都让AI获得了调用外部服务的能力,只是接入方式和维护责任不同。

五、自动化(Automation)系统

5.1 自动化是什么

WorkBuddy的自动化系统允许用户创建定时执行的任务——让AI按照设定的时间表自动完成重复性工作,无需人工每次触发。

5.2 自动化类型

类型 配置方式 说明
定时循环(Recurring) rrule(RFC 5545标准) 按cron规则重复执行,如每天、每周
单次定时(Once) scheduledAt(ISO 8601时间) 在指定时间执行一次

5.3 自动化配置要素

5.4 自动化存储机制

自动化数据存储在SQLite数据库中:~/.workbuddy/workbuddy.db

重要安全规则:删除自动化只能通过automation_update工具进行,绝对不能用rm、sqlite3等命令直接操作数据库文件。这是产品的安全边界。

5.5 典型自动化场景

  1. 每日新闻推送:每天早上8点自动爬取并总结行业新闻
  2. 周报自动生成:每周五下午自动汇总本周工作记录生成周报
  3. 定时数据监控:每小时检查某个数据指标,异常时告警
  4. 文件定期备份:每天自动整理和备份指定文件夹
  5. 会议提醒:指定时间提醒用户准备会议材料

六、记忆系统与上下文管理

6.1 为什么需要记忆系统

AI模型本身是无状态的——每次新对话都是"失忆"状态。WorkBuddy的记忆系统解决了这个问题,让AI能够:

6.2 记忆的层次结构

层次 位置 生命周期 内容类型
会话记忆 对话上下文窗口 当前会话 本次对话的内容
工作记忆 .workbuddy/memory/ 跨会话持久 每日工作日志 + 长期记忆
身份记忆 ~/.workbuddy/ 全局持久 SOUL.md / IDENTITY.md / USER.md
事实记忆 云端存储 永久 通过conversation_search检索

6.3 工作记忆文件结构

.workbuddy/memory/
├── MEMORY.md          # 长期记忆(就地更新)
├── 2026-05-15.md      # 今日工作日志(追加写入)
├── 2026-05-14.md      # 昨日工作日志
└── ...                # 更早的日志(30天后归档到MEMORY.md)

6.4 身份系统三件套

6.5 跨任务记忆同步

WorkBuddy的每个任务都有独立的上下文(任务隔离),这带来了信息孤岛问题。解决方案:

面试价值点:如果被问到"WorkBuddy怎么解决多任务信息隔离",能回答出三层方案(工作记忆文件 → conversation_search → 自定义同步Skill)会展示深度理解。

七、工作模式与权限体系

7.1 沙箱安全机制

WorkBuddy的操作都在沙箱环境中执行,具有安全边界:

7.2 权限层级

操作类型 权限要求 说明
读取项目文件 默认允许 工作区内的文件可直接读取
写入/修改文件 默认允许(工作区内) 在授权的工作目录内操作
执行命令 需要确认(部分) 高危命令需用户确认
网络访问 默认允许 网页抓取、API调用等
个人文件操作 高危-需确认 Desktop等目录有严格保护
外部发送 最高-需确认 邮件、消息等对外操作必须确认

7.3 Plan Mode 的价值

Plan模式(计划模式)是WorkBuddy的安全阀之一:

八、多模态内容生成能力

8.1 支持的生成类型

类型 说明 触发方式
文生图 根据文字描述生成图片 "生成一张..."、"画一个..."
文生视频 根据文字描述生成视频 "生成一段视频..."
文生3D 从文字描述生成3D模型 "生成一个3D模型..."
图生3D 从图片生成3D模型 上传图片 + "转为3D"
图片编辑 对已有图片进行AI编辑 上传图片 + 编辑指令
图片特效 对图片/视频施加特效 "添加特效..."

8.2 内联可视化

WorkBuddy还支持在对话中直接渲染SVG图表和HTML交互组件:

九、产品边界认知:能做什么与不能做什么

9.1 WorkBuddy 能做的

9.2 WorkBuddy 不能/不应该做的

9.3 常见误解与正确理解

用户误解 正确理解
"WorkBuddy就是ChatGPT的桌面版" WorkBuddy是智能体,能自主执行任务,不只是对话
"AI能直接帮我操作微信" 需要通过MCP/连接器桥接,不能直接控制桌面App
"每次打开都要重新介绍自己" 通过记忆系统持久化用户信息,不需要每次重复
"Skill装多了会让AI变笨" Skill只在触发时加载,不会占用常驻上下文
"自动化就是crontab" 自动化的prompt是AI指令,比crontab灵活得多

十、面试高频问答精析

Q1:请介绍一下CodeBuddy和WorkBuddy的关系

参考答案:CodeBuddy和WorkBuddy是腾讯Buddy系列的两个产品,定位互补而非竞争。CodeBuddy是AI代码编辑器,面向开发者,解决"写代码"的问题;WorkBuddy是全场景职场AI工作台,面向所有职场人,解决"办公任务"的问题。技术上它们共享底层AI能力,但产品形态、目标用户、核心场景完全不同。一个开发者可能同时使用两者——用CodeBuddy写代码,用WorkBuddy做调研、写文档、管理项目。

Q2:WorkBuddy的Skill机制是怎么工作的?

参考答案:Skill是WorkBuddy的能力扩展单元,本质是一个SKILL.md文件,包含元数据(触发条件、工具权限)和指令正文(执行流程、注意事项)。触发时,AI会将skill内容加载到上下文中,按照指令执行任务。Skill分为用户级(~/.workbuddy/skills/)和项目级(项目内.workbuddy/skills/),还有内置和插件级。用户可以通过斜杠命令手动触发,也可以由AI根据语义自动匹配触发。Skill的关键价值是把经验和方法论编码化,让AI不只是靠通用知识做事,而是按照特定领域的最佳实践来执行。

Q3:MCP和连接器有什么区别?各自适用什么场景?

参考答案:连接器是产品官方预制的第三方服务集成,用户只需OAuth授权就能用,典型如腾讯文档、腾讯会议、GitHub等。MCP是开放协议,允许用户自行配置任何实现了MCP标准的工具服务。两者的区别类似"预装软件vs自己装软件"——连接器开箱即用但选择有限,MCP灵活但需要用户自行配置(写mcp.json)。实际使用中,常用的大平台走连接器,小众或自定义需求走MCP。

Q4:WorkBuddy的记忆系统是怎么设计的?

参考答案:记忆系统分多个层次:会话记忆(当前对话的上下文窗口)→ 工作记忆(.workbuddy/memory/目录下的日志文件和MEMORY.md)→ 身份记忆(SOUL.md/USER.md等全局配置)→ 事实记忆(云端存储的conversation_search可检索内容)。工作记忆通过每日追加日志来记录工作进展,通过MEMORY.md保存长期稳定信息。这解决了AI无状态的问题,让跨会话、跨任务的信息能被保留和复用。

Q5:你认为WorkBuddy和传统AI对话工具(如ChatGPT)最大的区别是什么?

参考答案:最根本的区别是"对话→智能体"的范式跃迁。传统AI对话工具是被动响应——你问一句它答一句。WorkBuddy是主动执行——你描述一个目标,它自主规划步骤、调用工具、处理异常、迭代优化、直到产出可验收的交付物。举个例子:你跟ChatGPT说"帮我做个周报",它给你一段文字;你跟WorkBuddy说同样的话,它会读取你的工作记录、组织内容、生成Word文档、保存到指定位置。一个是"给建议",一个是"交结果"。

Q6:如果用户说"WorkBuddy总是不记得我之前说过的话",你怎么处理?

参考答案:先判断问题属于哪个层面:
1. 同一会话内忘记 → 可能是上下文窗口超限,建议缩短对话或新建任务
2. 跨会话忘记 → 检查memory目录是否正常写入、MEMORY.md/USER.md是否有对应记录
3. 跨任务忘记 → 这是任务隔离的设计,建议使用cross-task-sync类skill或在MEMORY.md中维护关键信息
4. 完全没记忆功能 → 可能是客户端版本过旧或配置异常
核心是让用户理解记忆系统的工作原理和边界,而不是简单回复"这是产品限制"。
← 返回首页 下一篇:问题定位能力 →