Buddy产研三面 - 20题深度解题指南

模块一：转型动机 & 自我认知

开场必问 · 决定面试官对你的第一印象

1 你在售后做了5年，为什么现在想转AI产品方向？稳

面试官意图：看你是头脑发热还是想清楚了，转型决心是否坚定

回答框架（触发→认知→行动→目标）：

最早接触GPT只是玩玩，要翻墙要付费就没深入。后来用豆包、文心一言，感觉质量差。真正转折点是DeepSeek火的那阵——它把思考过程展示出来了，我发现我能根据推理链去判断回答的可靠性。这个体验让我意识到AI不是黑箱玩具，是能理解、能深入的技术。

加上售后5年做到域名专项，技术深度的天花板已经看到了，但AI产品方向的天花板还看不到顶。所以我选择主动转，而不是等被动淘汰。

      加分句："我觉得售后5年最大的资产不是DNS知识本身，而是'站在用户角度想问题'的肌肉记忆——这个能力放到AI产品里同样有用，甚至更稀缺。"
    

2 你怎么定义你想做的事？是产品经理、技术支持还是解决方案？稳

面试官意图：看你目标是否清晰，是否和岗位匹配

短期：AI产品的技术支持——帮用户用好Buddy，解决使用中的问题，把用户反馈翻译成产研能理解的需求。

中期：随着对产品和技术理解加深，逐步参与产品方案设计，成为能和研发对齐、和客户沟通、能出方案的人。

不急着给自己贴标签说"我要做PM"或"我要做技术"，先把事做好，路径自然清晰。

3 你和科班AI PM相比，最大的优势和最大的短板？稳

面试官意图：看你有没有自知之明，对自己定位是否准确

维度	我的回答
优势	5年一线面对客户——我知道用户真正卡在哪、怎么表达才能让他听懂。很多PM设计功能时不知道用户会怎么犯错，我太知道了。
短板	AI原理的系统性——我现在能讲清Token、采样、训练三阶段、幻觉机制，但Transformer内部计算和模型训练的工程细节还在学。我的策略是"学到产品决策够用的深度"，不追求变成算法工程师。

模块二：Buddy 产品认知

核心考察区 · 证明你不只是会用，而是懂产品

4 你日常用Buddy做什么？给我举一个最深的场景。稳

面试官意图：验证你是真用户还是简历注水

最深度的使用是用WorkBuddy搭建了一个个人知识库站点。整个流程：用WorkBuddy生成面试准备文档（8份HTML报告）→ 调用server-ssh skill连接我的广州轻量服务器 → Nginx配置 → SSL证书自动续期 → 部署到buddy.lezequan.online。

这个过程中我体验了Skill的触发和编排、Shell命令执行、文件生成等核心能力。不是简单问答，是把WorkBuddy当成协作工具完成了一整个项目。

      可追加：还用WorkBuddy配置了自动化任务——每天定时抓取宏观经济数据生成简报推送，体验了Automation机制。
    

5 Skill是怎么被触发的？你配置过什么？遇到过什么坑？需准备

面试官意图：看你对核心机制理解的深度，是只会用还是懂原理

触发机制：Skill本质是一个SKILL.md文件，里面定义了触发词（description字段）、可用工具（allowed-tools）、执行逻辑。当用户输入匹配到description中的关键词时，系统自动加载Skill的指令到上下文里，相当于给模型"装上了专业知识"。

配置过的Skill：

Skill名称	功能
domain-diagnostics	域名全面诊断（DNS/HTTP/SSL/端口）
server-ssh	SSH连接广州轻量服务器
buddy-docs-site	知识库站点内容管理与部署
tencentcloud-ops	腾讯云运维操作手册
cross-task-sync	跨任务记忆同步

遇到的坑：

1. Skill不触发——排查发现description写得不够精准，关键词没覆盖用户的表述。解决：增加同义词覆盖。

2. Skill之间职责重叠——触发了错误的Skill。解决：明确每个Skill的边界，调整description使其互斥。

3. allowed-tools限制导致Skill内无法执行某些操作——需要在SKILL.md中正确声明所需工具列表。

6 MCP连接器用过哪些？MCP解决什么问题？和传统API的区别？需准备

面试官意图：MCP是Buddy的核心技术之一，看你理解多深

用过的：腾讯文档MCP连接器，在对话中直接创建文档、读取内容、上传图片。

MCP解决的核心问题：让AI模型能安全地调用外部服务。

和传统API的关键区别：

维度	传统API	MCP协议
调用者	代码调代码（程序员写逻辑）	模型调工具（AI自己决定何时调什么）
接入方式	写代码集成	配置文件（mcp.json）声明式接入
安全机制	靠代码逻辑控制	协议层内置权限+confirm确认机制
通用性	每个API自己一套格式	统一协议，一个标准适配所有服务

      加分类比："MCP之于AI调工具，相当于USB之于电脑连外设——统一接口标准，即插即用。"
    

7 Memory机制怎么理解？如果让你设计一个Memory方案？需准备

面试官意图：看你能否从使用者上升到设计者视角

核心问题：AI对话是无状态的——每次新对话模型什么都不记得。Memory让跨会话的信息能持久化。

WorkBuddy的实现：以Markdown文件存储，分为日志型（按日期记录当天做了什么）和长期型（MEMORY.md汇总用户偏好、项目约定等）。每次新对话启动时读取Memory文件恢复上下文。

如果让我设计，三层架构：

层级	内容	更新频率
事实层	用户固定信息（名字、城市、偏好）	几乎不变
工作层	当前在做什么、进度到哪	频繁更新
历史层	重要结论和决策	按时间归档，定期蒸馏压缩

8 你发现过什么体验问题？如果你是PM你怎么改？需准备

面试官意图：产品思维——能不能从用户视角发现问题并给出可落地方案

问题1：对话过长后token爆炸

现象：聊得越久越慢越贵，但用户不知道什么时候该清空。

方案：加"上下文健康度"指示器，快满时主动提醒，清空前自动把关键信息写入Memory。

问题2：Skill触发不符合预期

现象：用户以为说了关键词就会触发，结果没有。

方案：Skill未触发时给一个"你是不是想用XX功能？"的建议提示，降低用户困惑。

问题3：跨任务信息孤岛

现象：A任务里做的决策，B任务不知道。

方案：全局Memory层 + 跨任务同步机制（我实际开发了cross-task-sync skill解决此问题）。

9 CodeBuddy和WorkBuddy的定位区别？核心用户分别是谁？需准备

面试官意图：你是否理解Buddy产品矩阵的战略布局

维度	CodeBuddy	WorkBuddy
核心用户	开发者	知识工作者（PM/运营/所有人）
核心场景	IDE内写代码、调试、代码审查	桌面端通用任务（文档/数据/运维/调研）
交互方式	嵌入IDE，inline补全+对话	独立桌面应用，对话+Agent执行
本质定位	开发者的AI结对编程伙伴	通用型桌面AI Agent
共同点	Buddy体系，共享Skill/MCP/Memory底层能力架构

模块三：AI 技术理解

产研深挖区 · 证明你不是嘴上说学，而是真的懂

10 大模型为什么会产生幻觉？高风险

面试官意图：看你对LLM原理的理解深度

幻觉不是bug，是LLM正常工作方式的副产品。

模型的任务是"预测最可能的下一个token"，不是"查事实"。当它遇到不确定的问题时，不会停下来——它会继续生成一个"听起来最合理"的答案。

为什么难以根除：训练数据里很少有"我不知道"这种表述，模型从概率上就不倾向生成这几个字。

连锁效应：一旦编了第一步，后面的推理会基于编的内容继续，形成一套逻辑自洽的谎言——这比随机乱码更危险。

      产品视角三原则：不让用户100%信任AI输出 / 高风险场景必须人在环 / 低风险场景可以放手让AI做
    

11 Token是什么？中文为什么消耗更多？产品设计有什么影响？高风险

面试官意图：Token是基础中的基础，答不好其他都别聊了

Token是模型处理文本的最小单位，通过BPE（Byte Pair Encoding）算法按字符频率切分。不是字，不是词，是介于两者之间的"子词片段"。

中文消耗多的原因：主流模型用英文语料为主训练BPE词汇表，中文词汇表偏小。同样的意思中文可能多消耗30-50%的token。

产品影响：

1. 成本：API按token计费，中文产品天然成本更高

2. 速度：token越多推理越慢

3. 竞品差异：DeepSeek等国产模型扩大中文词汇表，同等内容消耗更少token——这是竞争优势

4. 对话设计：历史消息累积导致token爆炸，需要压缩/摘要策略

12 上下文窗口是什么？满了会怎样？产品怎么处理？高风险

面试官意图：理解模型的硬约束以及产品层面的应对策略

定义：上下文窗口 = 模型一次能"看到"的最大token数。128K窗口约等于一本10万字的书。超出窗口的内容模型直接看不到——不是遗忘，是根本不存在于输入里。

满了的后果：早期的对话内容被截断丢弃，模型"失忆"。

产品层面的应对：

方案	做法	权衡
对话摘要	把早期历史压缩成简短总结	可能丢失细节
Memory持久化	关键信息写入文件，不依赖窗口	需要设计什么值得记
滑动窗口	只保留最近N轮对话	简单粗暴但可能丢关键上下文
RAG检索	需要时实时检索，不全塞进去	增加系统复杂度和延迟

13 RAG是什么？什么场景需要RAG而不是直接让模型回答？高风险

面试官意图：RAG是Buddy产品的关键技术，必须能讲清

RAG = Retrieval-Augmented Generation（检索增强生成）

流程：用户问问题 → 先从知识库检索相关文档 → 把文档塞进prompt → 模型基于文档回答。

什么时候需要RAG：

需要RAG	不需要RAG
公司内部文档	通用知识问答
最新资料（训练后的事）	创意生成/写作
专有数据/私有知识	代码编写
需要引用来源的场景	逻辑推理/数学

      一句话总结：RAG解决的是"模型不知道"的问题，不是"模型不聪明"的问题。给笨模型加RAG不会变聪明，给聪明模型加RAG能让它不瞎编。
    

14 Agent和普通对话模型有什么区别？核心能力是什么？高风险

面试官意图：WorkBuddy的核心定位就是Agent，必须答好

核心区别：

普通对话 = 你问我答，一个来回结束。

Agent = 你给目标，我自己规划步骤、调用工具、多轮执行、直到完成。

Agent四大核心能力：

能力	含义	Buddy中的体现
Planning	把大目标拆成小步骤	Plan模式、任务分解
Tool Use	调用外部工具执行操作	Skill/MCP/Bash/文件操作
Memory	跨会话记住关键信息	Memory文件系统
Reflection	执行后检查结果、纠错	Agent循环中的观察→调整

      类比：普通对话是问路人"图书馆怎么走"，Agent是你说"帮我借本《三体》"——它自己规划路线、去图书馆、找到书、办借阅、带回来。WorkBuddy本身就是一个Agent。
    

模块四：技术排障能力

硬实力验证 · 5年一线经验的体现

15 Skill不触发怎么排查的？最终原因是什么？需准备

面试官意图：看你排障思维能否迁移到AI产品场景

排查步骤：

1. 确认Skill文件存在且路径正确（~/.workbuddy/skills/xxx/SKILL.md）

2. 检查SKILL.md的description字段——触发词是否覆盖了用户的表述方式

3. 检查是否有其他Skill的description冲突（优先级抢占）

4. 检查allowed-tools是否限制了需要的工具

5. 看agent_created标记是否正确

具体案例：域名诊断Skill不触发——原因是description里只写了"域名诊断"，但我输入的是"检查一下这个域名"，关键词没命中。加了"检查域名"、"域名健康"、"域名排查"等同义词后解决。

16 MCP连接失败你怎么排查？需准备

面试官意图：验证你的系统化排障思维

分层排查思路：

1. 配置层：检查mcp.json——command、args、env是否正确填写

2. 状态层：看connector-status——connected还是disconnected

3. 认证层：token/credentials是否过期或缺失

4. 网络层：能否访问目标服务（防火墙/网络策略）

5. 错误层：看具体报错——认证失败 vs 连接超时 vs 参数错误是不同问题

      关键原则：和传统网络排障思路一致——分层定位，先排除最简单的配置错误，再排查网络和认证问题。
    

17 客户说"网站打不开"，你的排查步骤？稳

面试官意图：验证你5年排障经验的深度和系统性

标准分层排查流程：

1. 确认范围：所有人打不开还是只有他？（全局故障 vs 个人网络问题）

2. DNS层：域名解析是否正常？nslookup/dig看解析结果是否指向正确IP

3. 网络层：ping目标IP通不通？traceroute看哪一跳断了

4. 端口层：80/443端口是否开放？telnet测试

5. SSL层：证书是否过期？是否匹配域名？是否被中间设备拦截？

6. 应用层：Nginx/Apache是否在运行？配置是否正确？

7. 反馈：定位到原因后给解决方案 + 预计恢复时间

模块五：自驱 & 学习能力

三面文化匹配 · 证明你值得培养

18 知识库站点上有什么内容？为什么要搭这个？稳

面试官意图：看你是"学了就忘"还是有知识管理意识

内容分三类：

分类	内容
面试类	产品认知/技术理解的深度报告、反问策略
原理类	LLM基础/Skill机制/MCP协议学习笔记
复盘类	使用中踩的坑和解决方案

为什么搭：

1. "学的东西如果不沉淀就会忘"——对话会清空，但站点一直在

2. 验证自己能用Buddy完成一个从0到部署的完整项目——证明不只是会聊天，还会用它做事

      可优化方向（如被追问）：加"产品分析类"——Buddy竞品对比（Cursor/Copilot）；加"客户案例类"——把排障经验转化成典型场景方案
    

19 你学AI到什么程度了？能不能分个级？高风险

面试官意图：看你对自己学习进度的认知是否清醒

程度	内容
懂了能讲	Token/BPE/采样策略(Temperature/Top-P)/训练三阶段/幻觉本质与产品应对
概念清晰	RAG/Agent/Skill/MCP/Memory的定义、用途和互相关系
在学中	Transformer内部机制（Attention计算）、Embedding、向量检索
待学	训练工程、模型部署、推理优化的底层实现

学习策略："产品决策驱动的深度"——每个知识点学到能判断"这个场景该不该用、用了有什么风险"就够了，不追求自己能训练模型。

20 团队让你负责完全不熟的模块，你会怎么做？稳

面试官意图：学习能力+适应性，用真实案例说明

用域名专项的真实经历回答：

我从KA大客户一线转域名专项就是这种情况。KA的域名问题占比不到1%，转过去相当于全新领域。

我的做法：

1. 第1周：通读所有内部文档+历史工单，建立问题分类框架

2. 第2周：找域名方向老同事取经，要了"排障口诀"（高频问题快速判断路径）

3. 前2周每个工单记笔记，总结成自己的FAQ

4. 1个月独立处理，3个月成为方向主力

迁移到新模块的策略：先读文档建框架 → 找做过的人取经 → 实操中学 → 沉淀成文档。和学AI的路径完全一致——我现在学AI就是这么做的。

面试核心策略