Buddy 产研三面:20题深度解题指南

基于简历逐点推演,涵盖转型动机、产品认知、AI技术、排障能力、自驱学习五大模块

模块一:转型动机 & 自我认知

开场必问 · 决定面试官对你的第一印象

1 你在售后做了5年,为什么现在想转AI产品方向?
面试官意图:看你是头脑发热还是想清楚了,转型决心是否坚定

回答框架(触发→认知→行动→目标):

最早接触GPT只是玩玩,要翻墙要付费就没深入。后来用豆包、文心一言,感觉质量差。真正转折点是DeepSeek火的那阵——它把思考过程展示出来了,我发现我能根据推理链去判断回答的可靠性。这个体验让我意识到AI不是黑箱玩具,是能理解、能深入的技术。

加上售后5年做到域名专项,技术深度的天花板已经看到了,但AI产品方向的天花板还看不到顶。所以我选择主动转,而不是等被动淘汰。

加分句:"我觉得售后5年最大的资产不是DNS知识本身,而是'站在用户角度想问题'的肌肉记忆——这个能力放到AI产品里同样有用,甚至更稀缺。"
2 你怎么定义你想做的事?是产品经理、技术支持还是解决方案?
面试官意图:看你目标是否清晰,是否和岗位匹配

短期:AI产品的技术支持——帮用户用好Buddy,解决使用中的问题,把用户反馈翻译成产研能理解的需求。

中期:随着对产品和技术理解加深,逐步参与产品方案设计,成为能和研发对齐、和客户沟通、能出方案的人。

不急着给自己贴标签说"我要做PM"或"我要做技术",先把事做好,路径自然清晰。

3 你和科班AI PM相比,最大的优势和最大的短板?
面试官意图:看你有没有自知之明,对自己定位是否准确
维度我的回答
优势5年一线面对客户——我知道用户真正卡在哪、怎么表达才能让他听懂。很多PM设计功能时不知道用户会怎么犯错,我太知道了。
短板AI原理的系统性——我现在能讲清Token、采样、训练三阶段、幻觉机制,但Transformer内部计算和模型训练的工程细节还在学。我的策略是"学到产品决策够用的深度",不追求变成算法工程师。

模块二:Buddy 产品认知

核心考察区 · 证明你不只是会用,而是懂产品

4 你日常用Buddy做什么?给我举一个最深的场景。
面试官意图:验证你是真用户还是简历注水

最深度的使用是用WorkBuddy搭建了一个个人知识库站点。整个流程:用WorkBuddy生成面试准备文档(8份HTML报告)→ 调用server-ssh skill连接我的广州轻量服务器 → Nginx配置 → SSL证书自动续期 → 部署到buddy.lezequan.online。

这个过程中我体验了Skill的触发和编排、Shell命令执行、文件生成等核心能力。不是简单问答,是把WorkBuddy当成协作工具完成了一整个项目。

可追加:还用WorkBuddy配置了自动化任务——每天定时抓取宏观经济数据生成简报推送,体验了Automation机制。
5 Skill是怎么被触发的?你配置过什么?遇到过什么坑? 需准备
面试官意图:看你对核心机制理解的深度,是只会用还是懂原理

触发机制:Skill本质是一个SKILL.md文件,里面定义了触发词(description字段)、可用工具(allowed-tools)、执行逻辑。当用户输入匹配到description中的关键词时,系统自动加载Skill的指令到上下文里,相当于给模型"装上了专业知识"。

配置过的Skill:

Skill名称功能
domain-diagnostics域名全面诊断(DNS/HTTP/SSL/端口)
server-sshSSH连接广州轻量服务器
buddy-docs-site知识库站点内容管理与部署
tencentcloud-ops腾讯云运维操作手册
cross-task-sync跨任务记忆同步

遇到的坑:

1. Skill不触发——排查发现description写得不够精准,关键词没覆盖用户的表述。解决:增加同义词覆盖。

2. Skill之间职责重叠——触发了错误的Skill。解决:明确每个Skill的边界,调整description使其互斥。

3. allowed-tools限制导致Skill内无法执行某些操作——需要在SKILL.md中正确声明所需工具列表。

6 MCP连接器用过哪些?MCP解决什么问题?和传统API的区别? 需准备
面试官意图:MCP是Buddy的核心技术之一,看你理解多深

用过的:腾讯文档MCP连接器,在对话中直接创建文档、读取内容、上传图片。

MCP解决的核心问题:让AI模型能安全地调用外部服务。

和传统API的关键区别:

维度传统APIMCP协议
调用者代码调代码(程序员写逻辑)模型调工具(AI自己决定何时调什么)
接入方式写代码集成配置文件(mcp.json)声明式接入
安全机制靠代码逻辑控制协议层内置权限+confirm确认机制
通用性每个API自己一套格式统一协议,一个标准适配所有服务
加分类比:"MCP之于AI调工具,相当于USB之于电脑连外设——统一接口标准,即插即用。"
7 Memory机制怎么理解?如果让你设计一个Memory方案? 需准备
面试官意图:看你能否从使用者上升到设计者视角

核心问题:AI对话是无状态的——每次新对话模型什么都不记得。Memory让跨会话的信息能持久化。

WorkBuddy的实现:以Markdown文件存储,分为日志型(按日期记录当天做了什么)和长期型(MEMORY.md汇总用户偏好、项目约定等)。每次新对话启动时读取Memory文件恢复上下文。

如果让我设计,三层架构:

层级内容更新频率
事实层用户固定信息(名字、城市、偏好)几乎不变
工作层当前在做什么、进度到哪频繁更新
历史层重要结论和决策按时间归档,定期蒸馏压缩
8 你发现过什么体验问题?如果你是PM你怎么改? 需准备
面试官意图:产品思维——能不能从用户视角发现问题并给出可落地方案

问题1:对话过长后token爆炸

现象:聊得越久越慢越贵,但用户不知道什么时候该清空。

方案:加"上下文健康度"指示器,快满时主动提醒,清空前自动把关键信息写入Memory。

问题2:Skill触发不符合预期

现象:用户以为说了关键词就会触发,结果没有。

方案:Skill未触发时给一个"你是不是想用XX功能?"的建议提示,降低用户困惑。

问题3:跨任务信息孤岛

现象:A任务里做的决策,B任务不知道。

方案:全局Memory层 + 跨任务同步机制(我实际开发了cross-task-sync skill解决此问题)。

9 CodeBuddy和WorkBuddy的定位区别?核心用户分别是谁? 需准备
面试官意图:你是否理解Buddy产品矩阵的战略布局
维度CodeBuddyWorkBuddy
核心用户开发者知识工作者(PM/运营/所有人)
核心场景IDE内写代码、调试、代码审查桌面端通用任务(文档/数据/运维/调研)
交互方式嵌入IDE,inline补全+对话独立桌面应用,对话+Agent执行
本质定位开发者的AI结对编程伙伴通用型桌面AI Agent
共同点Buddy体系,共享Skill/MCP/Memory底层能力架构

模块三:AI 技术理解

产研深挖区 · 证明你不是嘴上说学,而是真的懂

10 大模型为什么会产生幻觉? 高风险
面试官意图:看你对LLM原理的理解深度

幻觉不是bug,是LLM正常工作方式的副产品。

模型的任务是"预测最可能的下一个token",不是"查事实"。当它遇到不确定的问题时,不会停下来——它会继续生成一个"听起来最合理"的答案。

为什么难以根除:训练数据里很少有"我不知道"这种表述,模型从概率上就不倾向生成这几个字。

连锁效应:一旦编了第一步,后面的推理会基于编的内容继续,形成一套逻辑自洽的谎言——这比随机乱码更危险。

产品视角三原则:不让用户100%信任AI输出 / 高风险场景必须人在环 / 低风险场景可以放手让AI做
11 Token是什么?中文为什么消耗更多?产品设计有什么影响? 高风险
面试官意图:Token是基础中的基础,答不好其他都别聊了

Token是模型处理文本的最小单位,通过BPE(Byte Pair Encoding)算法按字符频率切分。不是字,不是词,是介于两者之间的"子词片段"。

中文消耗多的原因:主流模型用英文语料为主训练BPE词汇表,中文词汇表偏小。同样的意思中文可能多消耗30-50%的token。

产品影响:

1. 成本:API按token计费,中文产品天然成本更高

2. 速度:token越多推理越慢

3. 竞品差异:DeepSeek等国产模型扩大中文词汇表,同等内容消耗更少token——这是竞争优势

4. 对话设计:历史消息累积导致token爆炸,需要压缩/摘要策略

12 上下文窗口是什么?满了会怎样?产品怎么处理? 高风险
面试官意图:理解模型的硬约束以及产品层面的应对策略

定义:上下文窗口 = 模型一次能"看到"的最大token数。128K窗口约等于一本10万字的书。超出窗口的内容模型直接看不到——不是遗忘,是根本不存在于输入里。

满了的后果:早期的对话内容被截断丢弃,模型"失忆"。

产品层面的应对:

方案做法权衡
对话摘要把早期历史压缩成简短总结可能丢失细节
Memory持久化关键信息写入文件,不依赖窗口需要设计什么值得记
滑动窗口只保留最近N轮对话简单粗暴但可能丢关键上下文
RAG检索需要时实时检索,不全塞进去增加系统复杂度和延迟
13 RAG是什么?什么场景需要RAG而不是直接让模型回答? 高风险
面试官意图:RAG是Buddy产品的关键技术,必须能讲清

RAG = Retrieval-Augmented Generation(检索增强生成)

流程:用户问问题 → 先从知识库检索相关文档 → 把文档塞进prompt → 模型基于文档回答。

什么时候需要RAG:

需要RAG不需要RAG
公司内部文档通用知识问答
最新资料(训练后的事)创意生成/写作
专有数据/私有知识代码编写
需要引用来源的场景逻辑推理/数学
一句话总结:RAG解决的是"模型不知道"的问题,不是"模型不聪明"的问题。给笨模型加RAG不会变聪明,给聪明模型加RAG能让它不瞎编。
14 Agent和普通对话模型有什么区别?核心能力是什么? 高风险
面试官意图:WorkBuddy的核心定位就是Agent,必须答好

核心区别:

普通对话 = 你问我答,一个来回结束。

Agent = 你给目标,我自己规划步骤、调用工具、多轮执行、直到完成。

Agent四大核心能力:

能力含义Buddy中的体现
Planning把大目标拆成小步骤Plan模式、任务分解
Tool Use调用外部工具执行操作Skill/MCP/Bash/文件操作
Memory跨会话记住关键信息Memory文件系统
Reflection执行后检查结果、纠错Agent循环中的观察→调整
类比:普通对话是问路人"图书馆怎么走",Agent是你说"帮我借本《三体》"——它自己规划路线、去图书馆、找到书、办借阅、带回来。WorkBuddy本身就是一个Agent。

模块四:技术排障能力

硬实力验证 · 5年一线经验的体现

15 Skill不触发怎么排查的?最终原因是什么? 需准备
面试官意图:看你排障思维能否迁移到AI产品场景

排查步骤:

1. 确认Skill文件存在且路径正确(~/.workbuddy/skills/xxx/SKILL.md)

2. 检查SKILL.md的description字段——触发词是否覆盖了用户的表述方式

3. 检查是否有其他Skill的description冲突(优先级抢占)

4. 检查allowed-tools是否限制了需要的工具

5. 看agent_created标记是否正确

具体案例:域名诊断Skill不触发——原因是description里只写了"域名诊断",但我输入的是"检查一下这个域名",关键词没命中。加了"检查域名"、"域名健康"、"域名排查"等同义词后解决。

16 MCP连接失败你怎么排查? 需准备
面试官意图:验证你的系统化排障思维

分层排查思路:

1. 配置层:检查mcp.json——command、args、env是否正确填写

2. 状态层:看connector-status——connected还是disconnected

3. 认证层:token/credentials是否过期或缺失

4. 网络层:能否访问目标服务(防火墙/网络策略)

5. 错误层:看具体报错——认证失败 vs 连接超时 vs 参数错误是不同问题

关键原则:和传统网络排障思路一致——分层定位,先排除最简单的配置错误,再排查网络和认证问题。
17 客户说"网站打不开",你的排查步骤?
面试官意图:验证你5年排障经验的深度和系统性

标准分层排查流程:

1. 确认范围:所有人打不开还是只有他?(全局故障 vs 个人网络问题)

2. DNS层:域名解析是否正常?nslookup/dig看解析结果是否指向正确IP

3. 网络层:ping目标IP通不通?traceroute看哪一跳断了

4. 端口层:80/443端口是否开放?telnet测试

5. SSL层:证书是否过期?是否匹配域名?是否被中间设备拦截?

6. 应用层:Nginx/Apache是否在运行?配置是否正确?

7. 反馈:定位到原因后给解决方案 + 预计恢复时间

模块五:自驱 & 学习能力

三面文化匹配 · 证明你值得培养

18 知识库站点上有什么内容?为什么要搭这个?
面试官意图:看你是"学了就忘"还是有知识管理意识

内容分三类:

分类内容
面试类产品认知/技术理解的深度报告、反问策略
原理类LLM基础/Skill机制/MCP协议学习笔记
复盘类使用中踩的坑和解决方案

为什么搭:

1. "学的东西如果不沉淀就会忘"——对话会清空,但站点一直在

2. 验证自己能用Buddy完成一个从0到部署的完整项目——证明不只是会聊天,还会用它做事

可优化方向(如被追问):加"产品分析类"——Buddy竞品对比(Cursor/Copilot);加"客户案例类"——把排障经验转化成典型场景方案
19 你学AI到什么程度了?能不能分个级? 高风险
面试官意图:看你对自己学习进度的认知是否清醒
程度内容
懂了能讲Token/BPE/采样策略(Temperature/Top-P)/训练三阶段/幻觉本质与产品应对
概念清晰RAG/Agent/Skill/MCP/Memory的定义、用途和互相关系
在学中Transformer内部机制(Attention计算)、Embedding、向量检索
待学训练工程、模型部署、推理优化的底层实现

学习策略:"产品决策驱动的深度"——每个知识点学到能判断"这个场景该不该用、用了有什么风险"就够了,不追求自己能训练模型。

20 团队让你负责完全不熟的模块,你会怎么做?
面试官意图:学习能力+适应性,用真实案例说明

用域名专项的真实经历回答:

我从KA大客户一线转域名专项就是这种情况。KA的域名问题占比不到1%,转过去相当于全新领域。

我的做法:

1. 第1周:通读所有内部文档+历史工单,建立问题分类框架

2. 第2周:找域名方向老同事取经,要了"排障口诀"(高频问题快速判断路径)

3. 前2周每个工单记笔记,总结成自己的FAQ

4. 1个月独立处理,3个月成为方向主力

迁移到新模块的策略:先读文档建框架 → 找做过的人取经 → 实操中学 → 沉淀成文档。和学AI的路径完全一致——我现在学AI就是这么做的。

面试核心策略