用 OpenAI API 做客服摘要的最小可行架构

客服团队每天会产生大量对话、邮件、工单和聊天记录。最适合 AI 先落地的场景，不一定是“自动客服机器人”，而是更低风险的“客服摘要”：把一段对话压缩成问题、情绪、优先级和下一步动作。

这篇文章给一个用 OpenAI API 做客服摘要的最小可行架构，适合产品原型和内部工具。

快速结论

客服摘要比自动回复更适合作为 AI 客服第一步。它风险低、价值明确、容易人工验证，也能为后续自动分类、工单分派和知识库补全打基础。

最小架构是：

客服消息 → 清洗文本 → OpenAI 摘要 → 结构化 JSON → 写入工单/表格 → 人工确认

适合谁

客服工单量大，但还不敢做自动回复的团队
想分析客户反馈主题的产品团队
想做 AI 客服 MVP 的开发者
需要把聊天记录变成 CRM 或工单摘要的运营团队

输出字段设计

不要只让模型返回一段自然语言摘要。建议返回结构化 JSON：

{
  "summary": "客户反馈导出 CSV 出现乱码，影响多个账号。",
  "issue_type": "bug",
  "sentiment": "negative",
  "priority": "high",
  "next_action": "创建技术排查工单，并回复客户预计处理时间。",
  "needs_human_review": true
}

这样后续可以直接写入客服系统、CRM、Slack 或 Google Sheets。

最小架构

模块	作用
数据来源	Zendesk、Intercom、邮箱、表单、聊天记录
文本清洗	去掉 HTML、签名、历史引用和无关系统消息
OpenAI API	生成摘要、分类、情绪和优先级
结果存储	写回工单、表格或数据库
人工审核	高风险或低置信度结果由人确认
日志监控	记录 token、耗时、失败原因

Prompt 模板

你是一个客服工单摘要助手。请阅读客户对话，输出 JSON。

字段：
- summary：三句话以内摘要
- issue_type：bug / billing / how_to / feature_request / other
- sentiment：positive / neutral / negative
- priority：high / medium / low
- next_action：建议客服或产品团队下一步动作
- needs_human_review：true / false

规则：
- 不要编造客户没有说过的信息。
- 如果信息不足，把 needs_human_review 设为 true。
- 涉及退款、赔偿、法律、隐私的问题必须人工审核。

客户对话：
{{conversation_text}}

为什么要加人工审核

客服摘要看起来风险低，但仍然可能误判：

把普通抱怨判断成高优先级
漏掉退款或隐私问题
误解客户真实诉求
把历史引用当成当前问题

所以第一版建议只辅助客服，不自动对外回复。

成本估算

假设每天 500 条客服对话，每条平均输入 1200 tokens，输出 250 tokens：

500 × 30 × 1450 = 21,750,000 tokens/月

降本策略：

短对话直接摘要，长对话先截断或分段
系统通知和无效消息先用规则过滤
重复问题走缓存或 FAQ 分类
高价值客户工单再用更强模型复核

常见错误

错误 1：直接做自动回复

自动回复涉及品牌、承诺、赔偿和合规。摘要和分类是更安全的第一步。

错误 2：不清洗聊天记录

客服记录里常有系统消息、按钮点击、机器人提示和历史引用。如果不清洗，摘要会变差。

错误 3：没有低置信度处理

如果模型不确定，应该进入人工审核，而不是硬给结论。

上线前检查

是否有 50 条真实工单测试集？
分类是否符合客服团队实际习惯？
高优先级是否有人工确认？
是否记录 token 和失败原因？
是否避免把敏感信息写入日志？

总结

用 OpenAI API 做客服摘要，是 AI 客服最适合落地的第一步。它不需要替代客服，只需要减少阅读和整理时间。

先做摘要、分类和下一步建议，再考虑自动回复。这样更安全，也更容易证明 AI 的实际价值。

一个落地案例

一个 SaaS 团队可以先选择最近 100 条客服工单做测试。人工先给每条工单标注理想摘要、问题类型和优先级，然后让模型输出同样字段，对比差异。

第一轮不追求完全自动化，只看三个指标：

指标	目标
摘要是否可用	80% 以上无需大改
问题类型是否正确	70%-85%
高优先级是否漏判	越低越好

如果高优先级漏判严重，不要上线自动分派，只能作为人工辅助。

上线前事实核验

待核验：本文可能涉及工具能力、平台限制、价格、搜索政策或当前产品行为。正式上线前需要用官方文档、实际测试或最新数据复查。