去年下半年,我帮一个做电商的朋友搭建了一套AI客服系统,事情过去快半年了,今天把整个过程和踩过的坑掰开揉碎讲一讲,希望对正在考虑上AI客服的朋友有帮助。
先说背景。朋友做的是家居日用品,天猫店加两个拼多多店铺,日均咨询量在500到800条左右。以前养了4个全职客服加2个兼职晚班,光人力成本一个月就要4万多,还不算培训和管理损耗。最头疼的是客服质量参差不齐,新人刚上手时回复错漏百出,差评里至少有一半跟客服回复不到位有关。
市面上AI客服方案其实不少,我们评估了几个方向。第一类是直接用大模型的API自己搭,灵活度高但技术门槛高,而且需要持续调优prompt。第二类是SaaS平台现成的方案,像晓多、乐言这些,价格不便宜,起步一年就要两三万,而且个性化定制能力有限。第三类是我们最终选的路子,用开源大模型加RAG知识库自己搭建。
选型上我推荐用通义千问的Qwen2.5-14B,在开源模型里性价比非常突出,部署成本也不高。不需要买昂贵的GPU服务器,用AutoDL或者其他云GPU租赁,按小时算,一天十几块钱就够了。当然,如果你的量特别大,可以考虑7B的小模型,或者直接用API调用的方式,按token付费,前期量小的时候反而更划算。
整个搭建过程说复杂也复杂,说简单也简单。核心就三步:知识库建设、模型微调、对话流程设计。
知识库这一步是最重的。我们把过去一年的客服聊天记录全部导出来,清洗、分类、标注。这个过程大概花了两周时间,四个兼职学生帮忙做的。分了售前、售后、物流、产品知识四个大类,每个类下面再细分常见问题。比如售前就分尺码咨询、材质疑问、颜色推荐、库存查询这些。每个问题和标准答案对应起来,大概积累了3000多组QA对。
这里有个关键坑要提醒。很多人直接把QA对丢进去用,效果很差。因为客户问问题的方式千奇百怪,同一种意思可能有十种表达方式。我们后来做了同义句扩展,用大模型帮我们把每个标准问题生成了5到8种不同的问法。比如"这个杯子容量多大"同时写了"这个杯子能装多少水""最大容量是多少""能装几毫升"这些变体。这个步骤做好之后,匹配准确率从60%直接飙到了90%以上。
RAG检索这块我们用了通义百炼平台的向量检索。把知识库里的每一条内容做向量化,客户问题进来之后先转向量,然后做相似度搜索,找到最匹配的3到5条知识,再交给大模型做整合回答。这么做的好处是回答基于真实的知识库,不会出现大模型胡编乱造的情况。
对话流程设计是第三个重点。我们把常见场景做了流程梳理。比如遇到退换货咨询,AI先问订单号,然后查订单状态,再根据是否在退换货期内走不同的流程。这个流程通过LangChain来编排,相当于给AI搭了一个决策树骨架,让它在框架内自由发挥,既灵活又有边界。
上线之后的效果比预期还好。第一个月AI就处理了超过65%的咨询量,剩下35%是AI判断需要人工介入的复杂问题或者情绪化的投诉。第二个月这个比例提升到了78%。三个月之后,AI自主处理率稳定在85%左右。4个全职客服减到了1个,主要负责处理AI转接过来的棘手问题和日常监控。
算一笔账。AI客服方案的一次性投入是知识库建设的人力成本大概8000块,算上部署和调优的云服务费,前后花了不到12000。之后每个月云服务成本在800到1500之间波动,取决于咨询量。对比以前每个月4万多的客服工资,省下来的钱非常可观。
但我必须说几个重要避坑点。第一个,AI客服不能完全替代人工。情绪化客户、复杂的投诉、涉及售后纠纷的,现阶段还是人工处理更稳妥。我们的做法是设置了情绪识别,通过关键词和语气判断客户是否情绪激动,一旦触发阈值立刻转人工。
第二个,知识库需要持续维护。新品上线、政策调整、活动规则变化,都要及时更新知识库。我们设了一个每周维护的机制,由专门的运营人员负责。
第三个,AI回复要保留人工审核的入口。特别是涉及承诺、赔偿、退款等敏感内容,我们设置了关键词触发审核机制,AI给出的这类回复需要人工确认后才能发出。
第四个,建议做A/B测试。初期可以设置AI接管和人工回复各50%的流量,对比客户满意度和转化率。我们就是通过A/B测试发现AI在推荐搭配商品方面效果特别好,转化率比人工客服高出12%。
最后说一点思考。AI客服不是一个要不要上的问题,而是怎么上的问题。对于创业者来说,花一两万块钱搭建一套能处理80%以上咨询的AI客服体系,ROI非常清晰。但关键是要舍得在知识库上投入时间和精力,这个决定了AI客服的上限。很多人口口声声说AI不行,实际上是自己的知识库没搭好。
如果你也在考虑上AI客服,建议先从最痛苦的环节切入。比如你的售后咨询最多最烦人,那就先做售后场景。不要一上来就想全覆盖,从单点突破,快速验证效果,然后慢慢扩展。这个方法论放之四海而皆准。 |