All In AI的智能时代到来,头部科技公司都在投入巨资,打造各自的AI才能。你是否也期待能够具有强大的AI才能,为你的客户供给全天候的智能服务,不管时间和地址,都能延展咱们杰出的客户关心与支持!如:供给智能出售,随时为客户供给产品和计划咨询;供给智能客服,为客户供给全天候不间断的售后服务;供给智能署理,为客户的消费、理财供给即席剖析,给出主张。
假如能够站在这些大公司和开源社区的成果上,看似很深邃的AI作业,也变得像把大象装入冰箱相同简单。
接下来,咱们能够参阅Langchain chatGLM的办法,首要打造一个智能客服,解放你们公司客服长时间不间断的重复作业,让他们集中精力处理更需求创造力的作业上。
智能客服
第一步,售后常识库准备作业,成果为WORD,PDF,TXT,MarkDown等格局的电子文档:
-
收集整理公司客服应对记录,保留与公司产品售后服务相关的文本记录
-
收集公司在售产品的产品手册、操作说明书、售后服务协议、客服人员培训资料等
第二步,建立流水安装工厂,成果是将常识库中的电子文档转化为言语向量
可从开源社区GitHub中寻觅这类向量化安装工厂,完结常识库文本向量化流水处理作业。引荐可采用Langchain,建立起安装工厂的流水线,这条流水线的上下游构成如下:
-
挑选各类非结构化的文本加载东西(Langchain中整合了各类常见文件加载器),拼装成所需的文本加载器组
-
挑选文本切割器(如nlp_bert_document-segmentation_chinese-base),将大文本切割成段,便利后续加工
-
挑选文本向量化模型Embedding,如( nghuyong/ernie-3.0-nano-zh,GanymedeNil/text2vec-large-chinese)
-
挑选一个向量化数据库VectorStore,如(Milvus,FAISS)
-
采用Langchain这类东西,将以上东西和模型组装成流水线,实现文本常识存入向量数据库
第三步,建立和练习大言语模型,成果是具备你专业事务范畴的常识处理才能的大言语模型
-
挑选大言语模型基座,可供挑选的大言语模型很多,既可选开源的大言语模型(如THUDM/chatglm-6b,vicuna-13b-hf),也可选商用的大言语模型(如OpenAI中的gpt-35-turbo)。
-
将以上常识库中的文本,按模型练习所需的数据格局(如JSON格局),随机分成两部分,一部分为练习数据,一部分为测试数据,一般切割比例可设为4:1。
-
利用大言语模型供给的API接口,输入以上练习和测试数据,练习大言语模型,得到微调模型
-
发动大言语模型,加载微调后的模型,运用chat类接口,验证练习成果
第四步,将客户的问题输入给大言语模型,成果是智能客服像人相同为客户做服务
-
接收用户问题输入,采用第二步相同的Embedding东西,进行向量化
-
将向量化后的问题,在向量常识库中进行搜索,获得与此问题语义相关度较高的常识文本片段
-
将客户问题和常识文本片段,按发问模板拼装为问题提示Prompt
-
将Prompt发大言语模型,调用chat类接口,生成答案
-
将问题答案以Stream的形式展示给客户端,实现逐字逐句问答的效果
图1. Chat-Agent
接下来,咱们还能够建立一个更加复杂的智能署理。其步骤办法与智能客服类似,但需求在一些环节中加入对事务交易体系数据操作的才能。
智能署理
咱们参阅DB-GPT,在以上的安装线上,做些组件更换,练习数据弥补,引进数据库操作和数据展示等东西。
第一步,增加事务体系数据结构常识准备作业
- 在公司事务产品常识库的根底是根底上,增加事务体系数据结构文档
第二步,建立流水安装工厂,支持数据库处理才能
- 新引进常用ER图格局转SQL东西组件(如eralchemy,sqlacodegen)
- 引进SQL执行器(如SQLAlchemy)、数据剖析器(如Matplotlib)
第三步,建立和练习大言语模型,新增数据结构常识练习
- 用事务数据结构的常识,微调练习大言语模型,具备事务数据操作SQL生成才能
第四步,将客户的问题输入给大言语模型,返回数据查询剖析成果
- 在Chat的模式下,弥补数据图表才能,给出下一步操作引导提示
图2. DB-Agent