从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

结合RAG技术和智能体,系统能够实时从供应商数据库、仓库库存记录和销售数据中检索关键信息,智能调整库存水平,减少库存积压和缺货风险。

结合RAG技术和智能体,系统能够实时从供应商数据库、仓库库存记录和销售数据中检索关键信息,智能调整库存水平,减少库存积压和缺货风险。

引言

随着人工智能技术的飞速发展,大型语言模型(LLM)、检索增强生成(RAG)和智能体(Agent)已经成为推动该领域进步的关键技术,这些技术不仅改变了我们与机器的交互方式,而且为各种应用和服务的开发提供了前所未有的可能性。正确理解这三者的概念及其之间的关系是做好面向AI编程开发的基础:

大模型(LLM)

检索增强生成(RAG)

智能体(Agent)

定义

大型语言模型(LLM),如GPT系列、BERT等,是利用大量文本数据训练的模型,能够生成连贯的文本、理解语言、回答问题等。

检索增强生成技术结合了传统的信息检索技术和最新的生成式模型。它先从一个大型的知识库中检索出与查询最相关的信息,然后基于这些信息生成回答。

智能体是指具有一定智能的程序或设备,能够感知环境并根据感知结果做出响应或决策的实体。它们可以是简单的软件程序或复杂的机器人。

作用

LLM作为基础技术,提供了强大的语言理解和生成能力,是构建复杂人工智能系统的基石。

RAG可以视为在LLM基础上的扩展或应用,利用LLM的生成能力和外部知识库的丰富信息来提供更准确、信息丰富的输出。

智能体可以利用LLM进行自然语言处理,通过RAG技术获得和利用知识,以在更广泛的环境中做出决策和执行任务。它们通常位于应用层级,是对LLM和RAG技术在特定环境下的集成和应用。

从层级关系上看,大模型(LLM)提供了基础的语言理解和生成能力。在此基础上,检索增强生成(RAG)技术利用这种能力结合特定的知识库来生成更为准确和相关的输出。智能体(Agent)则在更高层次上使用LLM和RAG,结合自身的感知和决策能力,在各种环境中执行具体的任务。

因此,可以理解为LLM是基础,RAG是在LLM基础上的进一步应用,而智能体则是综合运用LLM和RAG以及其他技术,在更复杂环境中进行交互和任务执行的实体。这种关系体现了从基础技术到应用技术再到实际应用的逐级深入。

随着技术的快速进步,如何更高效地利用这些大模型(LLM)来解决具体问题?如何通过检索增强生成(RAG)技术提高信息的准确性和相关性?以及如何设计能够有效集成LLM、RAG和其他AI技术的智能体?这些问题的解决,不仅需要深入理解这些技术的工作原理和应用场景,还需要探索它们之间的相互作用和集成方法。

大模型(LLM)的概念与工程化实践

大型语言模型(LLM),如OpenAI的GPT系列,是一种基于深度学习的自然语言处理技术。它们能够理解、生成、翻译文本,完成问答任务,甚至编写代码。这些模型通过在大规模文本数据上的预训练,学会了语言的复杂结构和丰富的知识,使其能够在没有明确指示的情况下执行各种语言任务。GPT系列模型基于变换器(Transformer)架构,这是一种高效的深度学习模型结构,特别适合处理序列数据,如文本。变换器利用自注意力(self-attention)机制,能够捕捉文本中长距离的依赖关系,这对于理解和生成自然语言(NLG)至关重要。

目前,OpenAI最新版本的LLM工程化应用是以GPT-4为基础的,针对普通用户有3个版本,分别是免费版本(只能使用GPT-3.5)、Plus版本以及团队版本(Plus的功能加上团队协同工作管理)。每个月支付20美元(不含税)即可使用Plug版本,即ChatGPTPlus,它的主要功能有:

Chat(对话)

与“OpenAI最强大的模型GPT-4”进行对话,不止是文本的交互生成,还可以同时进行基于DALL-E的图文交互生成,以及从互联网实时获取最新知识进行辅助分析和生成。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

GPTs(插件)

如果你想将自己独有的指令、知识库或任何能力的API服务,同预训练的GPT-4 LLM结合在一起,创建一个“自定义模型”,那么,可以使用“GPTs”插件功能在Open AI的Web应用上快速构建出来。GPTs的推出体现了OpenAI与众不同的工程化创新能力,其交互设计理念值得我们借鉴。使用它的步骤可以参考如下这个例子:

1. 告诉 GPT Builder向导(实际上这也是一个官方的GPTs)你要做什么,它会提示你可以这样说:"制作一个帮助生成新产品视觉效果的创意人 "或 "制作一个帮助我格式化代码的软件工程师"。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

2. 输入“创建一个物流系统的技术支持工程师,帮助商家解答系统问题和处理异常订单”,接下来GPT Builder会和你做一些j简单的对话,比如征求你对于命名、Logo的建议等等,如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

3. 仅需要2轮简短对话,一个名为“小狗物流平台技术支持”的GPTs被初步创建出来了。生成的“Instrucitons”部分可以视为GTP的System Prompt(系统提示),需要特别注意按照这4个维度修正Instrucitons,直到其准确符合你的意图:1)定位,希望GPTs执行什么类型的任务;2)上下文,给GPTs提供一些额外的信息,比如垂直领域的常识,从而引导其给出更好的回答;3)输入数据,“限定”GPTs引导用户提出的问题,确保不偏离主题;4)输出数据,“限定”GPTs给出指定格式和范围的输出,确保不输出无关的内容。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

4. 重点来了,在这里可以使用“Upload files”功能上传你自己的“知识库”文件给到大模型推理,文件可以是文档、表格、图片等多种格式,这可以理解是一种对LLM的“静态”增强。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

5. 更重要的是,可以通过添加“Actions”的方式,接入你的API服务给到大模型调用,API通过遵循OpenAPI3的规范进行自描述。大模型可以根据API的功能描述以及输入输出定义,结合用户会话上下文进行智能的调用,获取你的私域数据进行推理,这可以理解是一种对LLM的“动态”增强。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

6. 最后,你可以把你精心“调教”出来的“自定义模型”分享给任何人或者发布到OpenAI的GPTs商店,如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

GPTs商店自2024 年初上线以来3个月时间,已经有超过 300 万个自定义的 ChatGPT发布。商店的功能包括2个排行榜,分别是“顶级推荐”和“流行趋势”;具体的分类有 DALL-E图像创作、写作、效率、研究和分析、编程、教育以及生活方式共7项,并且将由ChatGPT官方创作的自定义模型进行单独分类展示。例如在研究和分析(Research & Analysis) 类排名第二的“Scholar GPT”能够利用Google Scholar、PubMed、JSTOR、Arxiv等学术库的2亿+资源和内置的批判性阅读技能,助力你提高研究水平,可谓是撰写论文的神器;在效率(Productivity)类排名第一Canva能够轻松帮助你设计演示文稿、徽标、图文混排等多种内容,并且支持你直接在其提供的Web应用上对AI生成的源文件进行编辑调整,直到达成满意的效果。目前,已经有创作者通过GPTs商店独特的AI生态,实现了自己的商业模式,值得我们学习借鉴。

API(开放接口)

如果你不想依赖于OpenAI的生态平台实现自己的AI应用和商业模式,但又想借助其提供的ChatGPT等基础能力,那么,通过调用其对外开放的API接口一直是最好的选择。因此,OpenAI在推出GPTs的同时,也快速的上线了“Assistant API” 的Beta版本,在这个版本中,你可以实现GPTs中提到的所有“增强”大模型的能力,并通过API的方式将其对外发布,供第三方应用调用,并且支持GPT-4模型(当然调用价格也是不菲),如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

同时,你仍然可以通过传统的“fine-tuning model”API定制自己的微调大模型,这种方式主要是通过你上传格式化的“问-答”型的训练数据文件来实现对LLM的“增强”。相对于最新推出的“Assistant API” ,感觉这种方式在工程化的显得不够灵活和直接,不是很“智能”,目前“fine-tuning model”最高也只能支持GPT-3.5系列模型。如下图:

从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

检索增强生成(RAG)技术概述和应用

通过上一章的介绍,你可以发现OpenAI已经大规模使用工程化的技术使用户能够基于自己的知识库对其GTP系列大模型进行“增强”,从而实现更加垂直化、个性化的能力。那么,如果你基于成本或安全的考虑,想在私域进行自有知识库的“增强”,甚至切换成其它的大模型来使用这个“增强”,就不得不考虑自行开发实现了,这时候就需要了解检索增强生成(RAG)概念和向量数据库技术的应用。

什么是检索增强生成

检索增强生成(RAG)技术人工智能的应用方法,它通过结合传统的信息检索技术与最新的生成式深度学习模型,来提升信息的准确性和相关性。RAG理论来自于2020年Facebook的论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks(知识密集型自然语言处理任务的检索增强生成,

©本文为清一色官方代发,观点仅代表作者本人,与清一色无关。清一色对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。本文不作为投资理财建议,请读者仅作参考,并请自行承担全部责任。文中部分文字/图片/视频/音频等来源于网络,如侵犯到著作权人的权利,请与我们联系(微信/QQ:1074760229)。转载请注明出处:清一色财经

(0)
打赏 微信扫码打赏 微信扫码打赏 支付宝扫码打赏 支付宝扫码打赏
清一色的头像清一色管理团队
上一篇 2024年5月28日 16:04
下一篇 2024年5月28日 16:05

相关推荐

发表评论

登录后才能评论

联系我们

在线咨询:1643011589-QQbutton

手机:13798586780

QQ/微信:1074760229

QQ群:551893940

工作时间:工作日9:00-18:00,节假日休息

关注微信