【AI 大模型】大模型应用架构 ( 业务架构 - AI Embedded、AI Copilot、AI Agent | 技术架构 - 提示词、代理 + 函数调用、RAG、Fine-tuning )

2024-07-05 AIGC 0

文章目录

一、大模型技术方向 - 大模型训练 / 大模型应用
二、大模型应用 - 业务架构
- 1、AI Embedded 模式
- 2、AI Copilot 模式
- 3、AI Agent 模式
三、大模型应用 - 技术架构
- 1、提示词技术架构
- 2、Agent + Function Calling 技术架构
- 3、RAG 技术架构
- 4、Fine-tuning 微调技术架构

一、大模型技术方向 - 大模型训练 / 大模型应用

大模型技术分为两个方向 :

训练大模型 : 少数实力强的公司做这件事 , 如 OpenAI 训练 ChatGPT 大模型 , 百度训练文心一言大模型 , 这种技术岗位很少全世界也就几千个 , 技术难度很高 ;
大模型应用 : 使用别人训练好的大模型 , 建立自己的应用 ;
- 开发在各个平台上使用的 AI 应用 , 如 : 将 GPT 大模型集成到自己的应用中 ; 如 : Android 应用 , Python 应用中 ;
- 几乎所有的开发者都要学会大模型应用开发 , 其本质就是调用第三方库 ;
- 在上一篇博客【AI 大模型】OpenAI 接口调用 ① ( 安装 openai 软件包 | 查看 openai 软件包版本 | PyCharm 中开发 Python 程序调用 OpenAI 接口 ) 中 , 就是开发了一个应用 , 集成了 OpenAI 的软件包 , 可以调用 OpenAI 接口使用大模型的功能 ;

二、大模型应用 - 业务架构

1、AI Embedded 模式

应用程序是传统应用 , 大模型被嵌入到现有的应用程序或服务中 , 作为一个组成部分 , 仅在其中的某个环节 , 使用了 AI 大模型技术 ;

AI Embedded 模式下 , 大模型通常被用来提升现有应用的智能化程度 , 以改善用户体验或增加功能 ;

下图中 , 仅在蓝色部分 , 使用了 AI 功能 , 其它应用都是普通功能 ;
在这里插入图片描述

以 CSDN 博客网站为例 , 该网站是一个传统的 Web 网站应用 , 在顶部导航栏有一个 " C 知道 " 链接按钮 ,
在这里插入图片描述

点击 " C 知道 " 按钮 , 跳转到 GPT 大模型对话界面 , 这种应用就是在传统应用中 , 嵌入了 GPT 大模型应用 , 仅仅是在某个环节中使用了大模型 ;

在这里插入图片描述

2、AI Copilot 模式

在业务中相当于副驾驶 / 助理 ,

AI 大模型是用户的合作伙伴 , 协助用户完成某件任务 ,

具有高度的智能化水平 , 如 : 自主性和决策能力 ,

可以根据环境和任务情境主动作出决策和行动 ;

在这里插入图片描述

微软 Copilot 就是一个典型的 AI Copilot应用 , 其集成在 WIndows 11 系统中 , 作为侧边栏工具 ;

微软 Copilot 地址 : https://copilot.microsoft.com/

微软 Copilot 能够

理解用户的语言
执行用户的指令
预测用户的需求

从而在多个业务场景中为用户提供智能辅助 ;

在这里插入图片描述

3、AI Agent 模式

AI Agent 模式中 , AI 大模型被设计为一种独立的代理系统 , 能够代表用户执行任务或处理事务 , 具有高度自治能力 ;

AI Agent 模式中 , AI 的操作占比远高于用户操作 ;

在这里插入图片描述

AI Agent 模式目前没有案例应用 , 架构比较超前 ;

军事领域大有作为 , 可能已经研发成功并使用了 , 如 : 无人机集群自动扫描 , 自动发现 , 自动跟随 , 自动瞄准 , 自动投弹 ;

三、大模型应用 - 技术架构

1、提示词技术架构

传统的 ChatGPT 和文心一言的用法 ,

用户发一句 " 提示词 Prompt " , 大模型回一句 " 输出结果 " ;

在这里插入图片描述

这是在 AI 大模型的基础上 , 套了一层对话应用的壳 ;

其本质是调用 GPT 大模型的解码器 , 输入参数是 " 提示词 Prompt " , 得到的结果是解码器针对提示词以及综合训练的大模型向量数据根据概率生成的 " 输出结果 " ;

示例说明 : ChatGPT 一问一答 , 在 GPT 大模型上套了一层聊天的壳 ;

在这里插入图片描述

2、Agent + Function Calling 技术架构

Agent + Function Calling 技术架构的主体是一个应用程序 , 就不再是春对话方式了 , 应用程序还必须提供对应的函数 API , 以供 AI 大模型回调该 API 功能 ;

Agent 表示 AI 主动提出的要求 , Agent 代理程序具有一定的自主性和决策能力 ;

Function Calling 表示 AI 根据提出的要求 , 自动执行的函数 , 这个函数 API 功能 ,

可以是应用程序提供的 ;
也可以是 AI 大模型内置的 ;

该技术架构的工作流程如下 :

首先 , 用户的应用程序中输入 " 提示词 " ;
然后 , 进行函数调用 , AI 大模型分析提示词 , 发现需要调用 " 应用程序 " 的 API , 这是大模型 " 回调 " 应用 / 大模型的功能 ;
- 调用 API 功能完毕后 , 继续看是否满足 " 提示词 " 的要求 , 不满足的话继续进行函数调用 , 直到满足为止继续执行下一步 ;
最后 , 输出符合 " 提示词 " 要求的文本结果 ;

在这里插入图片描述

Agent + Function Calling 技术架构使用非常广泛 , 可以将自己开发的应用功能嵌入到 AI 大模型中 , 将复杂的逻辑分解成更小的 / 可管理的部分 , 每个部分通过调用不同的函数实现 ;

3、RAG 技术架构

" RAG = Embeddings + Vector Database " 技术架构 ;

RAG 全称 Retrieval-Augmented Generation , 检索增强生成 , 是结合 " Embeddings 嵌入 " 和 " Vector Database 向量数据库 " 的技术架构 , 该架构用于自然语言处理领域的信息检索和生成任务 ;

Embeddings 嵌入是把文字转为容易计算的编码向量 ;

Embeddings 嵌入的具体操作就是将词语或文本映射到高维向量空间的技术 , 高维向量空间被设计成能够捕捉词语或文本之间的语义关系 , 语言处理模型能够更好地理解和处理自然语言的含义 ;

向量数据库 Vector Database 是一种专门用于存储和检索向量数据的数据库系统 , 可以通过特定的数据结构和算法加速向量之间的比较和匹配过程 ;

具体的 RAG 技术架构的执行流程 :

首先 , 用户输入 " 提示词 " 后 ,
然后 , AI 大模型拿到 " 提示词 " 之后 , 先到 " 向量数据库 " 中 , 检索所有可能与该 " 提示词 " 相关的知识 ,
最后 , 将
- " 提示词 "
- 根据 " 提示词 " 从向量数据库中检索出来的知识
一起传递给 AI 大模型 , 相当于将 " 检索出来的知识 " 追加到了提示词中 , 后面的 AI 大模型执行就相当于 Agent + Function Calling 技术架构的执行过程 ;