国内agents平台概览
agents 简介
AI Agent是一种基于大模型的人工智能代理,能够感知环境、进行决策和执行动作。它的核心功能包括感知、规划和行动,旨在通过大模型技术让人们能够以自然语言交互方式高效地执行和处理复杂的工作任务,极大地释放人员的精力。AI Agent的技术原理主要基于机器学习和优化算法,通过机器学习从数据中学习模式,并通过优化算法找到最优的决策。
AI Agent不同于传统的人工智能系统,它能够通过独立思考和调用工具逐步完成给定目标,而不是仅仅根据指令执行任务。这种能力使得AI Agent在处理特定任务时更加灵活和高效。此外,AI Agent也被认为是一种学习型智能体,具有从过去的经验中学习的能力,并根据学习能力采取行动或做出决定。
随着大语言模型(LLM)的快速发展,AI Agent在感知、具身和社会属性方面的发展也越来越受到关注。这些能力的提升使得AI Agent能够更好地理解现实世界,处理复杂问题。AI Agent的发展不仅改变了人类与AI的交互模式,还为企业提供了高效应用LLM的未来趋势。
agent模块
主要包含:规划模块,工具调用模块和记忆模块
国内agents平台
glms
官网地址:https://chatglm.cn
主要流程
1 | flowchart LR |
功能&特点
与gpts类似,可以0代码构建agent。支持自有知识库。
可用工具
search: 支持搜索与网页浏览。
cogview: zhipu自己的图片生成模型。
code: 可以生成python代码并执行。这里的code很强,可以解决很多数学问题和数据处理问题。
dify
dify: https://dify.ai > Dify 是一个 LLM 应用开发平台,已经有超过 10 万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎。使用 Dify,你可以基于任何模型自部署类似 Assistants API 和 GPTs 的能力。 > > 社区版完全开源。提供gpts, 知识库,工具插件
对比
功能 | Dify.AI | Assistants API | LangChain |
---|---|---|---|
编程方式 | 面向 API | 面向 API | 面向 Python 代码 |
生态策略 | 开源 | 封闭且商用 | 开源 |
RAG 引擎 | 支持 | 支持 | 不支持 |
Prompt IDE | 包含 | 包含 | 没有 |
支持的 LLMs | 丰富 | 仅 GPT | 丰富 |
本地部署 | 支持 | 不支持 | 不适用 |
特点
1. LLM支持:与 OpenAI 的 GPT 系列模型集成,或者与开源的 Llama2 系列模型集成。事实上,Dify支持主流的商业模型和开源模型(本地部署或基于 MaaS)。
2. Prompt IDE:和团队一起在 Dify 协作,通过可视化的 Prompt 和应用编排工具开发 AI 应用。 支持无缝切换多种大型语言模型。
3. RAG引擎:包括各种基于全文索引或向量数据库嵌入的 RAG 能力,允许直接上传 PDF、TXT 等各种文本格式。
4. AI Agent:基于 Function Calling 和 ReAct 的 Agent 推理框架,允许用户自定义工具,所见即所得。Dify 提供了十多种内置工具调用能力,如谷歌搜索、DELL·E、Stable Diffusion、WolframAlpha 等。
5. 持续运营:监控和分析应用日志和性能,使用生产数据持续改进 Prompt、数据集或模型。
gpts功能
gpts提供2种应用类型:智能助手(多轮聊天场景)和文本生成应用(单轮文本生成)
智能助手:智能助手支持多轮agent,最大迭代次数为5轮,使用的是ReAct方式。下面是默认的prompt
template > Respond to the human as helpfully and accurately as
possible. > > > > You have access to the
following tools: > > > > Use a json blob to
specify a tool by providing an key (tool name) and an
key (tool input). > Valid "" values:
"Final Answer" or > > Provide only ONE action per
\(JSON_BLOB, as shown: > >
1
2
3
4{
"{{TOOL_NAME_KEY}}": $TOOL_NAME,
"{{ACTION_INPUT_KEY}}": $ACTION_INPUT
}1
$JSON_BLOB
1
2
3
4{
"{{TOOL_NAME_KEY}}": "Final Answer",
"{{ACTION_INPUT_KEY}}": "Final response to human"
}
文本生成应用: 单轮的文本处理,目前不支持工具。但可以加知识库。
功能
部署
WebApp方式: 支持公开URL访问。支持定制化和html/js潜入
API方式: 支持API访问,支持密钥
知识库:
来源: 本地文件,Notion内容,来自Web站点(待实现)
本地数据库支持:向量检索,全文检索,混合检索。其中全文检索需求有Rerank模型授权。
工具:
谷歌搜索(需授权)
维基百科
DALL-E 绘画(需授权): 包含DALL-E 3, DALL-E 2
网页抓取
WolframAlpha(需授权)
图表生成 : 包含 线性图表,柱状图,饼图
时间 : 获取当前时间
雅虎财经 : 包含新闻,分析,股票信息
Stable Diffusion WebUI(需授权,本地部署)
Vectorizer.AI(需授权)
YouTube(需授权)
coze
coze(扣子): 头条出品, https://www.coze.cn/, https://www.coze.com/
Coze(扣子)是一个AI Bot开发平台,旨在为开发者提供一个强大且易于使用的平台,以便快速构建和部署智能聊天机器人。
插件系统:平台提供了丰富的内置插件,涵盖文本分析、图像识别等多种功能,开发者可以根据需求选择和组合这些插件。 免费OpenAI API(国际版):Coze提供免费的OpenAI API,使得开发者能够利用先进的AI技术而无需自行开发。
coze的设计 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29flowchart LR
Agent --> Skills
Skills --> Plugins
Plugins --> Search(Search)
Search --> Bing
Search --> Google
Plugins --> Browser
Plugins --> Time
Plugins --> Weather
Plugins --> News(News)
News --> Shares
News --> Finance
Plugins --> Chart
Plugins --> Image
Plugins --> Calculate(Calculate)
Calculate --> Code
Calculate --> WolfamAlpha
Skills --> Workflows
Workflows --> WebSearch
Workflows --> Video
Workflows --> Shopping
Workflows --> Science
Agent --> Memory
Memory --> Knowledge
Memory --> Variable
Memory --> Database
Agent --> Advanced
Advanced --> Voice
coze官方支持了非常丰富的插件。这给自己设计的agent提供了更强大的功能和更多的想象空间。
支持发布这豆包、飞书等头条系app中。
其他
百度千帆&文心一言
千帆官网:https://console.bce.baidu.com/qianfan/overview
文心一言:https://chat.baidu.com/app/create
infomonkeys(猴子无限): https://ai.infmonkeys.com/
变现
目前对于agents开发者而言,直接通过agents变现还是不多的。毕竟大家都在获取流量的初始阶段。有了流量自然有很多变现的手段。
下面是了解到的一个专门针对gpts的广告平台: https://adintelli.ai/zh
总结
这篇文章只是简略的介绍了笔者最近了解的几家agents平台。做了一番体验与比较后,对agents平台与功能做一个简单的介绍。如果读者感兴趣可以访问上面的官网, 这些都是对国内支持比较好的几家平台。有什么问题和想法,也欢迎评论与留言。