[toc] ## MCP是什么 > MCP is an open protocol that standardizes how applications provide context to LLMs. Think of MCP like a USB-C port for AI applications. Just as USB-C provides a standardized way to connect your devices to various peripherals and accessories, MCP provides a standardized way to connect AI models to different data sources and tools. > from offical site
MCP 是一种开放协议,由Anthropic在24年11月提出. 它标准化了应用程序向大型语言模型提供上下文的方式。将 MCP 想象成 AI 应用程序的 USB-C 端口。就像 USB-C 为您的设备提供了一种标准化的方式来连接各种外围设备和配件一样,MCP 为 AI 模型提供了一种标准化的方式来连接不同的数据源和工具。
MCP实际上就是为LLM的function call 套用了一层接口(协议), 使得用户可以在与模型的交互中按照这套协议调用自己的本地工具(服务).这里要强调本地, 是因为实际上MCP机制全部都是在本地发生的.这样的设计可以有效地保护用户的隐私, 用户在调用function时, 不需要把apikey提供给LLM供应商.
crontab
是Linux和Unix-like系统中用于设置周期性被执行的任务的工具。cron
是一个守护进程,可以定期检查 crontab
文件,并执行其中定义的命令。crontab
文件包含了指令,这些指令告诉 cron
何时运行哪些命令。
crontab
的基本组成如下:
crontab
任务看起来像这样:1 | */5 * * * * /bin/echo 'Hello, World!' >> /tmp/cron_output.txt |
AI Agent是一种基于大模型的人工智能代理,能够感知环境、进行决策和执行动作。它的核心功能包括感知、规划和行动,旨在通过大模型技术让人们能够以自然语言交互方式高效地执行和处理复杂的工作任务,极大地释放人员的精力。AI Agent的技术原理主要基于机器学习和优化算法,通过机器学习从数据中学习模式,并通过优化算法找到最优的决策。
AI Agent不同于传统的人工智能系统,它能够通过独立思考和调用工具逐步完成给定目标,而不是仅仅根据指令执行任务。这种能力使得AI Agent在处理特定任务时更加灵活和高效。此外,AI Agent也被认为是一种学习型智能体,具有从过去的经验中学习的能力,并根据学习能力采取行动或做出决定。
随着大语言模型(LLM)的快速发展,AI Agent在感知、具身和社会属性方面的发展也越来越受到关注。这些能力的提升使得AI Agent能够更好地理解现实世界,处理复杂问题。AI Agent的发展不仅改变了人类与AI的交互模式,还为企业提供了高效应用LLM的未来趋势。
今天在本地macbook部署服务时遇到一个问题。运行时会报错:org.springframework.beans.factory.BeanCreationException
原因主要是找不到arm64版本xgbboost4j
1 Constructor threw exception; nested exception is java.lang.UnsatisfiedLinkError: /private/var/folders/gf/scjmv0ws6nb6nt6g56nl46bm0000gn/T/libxgboost4j1824573393192019315.dylib: dlopen(/private/var/folders/gf/scjmv0ws6nb6nt6g56nl46bm0000gn/T/libxgboost4j1824573393192019315.dylib, 0x0001): tried: '/private/var/folders/gf/scjmv0ws6nb6nt6g56nl46bm0000gn/T/libxgboost4j1824573393192019315.dylib' (mach-o file, but is an incompatible architecture (have 'x86_64', need 'arm64')), '/System/Volumes/Preboot/Cryptexes/OS/private/var/folders/gf/scjmv0ws6nb6nt6g56nl46bm0000gn/T/libxgboost4j1824573393192019315.dylib' (no such file), '/private/var/folders/gf/scjmv0ws6nb6nt6g56nl46bm0000gn/T/libxgboost4j1824573393192019315.dylib' (mach-o file, but is an incompatible architecture (have 'x86_64', need 'arm64'))在搜索xgboost项目的issues发现,目前版本的xgboost4j还没有对m2的稳定版本。
这里分享一个可以使用的方法,主要参考这个issue就是本地重新编译一个xgboost4j,然后安装到本地maven库中使用。具体方法如下
本文翻译自:How Transformers Work - The Neural Network used by Open AI and DeepMind
作者:Giuliano Giacaglia,本文主要介绍了Transformer的原理和设计过程。
本文的精华在于阐述了Transformer为什么这样设计,通过RNN,attention,CNN一步一步推出了Transformer的设计原理。使得我们对Transformer的架构有了更深入的认识。
这也是我翻译的第一篇外文,有不妥的地方还望指正。量子位也翻译过这篇文章,可以参考:https://zhuanlan.zhihu.com/p/59422975
[toc]
最近一直在学习LLM,其中ChatGLM-6B又尤其火爆。所以分享一些相关信息。这次文章比较水,大部分内容都来自官方。
搜索是如今移动互联网必不可少的工具之一。无论是电商,短视频,直播,社交app,游戏……都需要搜索功能,帮助用户快速高效地获取到想要了解的资源信息。 本节从用户视角看下搜索的整个过程。从中看到一个搜索引擎一般会包含哪些功能,来形成一个完整的产品。
在机器学习中经常会遇到很多函数的概念。这些函数概念非常重要!但在一开始的时候,经常容易混淆这些这些函数概念,这里集中进行了一下概述,方便区分和加强印象。
一般情况下,我们使用c++处理字符串都使用的是string来处理。但在处理中文时,string的一些方法不能达到我们想要的效果,比如:size()函数返回的是中文字符串所占的字节数。
1
2string s = "今天天气123";
cout << s.size() << endl;1
15
这里我们使用宽字符就可以达到目的: 1
2wstring s = L"今天天气123";
cout << s.size() << endl;1
7