Agent
最近几天在外面旅行
中间时不时还干些活儿
昨天周五
晚上的时候突然想到agent
工作里面很多事情都想让agent帮忙解决
这个想法很早就有
但是一忙就忘了
转眼又是半年过去了
昨天晚上弄完devotion,读一些经文和群里的读书笔记
收拾好躺在地铺上
又开始查询agent相关信息
开始是用Google ai mode,直接出错了
转到Gemini pro
让他弄pseudo code
了解了大概
但是具体什么原理还是没搞明白
今天早上醒来继续查
发现Gemini 或者x这种tools其实都不好
最后还是search
查open source agents 开始
然后挑一个n8n
然后看文档
然后再顺藤摸瓜
里面一个关键是agent with tools
查Claude api tool use
查到API usage sample,curl
这下非常清楚了
原来这些API都提供一个tools的flag,作为tools的metadata的输入
这样api输出也会有一个tool call的information,包含函数名和函数参数
但是这个function 怎么执行的呢?
再follow 链接到一个sample colab
https://github.com/anthropics/anthropic-cookbook/blob/main/tool_use/calculator_tool.ipynb
所以执行是client可以在API返回后自己parse自己执行的
在这个基础之上就可以有各种agent framework了