我们知道,人类有大脑,能够存储记忆,能够进行决策分析,比如我想要去体育西路的书店看书,那么我会思考该做什么交通工具去呢?是公交还是地铁呢?然后根据以往的经验判断,地铁是最方便的,所以决定做地铁去体育西路看书。这其中,根据以往的经验判断,这个是记忆,根据以往的经验和想法推断出做地铁去最方便,这个就是计划和决策。相当于现在的大模型语言(LLM)。
接下来作为人类我就直接穿好鞋子,带上手机就去坐地铁了。但是LLM因为没有办法做这些,所以还不能称之为Agent,我们就想办法让LLM做这些,为此我们给LLM提供了一些工具,比如给它联网能力,让它可以去互联网搜索。这样LLM+工具+自行去互联网搜索这种行为,就有点类似模仿人类进行事务的处理了,也就是AI智能体。
用高端一点的语言总结:AI Agent智能体就是给大模型工具可以让她模拟人类思考和行为来自动执行任务的程序或者系统。
网上找了一张图,觉得画的很不错,其中我们的大模型只有记忆和规划决策的功能。加上工具和行动就是Agent了,比如豆包,deepseek这种能够联网后也算是AI Agent了。