即刻App
年轻人的同好社区
下载
App内打开
加把劲刀塔客
556
关注
58
被关注
0
夸夸
INFP-T /加把劲骑士
拖延症患者
并不有趣
加把劲刀塔客
5天前
亿周: 睡就是睡 不睡就是不睡 睡觉是什么意思
0
0
0
加把劲刀塔客
10天前
我跟你们这些足控拼了!
小果子来一套: 我经常喜欢光脚踩在地上 朋友一句话改变了我这个不好的习惯: 美食怎么可以放在地上
0
0
0
加把劲刀塔客
10天前
很有故事性了哈哈哈
沙雕搞笑萌宠:
0
0
0
加把劲刀塔客
10天前
真·法克杯
Nocabuda:
0
0
0
加把劲刀塔客
10天前
点外卖和骑手的爱恨纠葛 //
@趴趴星人
:
盛牧磊:
0
0
0
加把劲刀塔客
24天前
#相亲那些事儿
昨晚和一个妹子见面,算是同行。
只不过,她对我的工作,比对我感兴趣,问了很多工作平台的事情。
我们加了微信,然后呢,今晚我发现她把我删了。
原来,她的合眼缘是想找个事业伙伴的意思,看不上我又想套信息。
不过也好,干净利落,大家都省事。
4
0
0
加把劲刀塔客
26天前
谢谢,先mark了
知骤: 安利李宏毅老师的Agent课程:https://www.youtube.com/watch?v=M2Yg1kwPpts 可以作为快速入门Agent的课程来看,课程内容不算硬核,非技术同学也可放心食用。 如果觉得时间不够,也可以快速浏览下我做的笔记: Agent:人类只给目标,ai自己想办法达成 - Goal:reward,人为给定 - Observation:当前状态 - Action:根据当前状态采取行动,改变环境从而产生新的Observation 类比RL框架:learn to maximize reward,需要对每一个任务训练一个模型 LLM-based agent - Goal:prompt - observation:环境转化成语言(或图片),拼接到prompt中 - action:一段文字描述,并转成指令 优势: - llm-based输出action更加灵活,可以使用各种工具 - typical agent需要定义reward,有大量magic number;llm-based agent不需要reward ai agent发展历程: - 浏览器图像输入,CNN处理,输出按钮点击 - World of Bits: An Open-Domain Platform for Web-Based Agents (ICML, 2017) https://proceedings.mlr.press/v70/shi17a/shi17a.pdf - 古早语言模型 - Mind2Web:https://arxiv.org/abs/2306.06070 - WebArena:https://arxiv.org/abs/2307.13854 - 用AI训练模型 - AIDE: The Machine Learning Engineer Agent https://arxiv.org/abs/2502.13138 - AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions https://arxiv.org/abs/2410.20424 - AI co-scientist - https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/ - llm agent - 2023年:autogpt - 2023年:斯坦福小镇(群体智能)、Minecraft的ai npc - openai operator/claude compute use:让ai使用电脑,举例: - goal:订披萨 - observation:浏览器状态 - action:点什么键等 交互方式: - 回合制 - 即时:模型执行过程中,外界环境改变,这时模型需要能够快速反馈更改执行策略。比如语音对话场景。 - 实时语音模型survey:https://arxiv.org/abs/2503.04721v1 llm agent(没有任何模型被训练)关键能力: 1、memory read模块做与当前情景相似search,search出相关的memory(见P1) 与RAG一样,唯一区别是RAG存在memory中的内容是别人的经历/全网信息 - benchmark:StreamBench,https://arxiv.org/abs/2406.08747 - knowhow:正面例子比负面例子有用得多 完整架构: read write:只记录重要的事情(可以也是一个ai agent) reflection:对过去记忆整理(可以也是一个ai agent),也可以建立一个知识图谱 - GraphRAG:https://arxiv.org/abs/2404.16130 - HippoRAG:https://arxiv.org/abs/2405.14831 (见P2) 更多论文: - MemGPT:https://arxiv.org/abs/2310.08560 - Agent Workflow Memory:https://arxiv.org/abs/2409.07429 - A-MEM: Agentic Memory for LLM Agents:https://arxiv.org/abs/2502.12110 2、tool 常见工具: - 搜索引擎 - python代码 - 其他软件服务 - 其他ai模型 怎么使用工具? - function call 调用现成函数:见P3 - MCP 调用其他ai模型: 详见P4 询问llm这段音频说了啥。system prompt中需要包括左边这一系列可调用语音模型的介绍。 llm会生成调用各个语音模型的python代码,执行即可得到最终答案 工具很多怎么办? 和memory一样做search,工具选择模块! 见P5 - https://arxiv.org/abs/2310.03128 - https://arxiv.org/abs/2502.11271 AI自己打造工具:见P9 - TroVE: https://arxiv.org/pdf/2401.12869 - LATM: https://arxiv.org/abs/2305.17126 - CREATOR: https://arxiv.org/abs/2305.14318 - CRAFT: https://arxiv.org/abs/2 工具是否会犯错? - 工具知识与模型本身知识差别越大,模型就越不容易相信 - 模型对自身知识的信心越高,就越不容易被动摇 https://arxiv.org/abs/2404.10198v1 - 模型更容易相信ai生成内容(较于人为内容)https://arxiv.org/abs/2401.11911 - 模型更容易相信更新发布的内容 https://aclanthology.org/2024.bl - 文章来源不会影响 - 文章排版方式会有影响 3、planning 根据observation做规划 https://arxiv.org/abs/2305.04091 根据observation实时更改规划 见P6、P7 llm做规划能力: - https://arxiv.org/abs/2201.07207 - benchmark:PlanBench https://arxiv.org/abs/2206.10498 https://arxiv.org/abs/2305.15771 - benchmark:TravelPlanner https://arxiv.org/abs/2402.01622 - 让llm能使用现成的solver工具,正确率大大提升 https://arxiv.org/abs/2404.11891 强化ai agent的规划能力 - 与实际环境互动,bfs/dfs暴力搜索。见P8 - 暴搜+做剪枝 https://arxiv.org/abs/2407.01476 - 有些动作覆水难收:虚拟环境内演练,需要有world model来模拟真实环境可能的反馈 https://arxiv.org/abs/2411.06559 - 过度深度思考的危害:https://arxiv.org/abs/2502.08235
0
0
0
加把劲刀塔客
1月前
#相亲那些事儿
其实,大家都30+了,相亲都主动点。
行就行,不行就不行,装个毛啊。
男生没找你,就觉得不主动。
男生找你聊,你又觉得人家像打卡。
每次都是我找话题,你也没主动找过我聊。
约会的时间不合适,你也不会主动改约时间。摆明看不上我,拜拜👋🏻了您嘞
24
8
0
加把劲刀塔客
1月前
吃Bagel的莫扎特:
0
0
0
加把劲刀塔客
1月前
今年五一,我的一位校友结婚了。
我大学的时候喜欢过她,告白也被她拒绝过。
毕业后,我们分隔两地,渐渐少了联系。
有时候,我会想到她,不知道她结婚了没有?
只是没想到她这么晚才结婚——虽然我现在也没结婚,还在相亲中。
只是有些年少的情愫在作怪,感慨时光易逝,她已经找到了幸福,而我却还在原地踏步。
3
1
0