即刻App年轻人的同好社区
下载
App内打开
henu王凯
904关注8k被关注1夸夸
在做「松鼠快看」:实现PC端看公众号内容
https://songshukuaikan.com

微信:wangkaisv
置顶
henu王凯
2月前
诸君,当以站在AGI回看当下的视角理解AI对社会的深刻改变。
00
henu王凯
2天前
之前看待Cursor的逻辑还是太傻逼了,不应该看作编程,而是单纯的AI应用就行,去玩,不要学。
AI Coding让AGI提前365天。

微信文章

00
henu王凯
9天前
Sam年初blog所写“2025年能看到第一批AI Agents进入企业工作”,这里标准不是目前Manus等水平,而是更具有自主性、能独立完成工作的agent。
恰好昨天刷Claude技术也说年底能看到更具自主性的agent。
标记:2025年,AI Agents进入企业。

离AGI还有3504天:AI Agents在2025年会实际进入工作中,实质性改变公司产出

20
henu王凯
10天前
离AGI还有3503天:未来1-3年大规模阵痛无可避免。
不要负债!
不要预期未来三年的收入稳定。

微信文章

02
henu王凯
11天前
我把规划要做app的“AGI倒计时”产品用内容形式做一下,后面要记录下时间刻度:

现在距离AGI还有3906天,还处于AI发展早期,不要焦虑,还有很多机会。

微信文章

10
henu王凯
16天前
“代表先进的Agents宁可使用搜索等传统工具而不是使用垂直的AI应用”

这种现象就非常愚蠢。

令人费解的现象。
00
henu王凯
23天前
刚开《深度研究的逻辑、局限、使用方法》的分享会议,但我忘了录制视频,群友发了份文字总结,他的工作流非常好,我分享下:
1、开会时用通义听悟 录制、转文字(我一直很推荐通义听悟,阿里的,完全免费且好用,我很多本地的外文视频需要翻译都是上传到通义听悟进行免费翻译);

2、拿到会议文档发给了Manus进行去除口语、提炼总结的处理,Manus最终给到了文件等多种格式(可以具体要求)。

这个工作流还是非常不错的,结合Manus也很棒。
我再加一点:其实可以把录音文档给到GPT、Claude等进行处理,可以更细致的要求把录音文档做的更系统、完善些,比如修改语句顺序等。
微调的效果会更好些。

群友的习惯非常好,学到了,后面会议我也用起来。
01
henu王凯
23天前
我才意识到个问题:

Manus现在不需要邀请码了,应该涌现很多新的案例出来、上几次热搜才对吧。

但为什么开放后一次大热度没有?一个传播广的惊艳案例没有?

很奇怪。
81
henu王凯
24天前
大模型或者说整个AI应用层演进都有个明确的趋势:交互更加丰富,图1是我实际通过ChatGPT返回的YouTube视频,图2是Kimi做的股票行情图标。借着这点分享个我的分析框架。

“交互丰富”这个词有个思维陷阱:
1、我们很容易局限到AI返回内容上的丰富性,比如Claude返回面板、网页,GPT返回视频链接、可编辑的文档、生成图片/视频,Google AI产品返回播客、研究报告等等。
这是从内容形式上理解,返回的内容更加丰富、精确、可编辑等,每个要求背后都是一类潜在机会点;

2、除了内容形式外,AI还在提升能力(所覆盖场景)上的丰富性,比如Agent直接操控工具完成任务,AI口语教学等等。
能力上的丰富性驱动可应用场景的拓展;

3、我想说的思维陷阱是“我们在看Agent等产品时,得把Agent看作技术方案,而不是直接的AI能力。比如Agent背后用到了什么AI能力?推理能力、评估能力等”。
要推理到具体能力这个颗粒度,然后组装下能力推产品,比如我们用到了快速判断能力,ChatGPT短暂的Task用到了联网能力等。

4、能力再往前推就是模型性能,你所做的场景/需求的衡量指标是什么?对应了什么模型性能?
性能再往前推是看大模型等顶尖技术team的前进方向。

这是一种分析框架、推导未来发展的思维,所以我会非常关注技术前进点、关注顶尖技术正思考解决的问题,从这里是可以推导未来模型哪方面能力会提升,提升之后满足什么要求。
00
henu王凯
25天前
后天(5月15日,周四)晚八点,我们继续会议:分享深度研究的使用场景、逻辑及这种模式的局限;延伸讲结合其他AI应用更高效、深度使用深度研究产出的报告;

主题:
1、分享深度研究的使用场景、逻辑及这种模式的局限;
2、延伸讲结合其他AI应用更高效、深度使用深度研究产出的报告;

报名方式:《出海!一定要出海!》群内接龙

时间:周四晚八点

形式:腾讯会议(明天会发会议链接到评论区和出海群)
10
henu王凯
26天前
Claude API支持联网搜索,我们要接入,但在实际接入过程中有很多麻烦:
1、联网搜索增加了处理的时间,并且时间还不能稳定(可能是30s也可能是90s);
2、需要单独弄个流程指定必须使用联网搜索补充背景信息,把“搜寻背景信息”放到原有大的提示词流程中还无法稳定触发,多数情况下不会联网搜寻信息;
3、还有个最大的麻烦——不是每个都需要联网搜索,怎么更快的判断是否需要联网搜索?(因为联网搜索意味着增加了判断的时间成本)。。

大模型在很多细化点上没有明确的标准确实很麻烦,类似thinking模式也是如此,虽然能提升点判断准确率,但是处理时间又不明确,很麻烦。
01