即刻App年轻人的同好社区
下载
App内打开
orange.ai
389关注13k被关注8夸夸
CEO @火星电波
AI 降临派
AI First
凡事先用AI做一遍
置顶
orange.ai
29天前
今天早晨6点醒来,我的大脑模型推理出一段token:
能不能用我们的产品给它自己做一个预告视频?
躺在床上,想象画面,很快就把脚本想好了。
立刻起床,试了一下,居然真的可以做出来。
这个视频,是我们在 AI 应用的发展进程中,
留下的一个小小的印记。
2025年5月19日。
ListenHub 不见不散。
00:57
1520
orange.ai
13:11
今天很有趣,两家知名的公司各出了一篇文章,争论要不要使用多智能体系统。

Claude 的官方 Anthropic :如何构建多智能体系统
Devin 的官方 Cognition :不要构建多智能体系统

这核心的争议点在于:Context 上下文到底应该共享还是分开?

Claude 这边的观点是,搜索信息的本质是压缩,单个智能体的上下文有限,面对无限的信息,压缩比太大就会失真。
这就好比一个老板能力再强,也不可能搞定所有的事情,还是需要雇人去解决。
通过多智能体系统,老板让不同的智能体分别研究、汇报重点,老板最后整合到一起。由于每个智能体有自己的专长,具有多样性,减少了单一路径依赖现象,实际效果上,多智能体也超过但智能体 90%。

这是集体智慧,一起协作获得的胜利。

Devin 这边的观点是,多个智能体的上下文不一致,会导致信息割裂、误解、他们汇报给老板的信息经常充满了矛盾。
而且很多时候,智能体的每一步行动都是依赖前一个步骤产生的结果,而多智能体通常分别跟老板沟通,互相之间缺乏沟通,这样很容易导致互相矛盾的结果。
这体现出了个体智慧的完整性和高效性。

两边观点看下来,是否使用多智能体架构,特别像是人类运行一家公司的选择。

一人公司还是多人公司?

一人公司,一个人的脑力、体力、时间都是非常有限的。
优点是一人公司的沟通成本为0 ,可以把所有的时间都高效使用。

而多人公司,人越多,沟通成本就越高,管理难度就越大,总体效率下降。
但因为人数多,脑力多,体力多,整体的价值产出也就有可能更多。
多智能体的设计很有难度,这其实很正常,就像运行一家公司一样,很难。
难就难在建立有效协作的系统。
而且 1个人,3个人,10个人,100人,1000人,所需要的协作系统又不大相同。

参考人类历史,依靠集体智慧,人类在近代获得了文明的指数级发展。
多智能体的集体智慧,也许就是在 Scaling Law 逐渐放缓后,AI 获得指数级发展的那个萌芽。

而关于上下文,人类的协作至今也无法做到完美的上下文管理。

这让我想到,软件工程从来不是追求完美,而是持续迭代。
11
orange.ai
1天前
模型即产品
产品即产品
增长即产品
20
orange.ai
2天前
用户使用 ListenHub 最新的 Deep Dive 功能制作的 10 分钟的播客,听感非常棒
《情绪与创伤是真是假:大脑的主动预测与重塑》

这是她人生的第一个播客,发到了小宇宙,在这里收听
www.xiaoyuzhoufm.com
01
orange.ai
2天前
ListenHub 1.3.0 更新,深度模式聊的更深

Web 端更新:
深度探索模式升级:输出播客时长可以超过10分钟,话题讲得更透彻,内容质量全面提升。

播客生成设置优化:播客输出语言支持单独设置,语言和音色选择合并进输入框,修改更方便。

iOS 同步支持「深度探索」模式和以上更新,版本审核中,敬请期待!
10
orange.ai
3天前
之前大家都特别关注的大模型高考测试放出来之后,收到了很多的质疑:

有人说o3降智了
有人说用的客户端都是联网的,用 api 才是真实水平
有人说没加入近期变强的的 Gemini

于是机器之心又搞了一次测试
- 用不降智的 o3 测试
- o3之外,用各家模型的 API 统一测试
- 加入人气很高的了 Gemini 2.5 Pro

结果…又是很意外

o3 虽然没降智,但前三都没进,只屈居第四,最贵不代表就最好啊。

新选手gemini直接拿了第一,豆包和DeepSeek并列第二,但就差了一分。

其中豆包不管用api还是直接产品测试,分数都很高,实际做题场景,应该是国内的最佳选择了。
31
orange.ai
4天前
Sam Altman:智能的奇点,温柔地到来,未来的十年,人类会怎样?

mp.weixin.qq.com
01
orange.ai
4天前
最近创业算是进入了心流状态了
10
orange.ai
5天前
这个大模型高考测试结果,还真是没想到

卡兹克团队跑了大模型的高考数学测试
结果豆包和星火第一。
qwen3 也不错
而垫底的小虎需要加加油了…
93
orange.ai
6天前
最近一个很有意思的观察,想跟大家也讨论一下
字节的朋友们在回顾字节生涯的时候都会不约而同地提到两点:
1.字节的张一鸣很厉害
2.字节的方法论很厉害
你有没有很好奇
这两个到底是哪个更厉害呢?
字节的方法论是对张一鸣的一种 scaling
那这种方法论能否脱离一鸣独立存在?
或者换句话说
字节的方法论是完整地 scaling 了一鸣
还是只是 scaling 了可被放大的部分?
它的进一步推导:
如果一家公司有字节方法论但没有张一鸣
那它是不是很厉害,是不是成功率很高?
112
orange.ai
6天前
注意力是影响力的前提,只有获得它,才能征服世界、统治世界、改变世界。

注意力是人类的第一权力。

飞机上看了一会儿李继刚推荐的弱传播。
从未有人把传播的理论讲得这生动活泼。
20