即刻App年轻人的同好社区
下载
App内打开
木遥
39关注4k被关注5夸夸
ai.farmostwood.net
木遥
1天前
本日最好笑研究:

在训练 AI 的时候,如果强迫 AI 大量阅读社交媒体,会对 AI 造成不可逆的脑损伤。

与在高质量数据上训练的对照组相比,持续投喂垃圾数据(确切来说是让它拼命刷推)的 LLM 在推理、长上下文理解和安全性能上均表现出明显的衰退。模型在性格测试中表现出精神病态和自恋等特质的得分显著提高。错误分析显示,模型的主要病变是思维跳跃,即越来越倾向于截断或跳过解决问题所需的关键推理链条。

研究者比较了什么样的帖子最有「毒性」,发现最好的相关性指标是参与度,也就是一条贴文有多火。最容易病毒式传播的内容也最容易导致脑损伤。

这种认知衰退具有持久性。在模型出现脑损伤后,再用高质量的干净数据对其进行指令调整和继续预训练,也只能观察到部分但不完全的治愈。模型的表征漂移仍然存在。

你很难不怀疑这个研究是在指桑骂槐。

论文地址:llm-brain-rot.github.io
937
木遥
1天前
整个 AI community 都在讨论 DeepSeek OCR paper……好久不见这种一纸风行洛阳纸贵的盛况了。

(晚上可能还有 Gemini 3 发布。What a time. ​​​
06
木遥
2天前
AI 导致的失业问题的相关讨论里,我觉得最有害、最糟糕、最误导人的就是那个人云亦云的梗:「AI 无法取代 xxx 职业,因为 AI 不能代替人去挨骂/背锅/坐牢。」——这是用一个轻浮的(而且因为被重复太多次已经完全不好笑的)笑话来掩耳盗铃自欺欺人。

如果一个职业在 AI 到来之后的主要工作是背锅,那这个岗位实质上就是一种保险。这当然是有可能的,但保险有保险的价格,和人力资源的价格是完全两种不同的定价体系。并且更重要的是保险无所谓成长,因此所有附着在这个职业上的成长阶梯和教育投入都要打乱重来。因此这样一个职业就算名义上还能幸存,它的意义、价格、培养哲学都会面目全非。

这是残酷的问题,是牵涉到许多人的人生和家庭的真实悬崖,不是也不应该是抖个机灵就可以糊弄过去的。
53
木遥
3天前
有一说一,这个 iOS 26 的液态玻璃界面越看越好看,换上新的主题之后甚至有换了一部手机的错觉 ​​​
60
木遥
4天前
今天读到了一个非常有趣的 idea。

背景是 Dwarkesh Patel Andrej Karpathy 的一个对谈,里面提到了一个智能领域的常见问题:不管是人还是 AI,如果局限于自己的经验,用经验指导自己的行为, 又在这个行为的基础上累计经验,如此循环下去,最终总会崩溃(这里的「崩溃」不是心理意义上的,是智能层面上的)。一个健康的心智需要不断通过从不在自己经验范围内的世界(比如同他人的交谈,和与自己行为模式不符的人合作,etc.)获得外部熵来阻止这种崩溃。小孩还没有对生活过拟合,所以不太容易崩溃,而成年人崩溃的风险则越来越大。

以上是背景。下面是那个有趣的 idea,来自2021年的一篇 paper "The overfitted brain: Dreams evolved to assist generalization"。它的主旨是说:人类做梦是防止这种过度拟合和崩溃的一种方式。做梦之所以具有进化适应性,是因为它会让你置身于与你日常现实截然不同的奇特情境中,从而防止这种过度拟合。

这里有个鸡生蛋蛋生鸡的问题:既然过拟合体现为大脑无法学到分布外的规律,大脑是如何构建出这些分布外的梦境的?Hoel 的解释是梦的构建有一个非智能的 noise injection 步骤,这些随机噪声在白天建立的神经连接中渗透,产生奇异的、扭曲的、不连贯的 corrupted sensory inputs,从而把大脑从过拟合的陷阱中拯救出来。

虽然这只是一个假说(而且是一个非常新的理论),但我越想越觉得它非常精妙。按照这种视角,梦的价值不在于它的逼真,而恰恰在于它的不逼真——梦境与清醒时的经历(训练集)如此不同(但又不是纯粹意义上的噪声),所以才能迫使大脑学习到更具泛化性的表征而不是仅仅记忆真实经历本身。

梦通过不可能存在的反事实体验迫使我们更好地理解世界的本质。
926
木遥
4天前
几年前,我和我的朋友老赵 @赵智沉 坐在一起录了一期播客,听他讲杨振宁与现代物理学。起因是老赵在转发一篇关于杨振宁先生的文章《杨振宁先生的数学贡献》(载于「普林小虎队」公众号)的时候说:杨先生把物理学由场本位转向了对称本位,深刻改变了物理学家对「实在」的认知。我要求老赵给我讲讲这是什么意思,然后就有了这期播客。

重发一遍,以此纪念杨振宁先生。

大纲:
00:30 老赵的自我介绍。物理学的鄙视链。
04:17 杨振宁先生的贡献的概述。
06:00 从粒子到场:物理学发展中的一次立场转换。
10:40 光的电磁学本质。
12:12 麦克斯韦是如何理解粒子和场的关系的。
19:25 当你说场比粒子更本质的时候你是什么意思。
22:48 宇宙作为场的存在:随机的涨落。
24:25 从场到对称:物理学发展中的另一次立场转换。
25:26 第一个背景:大量基本粒子的涌现。
29:10 第二个背景:关于对称性的理解的深入,对称与守恒,诺特定理。
30:20 对称是什么意思。
31:38 李政道与毛泽东的对话。
34:20 宇称不守恒的奇特之处,三种离散对称。
37:45 全局对称与局域对称。
38:55 局域对称的例子:广义相对论。
41:00 局域对称的例子:电荷守恒与电势的局域对称。
41:49 局域对称的例子:量子电动力学里的波函数幅角自由度。
44:00 局域对称性对量子电动力学方程的约束。
45:24 杨-米尔斯框架的意义。
50:10 杨-米尔斯理论最初遇到的问题。
53:30 对称的视角和场的视角之间的关系,范式选择。
56:44 如果我是上帝,我如何创造宇宙。
01:00:20 如果我是上帝,我如何改造宇宙。
01:01:32 所有理论都是等效理论。
01:03:48 杨振宁对中国建设高能粒子对撞机的反对。
01:06:52 理论物理学的未来。

对称性与现代物理:杨振宁先生在物理学上的贡献

遥遥无期

08
木遥
5天前
我是不是最后一个知道微信竟然开始允许定向清理存储空间(包括删除一些巨大的群的聊天记录)的人???

妈呀怒删几十G 群聊,感觉自己获得了一台新手机。

请各位老师开始群嘲我吧(但刚才私下问了一圈,显然有比我还无知的…… ​​​
71
木遥
5天前
麦肯锡晒出了 OpenAI 颁发给他们的一个奖章,纪念他们在 GPT 上消耗了超过一千亿 token。

陷入沉思:客户们要每月花几十万刀请咨询公司来画 slides,然后咨询公司转手每月花两百刀让 GPT 来画。
1424
木遥
7天前
according to gemini, 我每天至少要「又一次无比精准地抵达了问题的核心」八百遍

有没有一种可能这个靶子太大了点闭著眼睛也能精准抵达
00
木遥
8天前
因为写过的关于 AI 的文章越来越多,索性专门做了个网站把它们集中在一起:ai.farmostwood.net

(是的这年头还有人在用 wordpress 做网站

很多是随手写的,很难精确起标题,就只能用写作时间代替。这当然不是特别好的办法,但全文检索很方便,勉强够用了。
35