即刻App年轻人的同好社区
下载
App内打开
stevending1st
115关注137被关注0夸夸
别关注,我有病。
言论仅代表个人。
求求你,你吸烟,别影响我。
stevending1st
7天前
不错的大模型科普~

#134. 大模型

牛油果烤面包

00
stevending1st
10天前
两个青铜:

www.xiaoyuzhoufm.com

【万字深度解析:哲学视角下的deepseek-哔哩哔哩】 b23.tv

Roxane: 一些个人认为适合非技术背景同学入门RL的材料不完全整理: 1️⃣青铜级 (都是播客) 《一堂「强化学习」大师课》——42章经 《与马毅聊智能史:“DNA 是最早的大模型”,智能的本质是减熵》——晚点聊LateTalk 《我是这样用 RL + LLM 做 Agent 的|对谈 Pokee AI 创始人朱哲清 Bill》——42章经 《走向强化学习:Agent 还是应用公司的机会吗?对话 Pokee.ai 创始人》——硅基觉醒 《Agent 开发的上半场:环境、Tools 和 Context 如何决定 Agent》——42章经 《强化学习的前世今生》——科技慢半拍 (以下是一些发布时间较早,但是我认为仍有价值所以保留推荐的⬇️) 《AGI 范式大转移:和广密预言草莓、OpenAI o1 和 self-play RL》——张小珺Jùn|商业访谈录 《逐句讲解 DeepSeek-R1、Kimi K1.5、OpenAI o1 技术报告 ——“最优美的算法最干净”》——张小珺Jùn|商业访谈录 《对话 Google Deepmind 研究员:OpenAI o1 及LLM+RL 新范式》——OnBoard! 2️⃣白银 Andrej Karpathy《Deep Dive into LLMs like ChatGPT》(视频)(不是专门讲RL的,但是建议先看,系统了解) Sam Lehman《The World's RL Gym》 Sutton与Deepmind《Welcome to the Era of Experience》 《Richard Sutton on Pursuing AGI Through Reinforcement Learning》(视频) 3️⃣黄金 OpenAI o1 技术报告《Learning to reason with LLMs》 Deepseek官方论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 Sebastian Raschka《The State of Reinforcement Learning for LLM Reasoning》 4️⃣翡翠 《Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限》(一篇公众号的概述,建议阅读原文) 《OpenAI's o3: Over-optimization is back and weirder than ever》 5️⃣钻石 Sutton and Barto《Reinforcement Learning: An Introduction》 (坦白说还没学到这个层次,欢迎大佬们补充...) 其实还有很多优质的资料,但我还没读的就不冒昧推荐了,欢迎在评论区安利🥹 🎊扩展阅读 《A biref history of intelligence》

00
stevending1st
17天前
Remember, the machine is always right!
00
stevending1st
1月前
构建理想社区之社区的衰落

每次饭后散步,我总习惯边走边思考,关于社区的思考往往杂多而不成体系,但又没太多时间整理,现在终于决定抽些时间,把这些思考写下来,争取汇集成一个系列——《构建理想社区》,希望在各位运营或设计社区时有些微参考价值。之前的系列《开源在现有学科下的思考》虽然思考较多,但是涉及交叉学科,很多细节还需要查阅资料求证,所以进展较慢。我所写的这些内容,难免因个人的见识有所错误,也欢迎大家批评。

社区发起原因千千万,但无疑社区的结局就是灭亡。正如某些哲学中所坚持认为的那样“运动是绝对的,静止是相对的”,这句话放到社区不严谨的表述就是“社区的存在是暂时的,灭亡是永恒的”。总结和思考社区灭亡原因是延续社区生命的重要工作,避免社区重蹈其他社区灭亡的覆辙是社区成员应尽的义务。

如果把社区看成一个生命体,那么社区内的每一个成员都是生命体的一个组成单位——即细胞。一个复杂的生物,判断其死亡的标准一般有两个,一个是心肺死亡,一个是脑死亡。社区灭亡的判断往往要比生命体的判断要更为复杂。一个社区有一息尚存,在合适的机遇有可能会绝处逢生;一个社区生机勃勃,在某些细小的纷争下可能分崩离析。对于复杂系统,我们可以从“势”来进行分析,即分析社区的衰落,衰落是社区灭亡的必经过程,防止社区衰落可以防止社区灭亡。

我们所讨论的社区,可以根据社区对互联网的依赖关系和活动场所粗略分成三种形式——网络社区、现实社区和融合社区。

我们先对网络社区进行分析。

如果要对网络社区的衰落进行分析,需要对网络社区进行简单的分类。在这里根据网络社区的核心目的把网络社区大体分为三大类——产品型社区、非产品型社区和混合型社区。产品型社区是指社区的建立围绕单一或多个产品;非产品型社区是指围绕某一个或多个理想、信念、兴趣爱好等目标建立的社区;混合型社区是指既有产品又有目标的社区。特别注意的是,这种分类方式简单而粗暴,可能有情况不能囊括,需要再具体问题具体分析。

对于一个产品型社区,产品的存亡往往关系社区的存亡,产品兴盛则社区兴盛,产品衰落则社区衰落。要讨论一个产品的兴衰,不外乎内部、外部两种原因,外部因素包括但不限于国际环境、 经济环境、市场需求和政策法规等;内部因素包括但不限于技术革新、产品质量和营销策略等。一个产品的兴盛是内外部因素共同作用的结果,一个产品的衰败可能只需要一个细小因素,防止产品衰落的关键在于在当前外部环境下,充分发挥内部的能动性,构建优质的产品。

有一种特殊的社区,这种社区围绕一个或多个意见领袖建立,这种社区也属于产品型社区,意见领袖就是这个社区的产品,因此这种社区的衰败往往由意见领袖决定。影响兴衰的外部因素和前面几乎一致,内部因素主要是社区成员对意见领袖失去信任。

非产品型社区的兴衰除了和产品型社区类似的外部因素外,社区氛围、社区行为规范、社区章程、社区规则的执行、社区 Maintainer 等内部因素是社区兴衰的关键,这些关键因素影响了社区是否还对新成员具有较好的吸引力和对老成员具有留存能力。

因为混合型社区具有产品型社区和非产品型社区的特点,任何能够影响产品型社区和非产品型社区的因素都能对其造成影响。

以上是基于网络社区的讨论,现实社区也可以分为产品型社区、非产品型社区和混合型社区,网络社区对应的影响因素也同样适用。某些外部因素对整个社区的影响程度要远高于网络社区,如政策法规;现实社区的运行成本远高于网络社区,所以经济因素对社区的影响也远高于网络社区。考虑到现实社区的社区活动处于一个物理场所,所以环境的不可抗力对社区的影响是远高于网络社区的。

融合社区是指活动空间既涉及现实又涉及网络,目前极少的社区仅以单纯的线上或线下形式存在,一个网络社区可能会组织线下活动(如 Meettup);一个现实社区可能会建立线上群组进行沟通交流。一个融合社区的线上活动将受和网络社区相同因素的影响,线下活动将受和现实社区相同因素的影响。一个融合型社区通常是由网络社区或现实社区转型而来,在转型过程中遇到的运营问题也可能导致社区崩溃。

需要特别说明的是,社区可以为参与社区的个人尤其是发起者或 Maintainer 带来物质或非物质的收益,难免会出现同质化(或具有竞争关系的)社区,当市场(参与者)恒定情况下,极有可能导致其中若干社区的消亡或萎靡,这些竞争的分析不在本文的讨论之列,但同质社区的竞争在社区衰落分析时不可忽视。

一个社区的成功没有原因,一个社区的失败总能总结出七七八八。在坚持以“人”为核心的背景下,多沟通并通坚持长期主义的做法是处理社区内部问题的良好做法;努力调整社区,使之适应环境可以解决一部分外部矛盾;当社区和外部因素产生不忽视且不可调和的矛盾时,社区在当前时空背景下可能并不适合(有可能社区理念过于超前或滞后)。

从某个角度讲,参与社区本身是一个西西弗斯式的故事,但是参与的过程会使每一个参与者成长或有所收获。祝福所有的社区都能长青,也祝福所有的人都能找到自己心仪的社区贡献下去。

2025 3
于经峰室初稿
2025 4
于梅林
00
stevending1st
2月前
非常好的书法介绍播客

Vol. 73 我在硅谷教书法:线条艺术的千年嬗变和现代新生

剧谈社|翻译艺术品

00
stevending1st
2月前
stevending1st
2月前
零售业是劳动密集型工作🙃
00
stevending1st
3月前
#往期播客寻宝
这期虽然是谈 AI,却把常见诗词的玩法一一道尽

Vol. 70 赛博诗人比李白杜甫差在哪里?从AI写诗看文学的本质

剧谈社|翻译艺术品

00
stevending1st
3月前
kimi 的学习能力要优于其他大模型(用不了的 deepseek 不在讨论范围内),得出这样片面的结论的过程很简单:
我最近在写 cangjie,作为一个新语言,大多数模型不具备这个知识,需要根据搜索结果学习后回答。kimi 提供的答案虽然不能百分百正确,但是提供的思路确实能节省不少时间。
00