即刻App年轻人的同好社区
下载
App内打开
momo_00001
104关注0被关注0夸夸
momo_00001
9月前

Kenny_肯尼: Cursor 最近发了一篇技术博客《Cursor Tab 的在线强化学习》。用过 Cursor 的同学应该很熟悉 Tab 功能,它会自动预测你的下一步操作,而不是等你手动输入。为了让 Tab 更准,Cursor 用了用户的在线数据做 RL,并且频繁给用户推新模型,实践结果是新 Tab 模型的采纳率提高了 28%。 这可能意味着大模型可以像推荐引擎一样,依赖用户反馈数据自我迭代,形成数据飞轮数据飞轮的壁垒,虽然实践起来没那么容易,但给了很好的方向。 原文地址 https://cursor.com/blog/tab-rl 双语版本 https://ybzavo65ti.feishu.cn/wiki/V6yYwGPIfiEEywkvxkicbKQEnlf 核心内容: 1. 在线数据驱动:Tab 每天处理超 4 亿次请求,并在 1.5-2 小时内回传数据做训练更新。核心是快速的数据流和模型部署能力,几乎是“准实时”的在线学习。 2. 采纳即奖励:用策略梯度优化 Tab,奖励用户接受的建议,惩罚拒绝的建议。如果建议被接受概率低于 25%,模型就不显示。 3. 真正的个性化:不是靠 context hack,而是直接基于参数更新,把用户的采纳/满意度转化为 reward signal。 4. 持续学习闭环:不像常规几周/月一次大版本迭代,而是频繁上线新模型+实时优化,形成真正的“持续进化”。 对在探索开放场景下如何做 RL的同学可能有些参考价值,尤其是如何把产品里的“用户满意度”变成 reward,再配合高频模型迭代。

00
momo_00001
9月前

苍何: 🚨谷歌发布了一本 68 页的提示词工程的书籍,而且是免费的! 你甚至不需要注册。 它包含真实的数据、实验和最佳实践。 以下是需要了解的最重要的要点: 1,prompt不是比谁更聪明,而是要有系统性。 谷歌提供的这本免费书籍对于任何从事LLM的人来说都是一座金矿。 这是链接:https://www.kaggle.com/whitepaper-prompt-engineering 2,提示词是一门科学,不是靠运气: • 谷歌的研究表明,结构化提示持续优于随意的表述。 • 你的措辞可以让输出质量提升几个数量级。 链式思维 > 一次性回答: • 把任务拆成步骤(显式把思路写出来)会让模型更准确。 • 不要只索要最终结果 → 要引导模型完成推理过程。 3,具体性胜过模糊性 • “请用 5 个要点为 CEO 总结这篇文章” 要比 “总结一下这篇文章” 更好。 清晰的角色、限制条件和上下文 = 更优质的输出。 迭代是关键 • 论文强调:不要停留在第一个提示词。 • 精炼 → 测试 → 再精炼。 提示词工程更接近 调试(debugging) 而不是写作。 4,提示词格式很重要 • 换行、列表和分隔符可以减少幻觉并提升清晰度。 • 把提示词当作给初级队友的指令,而不是随意的聊天文字。 5,评估往往被低估 • 谷歌建议构建一些简单的指标,用来比较提示词的质量。 • 否则,你永远无法知道 v2 是否真的优于 v1。

00
momo_00001
10月前

阑夕ོ: 就目前来说,我对各家AI公司的深度研究功能都还挺满意的,至少能够解决我在涉猎信息时效率不足的问题,同时满足兴趣延伸的需求。 举个真实的例子,昨天在Reddit问答版刷到一个贴子「有哪些东西在十年前快死绝了却又奇迹般的重新复苏了」,其中最高赞的一个回答是:美国的独立书店。 这很让我困惑,因为这个回答太反直觉了,在我的认知框架里,受到电商的冲击,实体书店必然是一年比一年不景气,亚马逊本身也是卖书起家的,出版业一直在喊受不了平台挤压,所以为什么那个答案得到了普遍的认同? 以前为了解决这种疑问,我都需要付出大量的搜索行为,在一个个的链接里提取信息,拼凑出一个可以自圆其说的解释,整个寻找过程因为必须人工排除无效内容——差不多会占到摄取总量的70%以上——所以效率很低。 用熟AI的深度研究功能之后,过程从「先海读再挑选」变成了「先收敛再发散」,最繁琐的搜集和裁剪工作都由AI去完成,在它给我一份报告之后,我在针对具体的素材去做查证和深究。 整体时间并没有减少——所以我一直强调的是提升效率,而不是节省时间——但在新的时间分配里,大头从排查内容变成了消费内容,质量得到飞跃,有种很明显的「把好钢花在刀刃上」的舒适感。 而且我一般会把需求同时发给多个支持深度研究的AI,比如「美国独立书店是怎么复兴的」这个疑惑,我就都发给了ChatGPT、豆包、Kimi、夸克,把浏览器切到后台等它们哼哧哼哧的去出报告,去打几把游戏或者看点儿别的,等到结果出来再来交叉对比。 这条确实不是广告,所以我不想对比它们之间产出结果的优劣,把模型名字去掉放在图里你们自己评价吧,正好来盲测一下。 当然,关于促成美国独立书店回暖的原因,我也想多说几句,在电商赚得盆满钵满的时代,给实体商业留口汤喝,是真的很重要。 几家模型都提到了「Buy Local」(本地消费)文化日渐兴起的作用,这个口号的意思是,和你在电商平台花100美元相比,你在本地社区的店铺里花100美元,能有更大的比例让这笔消费在你身边循环,激活整个邻里经济,最终你也必将从中获益。 这个理论可能不太严谨,但和那种空洞的道德勒索比起来,用切身利益来打动大众的说服性明显强多了,围绕「Buy Loca」这个主张,从出版到分销再到经营的一长串产业链都起了变化。 比如出现了Bookshop.org和IndieCommerce这样的网站提供比亚马逊更低的交易费用,而且支持用户指定所在地的任何一家书店发货,书店不需要自建电商系统或是找人来直播带货,只需要把库存接进去就能拿到订单。 再就是书店品牌方开始下放权力,把门店选品交给店员负责,有点主理人的意思,比如以前在最好的展示位推荐什么书,要么是出版商出钱买位置,要么是放主流畅销书,但是最近普遍都由门店自行决定,比如基于「BookTok」——TikTok上的热门标签,反映网红们都在读什么书——来做店内布置。 反不合理的分配制度,而不是反互联网本身,这点很聪明,不仅避免了一刀切的草率,甚至还反过来影响了那些规模更大的连锁书店,在全国拥有几百家门店的巴诺书店就明确提出要让每一家店都变得更像独立书店,给经理更多的决定权。 还有策展活动的兴盛,坚持把读书会、作者讲座、开放麦之夜组织下去,把到书店打卡这件事情塑造成电商购买无法得到的氛围感,喜欢读书的人一般都在网上不太合群,所以很愿意走进书店感受「同温层」。 在多项因素的共同作用下,美国独立书店的生存数量在2009年陷入谷底之后逐渐反弹,10年内增长了50%,即使经历了疫情有所放缓,但很快就重回净增长,带着纸质书走出衰退,书店销售额连续跑赢大盘,越过健康线。 最后说一下提示词,我用的是最经典的三段式结构,锁定人设、交待背景、细化要求,泛用性很高,可以按需修改: **目标设定:你是商业财经领域的专家,擅长挖掘和分析数据,并做出深入浅出的总结,你在和聪明人对话,所以必须极其认真的重视任务,提供最专业的解答。 **思考模式:任何问题都需要遵循层层递进、逐步拆解的思考方式,避免草率作出结论,同时需要考虑不同的观点、原理和逻辑,确保回答的高质量,在特定的复杂概念上,可以选择性采用费曼的语言技巧,化繁为简,确保表达自然、真实和有深度。 **任务说明:你需要解决的课题是「美国独立书店的复兴」,这个疑问来自我在Reddit看到的一个广受认同的观点,认为美国的独立书店在过去十年里重新有了活力,希望你能帮我验证这个说法,并给出详细的分析报告,并对趋势做出全面的梳理和总结,尽可能的检索全网信息,但要注意数据的准确性,任何有待核实的问题都要给出备注, **输出格式:输出Markdown格式的研究报告,层次分明,重点清晰,必要时制作表格,总体不低于8000字。 之前我在说AI并没有降低我用搜索的频率(https://m.okjike.com/originalPosts/67fe95ce4bfcd397846ff37c?s=ewoidSI6ICI1NzI4NGRjOGIyOTY0OTEyMDBkOTJhMDgiCn0=)也是因为这种增强兴趣的用法其实会激发很多新的回流行为,比如针对结果里的一些细节直接划线进行二次搜索这样,@Diiiii 在评论区问了我原因,当时我没找到合适的例子来回答,现在算是隔空重新解释了一次。

00
momo_00001
10月前

老编辑: 被按在地上摩擦,是学小米的关键一步。股价下跌,被黑惨了,彻夜难眠,反复问自己,这样一个雷军的故事才一气呵成。 所以理想的心态一定要放平。 过去的领先是新势力之间的领先,华米入场之后这种领先就开始失去意义了。因为五个指头伸出来不一般齐,但是距离天花板一样远。 对李想个人来说,我觉得过去一年发生的思想转变是最重要的。就是开始意识到创始人必须当公司的第一巴图鲁。所以亲力亲为发抖音,学雷军。 方法论和组织的成熟,并不意味着当然打胜仗。当市场环境发生重大变化的时候,成熟的组织和方法论反而会妨碍企业作出正确的选择。 我在发布会上,对于pro这个版本是否应该在i8上出现是持巨大的保留意见的,它明显更适合单电机版本的i6。理想one老车主的政策不直接讲,让大家去咨询销售,也看得我有点懵逼。这种点石成金的雷学魅力时刻竟然藏起来了…… 但是我能想象到,基于公司的流程和各部门的诉求,这种决策反而是合理的。 一个部门要降低起售价格,一个部门希望维持毛利和均价。一个人力推理想one老车主的权益,一个人质疑这样会不会影响新车主的决策。 想赢怕输的心态,像一个巨大的漩涡。过去在小鹏和蔚来身上都看到过这种情况。 这个时候创始人的直觉和判断,才能让企业走出纠结,聚焦于赢。 在这个过程中,李想要从过去过分强调认知的方法论转向经验和直觉。一定有不适应不匹配的地方,像他拍雷式短视频时略显机械的手势和表情。 也是很正常的。因为雷军也不是第一天就是雷军的。重新成为今天和大家顶峰相见的满血雷军,花了雷军十一年。 而李想的优势就是,他正好比雷军年轻十一岁。

00
momo_00001
1年前

于冬琪: 最近正好在研究小米,在了解了小米如何做产品后,越发坚定了:我会买小米的双肩包、但是不会买小米的任何电子产品。 背后,其实是小米的模式选择。 实话说,几年前我对小米的第一印象很不好。 因为我的第二台智能机是小米1S青春版,那会儿为啥选小米呢? 因为看到了MiUI的各种体验设计,比此前的HTC手机看起来真是改善了不少。 但是真用上之后,基本瞬间脱粉。 因为一拍照就死机。 此后我就记住了一个教训:便宜没好货,还是要挣钱买苹果。 有段时间,看到段子:某30岁男突然痛哭,说我都30了还在用小米。当时,我是很能理解这个心态的。 但是,有一个矛盾的现象,也让我一直无法理解: 既然便宜没好货,小米的便宜,肯定少不了牺牲性能、牺牲体验呀,那为啥还有那么多米粉,为小米疯狂? 正常谁会为一个廉价商品疯狂呢? 因为小米在降低价格的同时,居然还实现了对很多用户很有触动的好体验。 我就一直很好奇一个问题: 小米到底是如何既能降低成本、又能实现触动用户的体验的? 1、 了解了小米的产品开发原则后,发现其实不难。 简单来说: 就是,边际成本必须不断降低,为了体验、固定成本可以增加。 怎么讲呢? 其实有几个策略,支撑了小米的低价: 第一,当价格下降、体验还能找到亮点后,小米会有更大的销量。 只要销量大,固定成本能被摊薄、采购成本也能大幅度降低。 这是小米所有低价、性价比策略的最核心模式。 第二,因此,影响产品边际成本的:比如配件成本,必须不断降低,越低越好。 怎么降低配件成本呢? 除了模式选择之外,还有几个动作。 一是有选择的减配。 在取舍保留什么、减少什么时,小米的原则是: 大多数用户都在意的基本体验上,不能减配,必须过硬。 但是,有些体验只影响了可能20%的用户,但是带来了50%的成本增加,这些都要减掉。 比如:对标苹果时,很多交互、动画,开发成本又高、又对芯片有更高要求,这些都要减掉。 二是整个公司不断的压低成本。 财务负责算成本、而公司会给能影响成本的几乎所有人——采购、设计等,不断降低成本的压力。 如果你的成本降不下来,会面临财务的挑战。 反过来,如果能做一个动作,不管是找到更便宜的配件、还是改设计,带来边际成本的降低,也会成为很值得一提的业绩,在晋升、奖金上得到激励。 第三,那这么干,成本是能不断降低,能吸引用户的体验怎么来呢? 通常,小米会选择那些不提升边际成本、而是提升固定成本,能实现的关键体验。 啥体验主要靠固定成本呢? 简单说来,就是设计和软件。 一个设计师,做一遍,哪怕多花了半个月,薪资成本均摊在更大的销量上,也会变得不起眼。 2、 这些选择,构成了小米的爆款要素: 在基本体验上,必须过硬。 减掉非必要功能,降低边际成本,以实现绝对的性价比。 同时,在软件、设计上,保证1-2个明显的亮点。 3、 但是,这个选择,也对小米的品质带来了几乎不可能解决的挑战。 在整个团队追求降低边际成本时,最常见的做法是什么呢? 一是,换个设计思路,看能不能降低对零部件的要求。 二是,再找找新的厂家,看能不能找到比行业主流更便宜的配件。 这两个选择,当我们只看成本时,没问题。 干得漂亮。 但是,与此同时,也必然带来方案成熟度上的更大风险: 行业常规设计、常规配件,是无数厂商,打磨了一代又一代的选择。 这个打磨的过程,来自于一个个坑被发现、被解决。 而当小米要挑战行业成熟方案时,很多坑,注定要重新踩一遍。 如果手机一开机就死机,这样的问题还容易发现。 但是,注定也有很多新问题,是超出经验和想象的,必须重踩才能发现。 比如: 小米某款手机,很容易发热后开不了机,是因为某个胶水被替换成了更便宜、但是不够耐热的胶水。 疫情期间租房,房东是米粉,那个房子里所有电器都是小米,有一天IP冲突,断网。结果断网后,热水器不出热水了、净水器也不工作了。 我年会得到的阳光普照奖——小米大黄鸭洗手液机,放到洗手池子后,第二天就坏,一查,才知道作为一个卫浴产品,居然防水有问题。 这些问题,靠比行业更大量、长时间测试也能解决。 偏偏小米还需要产品尽快上市,要抢性能、核心配件最先应用的先机。 既然要尽快上市,必然压缩测试时间。 再稍微压缩一下测试成本。 最终的结果,就是大量的小问题,适配问题、IP冲突问题等,会在小米的产品上不断出现。 单看每个问题都不大、可能发生概率也不高。 但是架不住积少成多。 结果就是,我用过的小米一半的产品,都有问题。 4、 这些问题,会发生在哪里呢? 基本上不会发生在使用产品,每天都会用到的最核心体验上。 但是,高频发生在消费者不容易感知到的边缘体验上。 比如: 环境变化后的可用性。 安全性。 适配性。 5、 所以,我过去几年,基本不敢买小米的任何电子产品。 小米汽车这次的事故,我不确定是驾驶者责任更大、还是小米汽车的安全性有问题。 反正我自己几年内是不敢选择小米汽车的。 我知道安全性是一个不容易感知到、因此在小米的体系下,容易发生问题的地方。 不过,我最近买了小米的背包。 因为背包没啥边缘体验,小米会在核心体验上做得够好。 这个心态,有点像在拼多多上,不敢买食品,只敢买垃圾袋。 6、 虽然我自己不会选择小米,反过来,我反而觉得,小米让我不会选择,是好模式的体现。 什么是好的模式呢? 要很明确的知道自己服务谁、只服务谁。 一个完美的产品,也许有100个功能,但是在知道自己只服务谁后,能清晰的定义出我的用户只想为其中的哪50个功能付钱。 只做这50个,对剩下的50个果断放弃。 让自己的消费者既对体验足够满意,又不花冤枉钱。 因此,成为目标人群的最优解。 但是放弃成为非目标人群的选择。 取舍越果断,模式越有力量。 而当小米将自己消费者的偏好,转变成取舍的原则和标准时,只要这套标准在组织内充分共识,就能支撑小米不断扩张。 从一条品线到下一条品线。 所以,我也同时很能理解很多用户为什么热爱小米——“更好的体验、一半的价格”,是一句哪怕今天看来,仍然很有感染力的口号。 毕竟不是每个消费者都能不咬牙的购买苹果手机的。 当小米能将手机、电视、充电宝、手环、甚至于电车,做到更低价格、更高性价比时,的确很多本来用不起这些电子产品的消费者,都能用得上了。 何况,小米在设计、软件上,真的重视消费者的反馈,给了消费者更好的体验。 这些用户体验了这样的产品,很难不热爱。 这样的一个企业,很了不起。 小米是更低购买能力人群的苹果。 他的消费者热爱他,就像我会喜欢苹果是一样的。 只不过, 小米所放弃的——大量由边缘体验集合而成的品质,是我愿意为此花钱的。 所以,大多数时候小米不是我的选择。

00
momo_00001
1年前
给AI应用开了个好头

姬十三: 为 Manus打抱不平的三点观察: 观察1:Manus 当然是做了点营销的:创始人录了个播客;发布了一支视频;提前给一批朋友发了邀请码,这些人第一时间发了即刻、朋友圈、自有渠道;第二天早上请人去公司小型交流。我相信仅此而已,也相信 Manus 没有花营销的钱。就这点事,用的着花钱吗? 但,哪怕是有传播预算呢? 什么时候,一家创业公司在发布产品时,花点传播费用,设计几个增长功能,要被拉出来口诛笔伐? 观察 2:“堪比 DeepSeek“,“国运级“,“引领港股大涨“,“Manus 概念股“,这些词,明显不是团队行为。要怪,得怪算法机制和社交媒体环境,怪AI 大潮下的各种投机心态。 今日的传播,想必远远超出团队预期(甚至被污名炒币)。否则,不至于让人连 waitlist 页面都进不去。 观察3:说到有多“颠覆“,取决于你对“颠覆“这个词的理解。但它肯定是个现象级产品,会是今年 AI 应用大潮的里程碑之作。我们应该鼓励不同层面的创新,DeepSeek固然很底层很颠覆,但接下来各种工程上的、应用上的持续创新也很重要。 这款产品出现在开年,会鼓励更多资本今年关注 AI 应用。 也肯定会引来大厂的研究,有可能的复制。 这可不就是值得创业团队兴奋、嗨爆、鸡血的时刻?就是靠着这些时刻,整个移动互联网时代,中国团队创造了各种了不起的产品。 且看看接下来这一年。

00