即刻App年轻人的同好社区
下载
App内打开
__555w__
610关注391被关注0夸夸
🥳电商产品经理
__555w__
2月前

Gavin_C.: 给产品经理朋友们推荐 3 个学习大模型的音视频,它们都在近一周内发布,加在一起总时长 8.2 小时,所以现在学习的话一点都不晚 相信我,认真学习完 8.2 小时你会彻底对大模型上瘾的 首先是 Andrej Karpathy 的《Deep Dive into LLMs like ChatGPT》,Andrej 是 OpenAI 的创始成员,领导了 GPT-4 的开发,同时也是 Tesla 的前 AI 总监,它从 0 到 1 拆解了 ChatGPT 的实现原理,深入浅出但又非常全面 对我最有帮助的一是系统了解了分词的原理,比如去年 o1 刚发布的时候,网友问它 “Strawberry” 这个单词中有多少个 “r”,而 GPT-o1 这个当时地表最强模型却回答说 “2 个”。很多人误以为这还是大模型的 “幻觉”,对 o1 的智力产生了质疑,背后的原因其实是没理解分词的逻辑,人类解构 Strawberry 可以细化到单个字母,而大模型的分词其实拆分为了 st, raw, berry 3 个 token,它不是像我们人类有眼睛来看 二是更底层理解了大模型的预训练,模型的响应是基于对互联网文档的回忆,频繁出现的数据更有可能被准确回忆。这段时间 DeepSeek 爆火的时候,海外有人测试问它是谁,而 DeepSeek 回答说自己是 ChatGPT,间接让很多人认为 DeepSeek 是蒸馏的 OpenAI 。了解了预训练的原理我才恍然大悟,这很有可能是因为预训练数据里 OpenAI 这个知名实体频繁出现在多个训练窗口中,导致模型回忆时候 OpenAI 以更高的概率出现了而已 Andrej Karpathy 的这个音频可以在这里听:https://crunchpod.app/details/andrej_karpathy/5c2dfd8be5df11efbfc900163e0094cd?from=expert 其次是小珺邀请潘家怡逐句讲解 DeepSeek-R1、Kimi K1.5、OpenAI o1 的论文,家怡是加州大学伯克利分校人工智能实验室在读博士生,我听的时候是电脑上同步也打开了这几篇论文,真的是酣畅淋漓,本来是计划陪家人看 《哪吒 2》的 市面上大多数技术分析更多是对于 R1 的纵向分析,而这个播客之所以推荐的原因是,它有非常全面深入的横向对比,所以也就更能清楚知道 R1 为什么好,为什么在这个节点爆了 值得注意的是,市面很少有人解读同期发布的 Kimi K1.5,我这次也是第一次读 Kimi 的论文,没想到很多地方居然跟 R1 是异曲同工的,但 Kimi 没出圈是别的原因 中间我有个比较大的启发是,Kimi-K1.5 论文里提到它们有意控制模型输出的长度,为此设置了 length penalty 这样的奖励惩罚机制,因此模型在所有的回复里都会是尽可能短的,甚至将长思维链变成了短思维链,团队的目的是认为这样的用户体验更好,输出少、思维链短能快速给 answer 而如果从产品角度来看的话,模型在 “给答案” 这件事情上和滴滴的 “派单” 有相似之处,早期司机和车型不多,加之用户主要是打出租车迁移过来的刚需人群,快是核心诉求,后期用户类型增多跨越鸿沟进入早期大众 (Early Majority),在满足核心需求的情况下,快成了第二优先级 但看 DeepSeek 的爆发,恰恰是因为它的 “慢”,我在朋友圈做过一项调研:在用 Chatbot 类产品的时候,你大多数情况下是用慢思考的 o 系列,还是快思考的 4 系列?绝大多数人都选了前者,这个其实是因为大模型拉高了用户的阈值,对输出的质量和长度要求越来越高,“快” 并不是唯一核心诉求。所以还是老祖宗的那句话:技术永远要让位于需求,产品时时要回归场景 站在产品经理的视角来看 Kimi K1.5 的优化,我是觉得多少有些多此一举想多了,但这只是一个点,不能因为这而否定 Kimi 团队的优秀,小珺的播客可以在这里听:https://crunchpod.app/details/deepseek/ed462d42-61eb-45c3-b2c6-950097354959?from=company 最后是昨天张涛以产品经理身份做的关于 Deepseek-R1 的赏析,起手就是关于 DeepSeek 在过去 1 年的发布节奏,原来大家津津乐道的很多创新其实早在半年前甚至更长时间前就发布了。更印证了 《为什么伟大不能被计划》这本书里的观点:那些真正拿到宝的人,都是通过一步步的 “搜集踏脚石”来试错,一路踩到惊喜,而不是上来就说 AGI 张涛的分享见这里:https://m.bilibili.com/video/BV1bnNDeFELK?buvid=ZA49EEA93D2E8D134E8C9C203D9BD12CE3F9&is_story_h5=false&mid=tYnTNKGq9xlln4JjimVqSQ%3D%3D&p=1&plat_id=116&share_from=ugc&share_medium=iphone&share_plat=ios&share_session_id=3F9369BF-D03C-4086-B9CC-627852907508&share_source=COPY&share_tag=s_i&spmid=united.player-video-detail.0.0&timestamp=1739146752&unique_k=bPINFzv&up_id=53268348 以上音视频建议都在电脑上听,因为可以边听边记笔记 ,最后,附上 DeepSeek 的发展时间线,让我们感谢这个时代的每一个贡献者 ❤️ 2023年6月,DeepSeek 成立 2024年2月,发表 DeepSeek-Math,提出 GRPO 2024年5月,推出 V2,提出 MLA 和 DeepSeek-MoE 2024年11月,推出 V3,提出了 MTP 和一整套软硬一体优化方案等 2025年1月,推出 R1,提出 R1-Zero

00
__555w__
6月前

王盐: 很多刚进入互联网工作的同学(甚至包括工作几年的)总会有个苦恼。 感觉自己做的东西很基础,内容基本掌握了,没啥新的学习点了。 然后每天看各种35岁即失业的新闻焦虑不已。 互联网行业的非技术岗,说实话,中低职级(P4-P6),没啥太多的技术含量。 你把公司那点事干明白的,剩下的就是不断重复,变成熟练工。 到瓶颈了,怎么突破呢? 我觉得最重要的是,勤奋与好奇心。 这个级别的产品、运营,不存在什么天赋差异,比的就是谁更勤奋、用心、愿意去多研究东西。 我举个生活中的例子。 我在某外卖平台点餐,餐送到后发现没有调料包,就是那种泡面没有调料包的情况,完全没法吃。 打商家打不通,就在平台上申请退款。 平台用户退款需要上传照片作为证据。 我就拍了一张没有调料包的外卖照片,上传上去。 退款申请会直接提到商家那边,商家看到了我的退款申请,立刻拒绝了我。 此时,平台给出两个选择,撤销申请 or 申请客服介入。 我点了客服介入,半天过后,客服给我打来电话,说退款成功,请我注意查收。 那么当你们看到这个故事的时候,会产生什么问题吗? 我的问题是: 1、用户申请退款时举证,仅通过照片作为证据,那如果我刻意把调料包拿走,拍一张没有调料包的照片做JIA证,平台如何验证? 2、商家如果坚持自己无过错,又如何举证? 3、当用户、商家双方都坚持自己无过错时,平台该如何判定纠-纷结果? 4、商家第一次接到退款申请时,立刻拒绝了我,那么客服介入后,商家是妥协了,还是被平台强制判定才退款成功的吗? 5、如果是平台强制判定商家担责,那它的判定标准是什么? 针对这些问题,我在电话中询问了客服。 平台客服显然对我咨询这些问题有些意外,正常用户是不会这么问问题的,但她还是解答了我部分问题。 例如平台对用户举证的判定标准,照片并不构成绝对证据,还需要追溯用户的过往订单及消费行为,来推测用户是否通过做伪证来占便宜。 这部分判定有一部分由客服人工裁定,有一部分由系统自动监测用户的异常行为。 那么,问题就会随之衍生: 1、那么什么样的情况,平台会判定用户的行为、信用「不-良好」呢? 2、系统判定用户行为异常(例如频繁申请退款)的阈值在哪里?这个值或区间范围是如何确定的? 你看,通过问题,你就能大概倒推出平台处理客诉的流程与标准。 当然,具体的值、判定条件,客服肯定不会告诉你,但大致上,你对这个事就有了一定的概念。 那么你之后在工作中遇到类似的情况,就可以供你参考,或启发思路。 同样,这样的事情还有很多很多。 例如说你使用的某款产品,你觉得某个地方不好用,你可以通过官方反馈渠道,联系他们提出你的建议。 如果你的建议有价值,对方会进一步和你沟通,在这个过程中,你也会了解到这款产品背后的定位、设计思路、工作人员面临的问题等等。 你可以通过给他们提全面、严谨、细致的改进建议来训练自己的观察、思考能力,当对方采纳、或不采纳你的建议时,你也能得到反馈,知道为什么行不动,或者为什么优先级不高。你也能了解到其他团队是怎么来做产品的。 一个员工,哪怕身在最大的企业,他也不能保证自己有足够高的眼界与深入的行业理解。员工毕竟是一个萝卜一个坑,是为公司需要而存在的螺丝钉,每个人做的事情都很细分,不可能上能一揽全局,下能一线看到全方位的细节。 所以你只靠工作那点东西,是远不够你自己成长的。 剩下的,就是要自己业余时间充电。 个人充电,最重要的就是好奇心和勤奋。 换句话说,也就是勤奋的多提问题。 看一个人的水平,就看他平时关注什么样的问题。 没有好奇心,你就不会留意身边的很多细节,也不会满脑袋问号。 没有勤奋,你思考的量上不去,无法通过量变引起质变。 所以平日里,要多想,多提问,然后去寻找问题的答案,你的能力自然会在这个过程中,获得提高。

00
__555w__
7月前
随时随地都在抽烟的人到底是什么东西做的?
00
__555w__
11月前
☁️
00:07
00
__555w__
12月前
Arc 的更新会不会太频繁了,而且提醒更新的弹窗关不掉•ᴗ•💧
00
__555w__
1年前
校招入职快一年了,感觉自己有很多成长,但感觉又没有,想咨询下大家是如何衡量自己的职业成长的呢?以及1-3 年的产品经理应该长成啥样呢?🤔
50
__555w__
1年前
中通快递是怎么做到距离地址 3km不到需要配送一周的?(๑•̌.•̑๑)ˀ̣ˀ̣
00
__555w__
1年前
我还是坚信AI绝对不是取代人,一定是往着生产力变革的方向发展,所以它和石器、机器、互联网一样会变革人类生产关系,并因此衍生更多新的岗位,但是它的应用本质依然会和人的吃喝玩乐息息相关
00
__555w__
2年前
📍苏州淮海街
📷尼康z30
21
__555w__
2年前
上海路真的很上海,全是咖啡店☕️
00