即刻App年轻人的同好社区
下载
App内打开
yuerzzzyy
347关注52被关注0夸夸
光影收藏家&现实感受爱好者
水瓶座&INFP
希望下辈子可以成为自然的一部分
宇宙里有什么不是暂时
yuerzzzyy
13天前
有时候会抽离出来看手机里各种app的信息流,尤其是小红书,不是去看每一条具体的内容,而是观察它为我推送了什么,为什么会推送这些,以此来知道我最近的兴趣点和消费取向是什么,一整个因果倒置 ​​​
00
yuerzzzyy
1月前

木遥: 前几天在群里和朋友聊用 AI 写代码的痛点,我说我最大的抱怨是它在完成某些看似很平凡的任务的时候异常吃力,比如最常见的操作:把一个代码库里的某个变量全局统一改名。这个事显然开发环境有现成的接口,但 AI 只会逐个文件编辑,又慢又浪费还容易出错。这件事之所以荒谬,在于 cursor 自己就是个开发环境。换句话说,它在这件事上表现的像是那种两个部门老死不相往来的大公司,明明一个部门已经把某件事做到了近乎完美,另一个部门却对此不闻不问,非要用自己的笨办法重来一遍。 这听起来像是一个简单的可以修复的 bug,但它背后反映的是 AI 现状里一个巨大的鸿沟,这个鸿沟时时处处在各种 AI 应用里会以不同面貌展现出来。你试试看给一个业外人士(比如你的父母)解释为什么 AI 算不清楚两个数字谁大谁小,你会发现这种解释惊人地困难,因为人民群众的直觉在这里是合乎情理的:再怎么说,它自己就是个电脑,它为什么不直接算一下呢?另一个例子是我在玩 GPT 4o 生成图像的时候发现虽然模型虽然强大,但它仍然完成不好诸如「把一张风景照主体内容不动,把上面的天空再往上延伸一些」这样的 outpainting 任务,而这即使在十年前对传统图像处理来说就不是什么特别困难的问题了。 在这里,我们谈论的实际上仍然是自人工智能这个概念于1956年在达特茅斯诞生之日起就阴魂不散的「符号主义 vs. 联接主义」之争。在基于统计神经网络的大语言模型走上主流地位之前,人们一直认为基于符号计算的专家系统是通向智能最有希望的道路,几十年来的软件工程实践在这条路上已经走了足够远,常用的工具(比如传统的软件开发环境)基本打磨到了极致。直到上世纪末联接主义这个烧了几十年的冷灶咸鱼翻生,基于神经网络的大语言模型从零开始试图重写从轮子到火箭发动机的一切已有的软件工程成就。它遵循的是完全不同的生长逻辑,因此对习惯了旧世界的我们来说,它的表现常常好得莫名其妙也差得莫名其妙,有些技能近乎魔法,有些方面又笨拙得宛如一个弱智。前面所说的变量改名就是个有代表性的例子,事实上,这里的难点甚至都不在于语法解析,而在于更底层的文本替换——对旧世界来说,哪怕在亿兆级别的文本里要把所有的 A 都替换成 B 也不费吹灰之力,以至于你根本都不觉得这还是一个「任务」。但对大语言模型来说这件事天生困难,并且难度随着文本大小急剧上升。绘画也是这样,你想直接让今天的生图模型「对图片按照某些明确到像素级别的规则做某些明确定义好的操作」极其困难,它觉得整体重画一遍比较省事。对用户来说这种体验常常令人抓狂。 打一个不精确的比喻。这两种模式可以粗略对应于大脑的左右半脑。基于符号主义的左脑在过去几十年里得到了充分的发育,基于联接主义的右脑在过去十年里急起直追,并且仍然在极速进化。问题在于这两个半脑之间沟通——对应于人脑胼胝体的功能——极其孱弱,才会出现 cursor 的编程助手不知道如何调用 cursor 的编译功能这种奇葩问题。 于是人们开始引入中间层。 在现实中这个中间层会被人们冠以各种不同的称呼,有人认为自己做的叫垂直 AI,有人认为自己做的是 agent,也有人认为自己做的就只是单纯的 wrapper。但在这个上下文里,它实质上起到的总是类似于胼胝体的作用,让神经网络模型这个右脑可以调用已经高度成熟的传统软件左脑的功能来完成更复杂精细的任务。事实上,这一部分的历史欠账已经如此严峻,以至于哪怕接下来一两年里大模型本身的思考能力停止提高(并不是完全不可能),单单改善这个左右脑的对齐问题也能解锁许多前所未有的能力。在今天,如果一个人说自己在搞 AI 创业但又没有直接训练大模型,那他们的工作多半就实际上可以归属于这一类。 这当然在整体概念上是个充满机遇和潜在回报的领域。毕竟,现有的软件工程领域的应用如此繁荣,切入社会的所有方面。但值得改进和革新的方向又俯拾皆是。把现有的专业知识和大语言模型的智能结合起来,再造一次信息化革命,听起来是成千上万现成的创业机会。 但困难(以及有趣之处)在于,虽然这种泛泛而论听起来很难反驳,但你会发现对每一个具体例子而言,人们对它的价值都充满怀疑。问题的根源是这两个半脑中传统的那一个相对静止,而新的那一个每天都在变化。因此任何工作都像是在和历史(确切来说大模型的进化史)赛跑。一个近乎讽刺的事实是,如果两个人都在前年开始投身 AI 图像生成领域,一个花大量时间和金钱投入 ComfyUI 和工作流的研究,另一个两年都在游山玩水,本周 GPT 4o 发布更新之后他们仍然基本上站在同一起跑线上。换句话说,你很难说服自己(和投资人)相信,你不只是一直在一架上升中的电梯里做俯卧撑。 于是你会看到 Richard Sutton 的 The bitter lesson 被人一遍又一遍提起——我想不出除了 Shannon 等人的早期作品外还有哪篇短文在人工智能历史上有这么大影响力——简单地说,它概括了这样一种原则或者说是哲学: AI 研究者总想把人类已有的专业知识经验塞进 AI。 它短期确实管用,还带来成就感。 但这么做迟早会遇到瓶颈,甚至阻碍 AI 的进步。 而真正的突破往往来自更多算力和更大的模型。 换句话说,大力出奇迹。除非你的专业应用有某些不同寻常的护城河,比如只有你自己掌握的独家数据,否则长远来看,通用模型总是能赢过专业方法。 回到上面那个左右脑的模型,这基本上就是在说右脑的成长如此势不可挡,以至于终将吞噬和取代左脑。因此任何立足于胼胝体的商业模型早晚都是失效的。或者用很多人很喜欢的一个说法:基于大模型的产品只是一个幻觉,模型本身才是产品。 当然,现实世界总是更为复杂。即使你认同 The bitter lesson 所阐述的原则,你也未必会接受这个极端的一刀切的判断。真正重要的问题在于边界何在,或者说,是否存在一些问题,即使对大模型的发展做最乐观的估计,用传统的(基于左脑的)软件工程解决方案也还是更为经济?如果这样的问题存在,围绕着它们所建立的接口就总是有价值的。 在我看来,这样的问题事实上大量存在。这篇文章开头所写的文本替换就是一个简单但有代表性的例子。你当然可能设想有一天大语言模型的 token 如此便宜,上下文窗口如此之大,以至于它真的能胜任亿兆级别的文本的文本字符替换。但它在这个问题上的效率上限也不过就是做到和传统工具一样好,换句话说,在这个问题上,左脑事实上已经掌握了 ground truth,右脑能做的只是逼近它而已。作为对照,上面举的另一个例子 image outpainting 则不然。虽然今天人们可以通过 Photoshop 一类工具做到这件事,但对它的实现几乎总是伴随着复杂的规则和需要考虑各种现实条件的工作流程,你完全可以想象有一天通用模型能够一鼓作气吃掉它。 现实中的问题几乎总是上面这两个简单例子的复杂混合。它们可能在各种层面纠缠在一起,并且由于历史的惯性并不被分别对待(因为在从前无此必要),但最终它们还是会被小心翼翼的解耦,然后分而治之。在我看来,这里才是所谓 agentic AI 领域的真正挑战:在日新月异一日千里的模型能力进化中辨认出仍然存在长远经济价值的「旧世界」的孑遗,进而围绕着它们构建人工智能接口。即使是为 AI 做带路党,也要做一名有长期利用价值的带路党。 目睹这场洪流之中新旧两个世界之间大规模的技能迁移,以及在洪流冲刷之后新的边界的浮现,可能是当下这个时刻最有意思的体验。 差不多两年前的这时候我写过一段话,后来被很多人转引过: 「当你抱怨 ChatGPT 鬼话连篇满嘴跑火车的时候,这可能有点像你看到一只猴子在沙滩上用石头写下1+1=3。它确实算错了,但这不是重点。它有一天会算对的。」 两年后你再访这片沙滩,那只猴子还在,但已经非复吴下阿蒙。此刻它正在充满困惑地摆弄一台袖珍电子计算器。电子计算器太小巧,显然是另一条文明路线下千锤百炼的产品,它的手指太粗太笨拙,还驾驭不了这么精致的工具。于是你充满信心——但也不无恐惧地——等待着它找到开关看懂按钮的那一刻的到来。

00
yuerzzzyy
1月前
玉兰落海棠开,此处樱花飘落,彼处的也在盛开;
但最难忘的还是在树下眯起眼,一睁眼就涌入整片樱花天空的惊喜。
春天是一瞬间,
春天也是无数个瞬间的总和。
00
yuerzzzyy
2月前

程艺Truman: 0预算做外链围绕的一个核心就是“抄” 我们做网站的同时,肯定会有一帮竞争对手,跟我们一样去竞争同一个关键词。 你可以挑几个你认为做的还不错的,搜索排名靠前的,把它们的网址粘贴到semrush中 然后你会看到右侧有一个反向链接的字眼,我们点进去 进入到反向链接页面后,有几个选项,和我一样,选中(活跃)和(Follow) 之后你往下滑,就可以看到这个网站的全部外链信息了。 这里优先选择活跃和Follow,虽然NoFollow谷歌说也算一个有效外链,但是Follow的效果肯定会比NoFollow更好。 活跃,也就是指没有被网站主删除的外链。有些网站你上去发了外链之后,网站主可能不给你发外链,于是会把你的链接删除,这种会被semrush标记为(丢失)。 我一般最常用的就是活跃和Follow,然后一个一个点开看,看看有没有我也可以同样发链接的网站。 这张图片左侧的源页面和url这一栏就是我们想要找的网站,一个一个点开看就好。右边的锚链接和url指的就是这个网站都在这个能做外链的网站上给他自己哪些页面做了链接,一般是不用看的。 接下来再讲讲Ahrefs Backlink Checker 这个的思路和semrush类似,打开我在文章开头给的链接之后,输入你竞争对手的域名,点击check,就会弹出一个窗口,里面都是这个网站的外链,同样我们看左侧那一栏就好,右侧依旧是这个网站都在这个能做外链的网站上给他自己哪些页面做了链接。 Semrush在淘宝买的话是20左右一个月,Ahrefs Backlink Checker是免费的,但是有限制,一次只能看15条左右的外链,需要付费才能看完整的,所以我一般是semrush用的比较多。 等你做网站做的多了,研究的竞争对手也变多了之后,你就会像我一样,积累了一个属于自己的外链库,以后做了什么新网站,就不用再一个一个去挖竞争对手的了,直接在自己过去做过的外链网站里面做就好了,方便省事很多。

00
yuerzzzyy
2月前

小赫一言: 怎么更好的提问? @ChatV根据您的对问题的发问,汇总了下之前的思考。 除了公共的提问套路,我是这么做的。 1.过程 把问题从脑子转移到纸上,再到苹果备忘录,现在在flomo上。 一旦找到我觉得比较满意的答案,这个问题就删掉了。 今年复盘时,发现写了这么多,变化这么多,根源都是我的好奇心,我的问题。 2.问题的产生 对现实世界探索,会产生好奇心和反思。 让你产生疑问? 比如,为什么做抖音的都好有钱,而且学历很多也不高。 再比如,毕业后,你发现在老家的人,比你来到一线城市过的滋润的不少。 反而不是你曾经的印象,大城市的美好生活。 如果你能真的探索到答案,带给你的可能是价值观和认知的变化。 3.如果找到答案 其中核心节点,是你掌握了多少相关的专有名词。 关键词决定你吸收的信息 4.问题的价值 问题就会产生探索,探索会有答案 这个答案如果都在互联网上,这个就是个非常强的数字资产。 如果你想变现,他就是生产资料。 我提到了两个关键词 数字资产,生产资料 5.如果掌握的关键词 多看高质量,很多看不懂的专业文章。 这个该怎么找到呢? 看行业的顶尖大佬的书籍和文章 用ai了解这些关键词后,用这些关键词去搜索信息。 或者反过来问ai这些关键词。 相信你会得到比原来质量高非常多的答案。

00
yuerzzzyy
2月前
有意思

Kennyzhang29: 中国市场产品设计的“性价比”迷思 今天在网上看到一个视频在吐槽“泰磨积木”咖啡磨豆机不行,把他和国内山寨大厂“恶作剧”的同价位产品对比。说泰磨的产品用的塑料多就是不如山寨的用料足。 泰磨是一家国内的原创设计咖啡器械里做的最好的牌子,在欧美也有很多渠道售卖,之前在格鲁吉亚都看到一家咖啡店里摆满了泰磨的产品,非常厉害。 恶作剧是广东的一个工厂,专门cnc仿制一些卖的比较好的咖啡器械。原版都是在那个品类里卖的比较贵的。比如一把咖啡称原版卖1500,他同样的样子基础功能一致卖300。 我会想说,塑料未必会比金属差,比如德国品牌司令官c40(咖啡手摇磨豆机里的行业标杆)它的固定中框支架也都是塑料,虽然国内市场磨豆机不上cnc加工是一种原罪一样。优质的塑料可以达到与金属一样的精度、稳定度、耐用度,还可以做出金属cnc做不出来的结构。 把泰磨和恶作剧做对比就像是拿国产仿制家具厂的仿品和欧美的原版设计做对比。那些原版的家具价格一定是更离谱的,国内仿版一定是“用料”更好的。因为国内市场是这样的,大家都在做仿品,我没有性价比就没有竞争力,这就是工厂思维。但是设计思维应该是我为达到我的功能与目的,用最合适的材料。 这里提供一个思路,就是泰磨做全球市场的,除了中国之外,欧洲美洲也是需要拿下的。而定位如此便宜的磨豆机,在扣除关税平台抽成之后,要保证高品质的出品,那成本会是一个问题。首先零件的成本如果是全CNC 就非常恐怖了,注塑件的生产工时更短,周期更快,成本更划算。其次重量上会差特别多,当你卖出好几万台,就算每台打包重量轻200g,国际航空运费也可以省下超级多钱。 再就是出粉口问题,视频里提到,恶作剧的磨豆机是公版模型,出粉口容易堵塞咖啡粉的地方是可拆卸的易于清理,而泰磨的有用自己的专利技术,可以把残粉轻松的抖下来。 在我看来这更像是一种设计、商业策略,而不是真的单纯从发烧友的“实用、极致追求”的角度思考而作出的设计决策。 千元价位的普通用户这辈子都不会拆开机器清洁几次。一个专利出粉口可以形成商业优势与产品卖点,与别的产品形成差异化。这个形成的购买决策力远比“容易清洁”来的好感知。 再加上品牌售后、设计、等等 这都是成本。 所以说他在视频里说的这些非常“物理”的点我觉得是没有错的,材料是这样的。当然磨豆机还得看风味,看疗效。大部分人也就只会有一台磨豆机,用惯了也不会折腾。只有我们发烧友在这里说这个结构好啦,那个设计棒了。 说回来泰磨这台机器直接对标的是fellow的ops。一样的塑料件偏多、差不多价位、一样是意式。如果要对比的话这两台机器放在一起才是真的公平竞争。 看到乱拳打死老师傅的表演也是一种乐趣。像玲珑、汉匠(别的一些外观设计差一些,但是用料很足,研磨品质不差的厂家)工艺上做的都不比国际大牌差,都很棒了,但还是思路不同,受众不同,市场也就不一样。

00
yuerzzzyy
2月前
ui交互设计无意识的影响行为太多例子了

julian.: 再给“行业共识”破盆冷水:我不认可 agent 这个方向,反而 copilot 的 in-context 交互是更重要的。 1. 我不认可 agent 这个方向。逻辑上大家当然能说手机和电脑的 ui 分两类,一类是 gui、另一类是 lui。这种分类被提出时,说出这种话和听到这种话的人在语言层面已经把这两类的注意力权重放在同等位置上了。但让我们回归生活,你会发现 gui 的效率真的很高。你想象自己打开手机、点开 app、上下滑的具体动作,你可能太习惯了以至于没觉得这是如此的丝滑。每次打字、说话,远比即时点击图标笨重 ,lui 的 agent 叙事没有给第一视角的生活经验以足够的尊重。至于长程任务,人在这些任务里也类似于强化学习,plan - execute - learn 的循环不断接力(人是环境的反应器),本就是社会博弈和动态规划的过程。所谓一个 agent 来总包,会涉及到复杂的权限和边界设置选项,更要不断和人主观意志的对齐(对齐的交互成本也很高)。现在叙事里常用词是“完全懂你的 agent”,可你自己懂下一秒的你自己吗? 2. copilot 的 in-context 交互是更重要的。现在产品实际 pmf 的原因,我倾向于早已不是底座模型能力提升带来的了,而是产品交互变化带来的。cursor 不是因为 claude 更新了一版于是牛逼,而是找到了轻松读和写本地代码文件的交互。github 插件只能读,cursor 特意做 ide 的原因就是为了一键“写 / apply”的这个丝滑交互。不是用户、没干过产品经理、天天听由标签串联起来的叙事,就不容易想清楚价值分配里啥是关键的。 无论是 ai 还是其他任何科技,我们的分析首先应回归真实的生活。不作用于人们生活而只体现在文章和估值里的科技,可能不是我想要的。当然总有人为了自身利益无视其他人的生活,还嘲笑其他人看不懂;我对此保持沉默。

00
yuerzzzyy
3月前
沈阳很喜欢的一家社区咖啡店——公园散步
有好多mla的元素,环境和名字都太松弛了~
00
yuerzzzyy
3月前
过年聚会一个很直白的感受是:
一手经验和一手表达,永远比二手传播,或者三四五手经认知筛选再拼贴重组缝合怪,来得更生动有力

今天聚会里有个同学是做铁路乘警的,行万里路,每天都要接触三教九流,再加上他本人天赋异禀绘声绘色的表达能力,和绝佳的为人处事高情商,直接在聚会上输出了一个半小时脱口秀专场一样的个人经历故事会
所有人完全不会觉得无聊,都听的津津有味拍腿大笑,他自己也毫无疲倦,素材库源源不断

想想自己的工作生活,日复一日枯燥无味,每天都在解决一些技术性问题,过年都要提前打草稿想想怎么和亲戚描述自己是干啥的,还要准备几个大家能够听懂的素材和内容
要么就是传播自己的见闻,从同事朋友那里听来的他们的经历,完全没有一手经历那么多细节丰富度

这个乘警同学的经历,我们再去给其他人讲就根本做不到同样的效果,细节,描述方式,语气,语言体系……他自己是直接从经历生成语言,而我们只能拙劣的模仿他的语言,也没有能力通过二创把他的经历再现

另外一个再次很强烈的感受是语言方式和思维方式相互塑造

他有很多糟心事代入想想自己的话一定就是内耗到不行,但是他就可以在这个故事里让别人感受到快乐,同时他自己也毫不内耗

这一整套都是太让人羡慕的能力了,虽然就是脱口秀一直提倡的哲学,但是有人天生就有这样的能力

总的来说
今年要少吃别人嚼过的馒头
多创造一手经验(至少在日复一日里给偶然创造一些发生的机会和空间吧
00