即刻App年轻人的同好社区
下载
App内打开
doubleF
1k关注180被关注0夸夸
少吃一点🍴
最后一杯🥃
附庸风雅🖼️
doubleF
11天前
Yes!Ramen!!!!

OUT THERE

00
doubleF
15天前
00
doubleF
1月前
Hiromi !!! 🎹
00
doubleF
1月前

木遥: 如果你是程序员但还没听说过 vibe coding,那你已经落伍了。 这个词是上个月 Andrej Karpathy 在一篇半自嘲的推文里创造的,现在已经成了标准用语。没有人能精确定义它,但所有熟悉 AI 辅助编程体验的人都多少知道它大概在说什么。一些人对此嗤之以鼻,一些人认为这就是未来,还有更多人勉强让自己适应它。 Vibe coding 创造了一种模糊的实践。用 Andrej Karpathy 自己的话说:「对 AI 的建议我总是接受,不再审阅差异。当我收到错误消息时,我只是复制粘贴它们而不加评论,通常这样就可以解决问题。代码超出了我通常的理解范围。有时它无法修复错误,所以我只是绕过它或要求随机更改,直到它自行消失。」一方面它犹如神助,让你有一种第一次挥舞魔杖的幻觉。另一方面它写了新的忘了旧的,不断重构又原地打转,好像永远在解决问题但永远创造出更多新的问题,并且面对 bug 采取一种振振有词地姿态对你 gaslighting。你面对着层出不穷的工具甚至不知道自己该认真考虑哪个,心知肚明可能下个月就又有了新的「最佳实践」,养成任何肌肉记忆都是一种浪费,而所谓新的最佳实践只不过是用更快的速度产出更隐蔽的 bug 而已。 从技术上来说你可能觉得困难主要在于今天的大语言模型的上下文窗口还不够大,分层长期记忆机制还不够健全,或者别的什么理论上会在未来半年到一年里得到解决的瓶颈。但实际上,vibe coding 打破的是你作为一个程序员的自我认知:你一开始以为自己只是在为了效率做妥协,渐渐地你发现自已陷入在一重又一重建立在浮沙之上的迷宫里精疲力尽,最后你已经忘了效率是什么。 从某种意义上说,今天的 vibe coding 有点像一两年前的 AI 绘画,第一眼很对,放大后细节都是错的,到处是六根手指的手。问题在于,绘画远比编程更宽容——毕竟真的存在印象派这种绘画风格——编程难道不理应是非黑即白的吗? 但并不是,正是在这一点上现实开始扭曲起来。你很快就注意到 vibe coding 的「正确性」就像薛定谔的猫一样无法精确观察,你可能每天抱怨 LLM 的注意力窗口太小,而事实是你自己的注意力窗口更小,面对它不费吹灰之力生成的海量代码的冲刷很快就头晕目眩,放弃了审查和控制的执念。你试图借助类似于 .cursorrules 这样的规范来指导 AI,但这就像是野马辔头上的一根想象中的缰绳,你既不确定这些规则是否完备,也无从知道它们是否会被真的遵守。你以为这些原则相当于法律,其实它们只是孔子家语,而社会的运转既依赖于它们的尊崇神圣,也依赖于它们的晦涩模糊。你渐渐不再 care 你的代码是否正确,反正随时在改。Dario Amodei 说未来 3 到 6 个月内,90% 的代码将由 AI 编写,12 个月内几乎所有代码都可能由 AI 生成。在这个即将到来的世界里,六根手指的手应接不暇地出现,然后消失,你开始接受暂时 work 就是一切,变动不居才是事物的恒常。 某种意义上说这是这个时代的本质。当国际新闻和洋葱新闻开始无法分辨,当你发现所有号称追求真实的人最终追求的只不过是逃避认知失调,你所创造(或者你自以为你所创造)的一切也不会摆脱同样的命运。八年前我写过这样一段话: 「躲在一个气泡里的个体可以假定岁月静好,一切宛如昨日幻乐,但这往往是悲剧的起源。他看到的只是一个复杂屈折的世界在更低维度上的投影,一个对狂飙突进的历史湍流的简笔画般的描摹,一个更容易被媒体所采纳和记忆的粗糙叙事,一座层移倒悬重重折射下的海市蜃楼。而真实——如果真实仍然有意义的话——则掉落在幽暗深邃的维度的缝隙里。在那里,一幅粗粝斑驳扭曲异质的图景,会让一个在不经意的一瞥之间扭过头去的观察者惊骇和战栗不已。」 那时我以为世界刚刚开始崩塌。后来我理解了崩塌的不是世界,而是我自己的天真想象。 Vibe 不是真实的某种投射,而是它的实质。一开始你以为世界是一张完美的幕布,然后你在幕布上发现了一两条恼人的裂痕,接着你发现裂痕越来越多,无处不在,直到最后你意识到不断蔓延和生长的裂痕才是你真正生活的地方。It’s not just vibe coding, it’s vibe living.

00
doubleF
1月前
doubleF
1月前

junyu: 分享一下目前我的测试结果,均为自己(除了海关那个)最近一个月实际生活/工作中的需求。懒得排版制图了凑合看吧… 说明一下,我测试都是努力做基于真实场景的定性测试,也不和同类产品比,只和没有这个产品的时候比。 (prompt均为英文,为阅读方便加了中文翻译) 研究类: 🟡 制表整理 OpenAI 各模型的历史价格变化(使用了 High Effort) > I would like to build a detailed spreadsheet to track OpenAI's every pricing change for each model. > 我想制作一份详细的电子表格,记录 OpenAI 各个模型的历史价格变化。 这是我用来测试其它 Deep Research / DeepResearch / DeepSearch(以下简称Deep Research...)的任务,也是我实际工作中想做的事情。我给 Manus 的 prompt 更模糊,删去了具体细节要求。结果出人意料 —— Manus 无需干预就能按要求交付结果,至少在形态上,这是各类 Deep Research 产品都没有做到的。当然,数据准确性难以验证。我设想如果这是交给实习生的工作,验证方式会是:一是抽查数据,二是让实习生详述收集过程并相信他不会偷懒。Manus 对收集过程的描述不错,但确实无法相信它不会偷懒。我自己做的时候是用 Wayback Machine 去找的,Manus 从自己读的 LinkedIn 帖子中学到了这个方法,但称自己无法访问该工具。 我向 Manus 推荐 Wayback Machine 后,它拿出小本本记了下来。 回放地址:https://manus.im/share/dvGtPZ7TzZAiYClbejAyWw?replay=1 ✅ 为设计师推荐新显示器 (使用了 High Effort) > Help me find a monitor. I am a UI Designer living in Beijing. I don't know what criterial I should look at, so please ask my preference if you are not sure. The resolution must be at least 4K. > 帮我找一台显示器。我是一名在北京工作的 UI 设计师。我不确定应该关注哪些选购标准,如果你有不确定的地方请询问我的偏好。分辨率必须至少是 4K。 这是我最近的实际需求(在即刻也发问过)。我特意提交了一个模糊的问题,这符合真实场景,因为决策标准往往是在研究过程中才逐渐明确的。Manus 在这项任务中表现出色——它主动探索显示器的选择标准,适时提出追问,最终给出了符合实际需求的建议。不过由于它只能进行网页搜索,无法访问小红书、什么值得买等社交媒体平台,导致信息范围(尤其是价格信息)较为有限。一些在这些平台流行的产品也因此无法进入视线。当然,这未必是坏事,某种程度上反而避免了广告的干扰。 回放地址:https://manus.im/share/Gba6tQTxWpzKBgSvMKhxeC?replay=1 执行类: 🟡 筛选 YC 最新一批 AI 产品并代为注册 > Visit the official YC website and compile all AI products in the latest batch, and sign up all of them if possible (my email address is ■■■■■■■■■@gmail.com). After that, compile product information into a clear, well-structured table, including whether you have signed up for me. Be sure to find all of it. > 访问 YC 官方网站,整理最新一批中所有的 AI 产品,并尽可能为所有产品进行注册(我的邮箱是 ■■■■■■■■■@gmail.com)。之后,将产品信息整理成一个清晰、结构良好的表格,包括是否已为我完成注册。请确保找到所有相关产品。 找到了27家目标公司(存在遗漏,毕竟新一批 YC 有 200 多家公司,不可能只有 27 家做 AI 的),在预算耗尽前尝试注册了其中 12 家:6 家注册成功,2 家注册失败,4 家官网无法打开。尽管信息遗漏较为严重,但早上打开 Gmail 收到各种注册确认邮件时,仍然大为震撼。期间不时遇到验证码,Manus 会请求用户协助完成。团队说因为现在资源紧张,超时控制比较严格,之后扩容后会缓解。 回放地址:https://manus.im/share/8SLQx2o1eJx8jOPY9p6hoN?replay=1 ❌ 访问 Slack 账户并导出全部历史消息 > Login to my slack account and export all my data to Google Drive > 登录我的 Slack 账号并将所有数据导出到 Google Drive 尽管任务未能完成,但体验良好——Manus 清晰地说明了它无法执行需要个人账户权限的操作。这与 Devin 的做法不同,Devin 会让用户在它的电脑上登录账户。 回放地址:https://manus.im/share/lphujtY4j2lGwyAFP3qHhL?replay=1 开发类 ❌ 制作孩子用的学习任务抽奖转盘 > Could you help create a simple, beautiful spinwheel for my kid to decide what academic programs to take each day? Requirements: … > 您能帮忙为我的孩子制作一个简单、美观的转盘,用来决定每天要进行哪些学习项目吗?具体要求:... 这是典型的 Devin 可以做的事情。我在需求中忽略了说明要直接在网页上运行的要求,但 Manus 默认会这样尝试。不过测试时 Manus 遇到了技术故障,只能提供源代码,我需要手动将代码复制到 IDE 中运行,甚至无法提供打包好的代码。 顺便说一下这个任务提给OpenAI Operator后,人家直接给我找了一个现成的网页... 也不是不行,我现在就是这么干的,就是广告有点多... 回放地址:https://manus.im/share/0eIcAXUlBMMrKG5Amy3ZOC?replay=1 数据采集 ❌ 到海关官网获取 2019 年 1 月至今中国各地区对各贸易伙伴的商品月度出口额 > Please go to the official website of China Customs to obtain the monthly export value of each region in China to each trade partner for each product from January 2019 to the present. > 请到中国海关官网获取2019年1月到今天为止中国每个地区对每个贸易伙伴在每种商品上的月度出口额 这是我的经济学家朋友交给研究生的任务。在提交给 Manus 时,我没有直接提供准确网址,所以增加了任务难度。Manus 找到海关总署的另一个网址开始了任务,由于该网址提供的数据不够完整,导致 Manus 获取的数据虽然准确但不够全面(它未能理解需要按地区、贸易伙伴、商品这三个维度同时拆分数据)。当我后来提供了正确的网址时,因预算已耗尽,任务只能中止。 回放地址:https://manus.im/share/Hr5cqi4oS2QOtNi63j3KkY?replay=1 🟢 下载乐高 9656 说明书 > Find and download instructions / handbooks for LEGL 9656 set > 寻找并下载乐高 9656 套装的说明书/手册 完成效果出色,远超人工效率。 因为这个套装较旧,在乐高官网搜索不到,而且说明书分为了十多个文件,我自己尝试时花了一个多小时仍然没有找到,最后是找人要了一份。Manus 一次给出正确的结果。 回放地址:https://manus.im/share/JuWNl1Zg3jxK3BRKb7J9th?replay=1 ❌ 清理公众号文章格式并去除广告 > Here are a list of articles, please fetch them and organize into well-formatted markdown files for me. Make sure you remove boilerplate content at the beginning and end of articles, and remove ads. Here are the first batch of URLs: … > 这里是一些文章,请帮我获取它们并整理成格式规范的 markdown 文件。请确保删除文章开头和结尾的固定格式内容,并移除广告。这是第一批网址:... 初看效果令人满意,但 LLM 过于勤奋,自行发挥做了许多额外工作,比如自行添加小标题。在审阅时我发现一段内容缺失了——原来是 Manus 误将其判定为广告删除(我的本意是只删除开头和结尾的明显广告,而保留文中植入的广告)。这说明 LLM 在处理需要严谨把控的工作时仍有困难。另外,由于 Token 消耗太快,在预算用完前只完成了两篇文章的处理,实用性不高。 回放地址:https://manus.im/share/dFDdKHMDXevU4EluB6u3i9?replay=1 🟡 收集几个 app 的官方图标 > Compile the latest official icon of these apps with resolution of at least 512px. Background should be transparent, bitmap (png preferred). If there is a single color version, use that. [List of apps] > 收集这些应用的最新官方图标,分辨率至少512像素。背景需要透明,位图格式(最好是png)。如果有单色版本的话,请使用单色版本。[应用列表] 在 8 个需求中正确完成了 4 个。一开始去一些素材库找,我明确要求从官网找。过程中帮忙输入了几次验证码。错误的结果中,一个混淆了 logo 和 icon,一个没有找到,另外 2 个不符合格式要求——提供了SVG格式的文件,而且 AI 仅是简单地将文件后缀改为 PNG,试图蒙混过关 回放地址:https://manus.im/share/3euKtS83CTIVMAn1FkNsVB?replay=1 文书处理 ❌ 比较编辑批注稿和原稿,标记差异 > I'll share a draft of an essay along with a corrected/marked version provided by my editor. I'd like you to highlight the changes in my original draft using markdown formatting. > 我会分享一篇文章的草稿以及编辑提供的修改/批注版本。我希望你能用markdown格式在我的原稿中标记出这些更改。 初始误解为需要总结差异,经澄清后虽然正确理解了任务要求,但仍无法完成。系统只能标记出少量改动,还错误地将一些未修改的内容标记为删除,且无法识别手绘批注符号(这确实较为困难)。此外,由于 Manus 无法直接访问我的电脑,我必须手动导出文稿后上传,这增加了额外的工作量。 (版权问题这个不放回放了)

00
doubleF
2月前
doubleF
2月前
00