即刻App年轻人的同好社区
下载
App内打开
卡尔李CarlLee
540关注391被关注0夸夸
❤️把我对世界的误解说给你听
🤖提示词工程/AI agent开发
|INTJ|人工智能/商业/营销/心理学/科技/电子产品/美剧/文化|
置顶
卡尔李CarlLee
26天前
如果把大模型比作外星人,你就知道“提示词”为何永生

最近总有人说:“模型越来越聪明,提示词没用了。”

每次看到这种话,我脑中就浮现一个场景:我们刚捕获了一个会说人类语言的智慧“外星人”。现在,该怎么研究它?

➡️ 方案A(解剖学): 直接把它送上手术台,打开头盖骨,分析它的神经回路。这很硬核,但我们大概率看不懂,而且随着外星人越来越高级,内部结构只会更复杂。

➡️ 方案B(行为学): 和它对话,给它出题,跟它玩牌,观察它的反应、情绪和逻辑。通过它最擅长的“语言”来了解它的心智。

你觉得哪种方法更能发现它隐藏的智慧和能力?

显然,两种方法都重要,但B方案往往是发现突破的起点。
在AI领域,方案A叫“机制性可解释性”,方案B就是我们说的“提示词”。

芝加哥大学的最新研究《Prompting as Scientific Inquiry》完美论证了这一点。它告诉我们,唱衰提示词,是因为没看懂这三件事:

1️⃣提示词正在从“巫术”进化为“科学”: 过去我们试“咒语”,像巫师一样碰运气,这叫“提示词工程”。未来我们设计实验、验证假设,像心理学家一样研究模型,这叫“提示词科学” 。模型越高级,越需要科学家,而不是巫师。

2️⃣所有惊人能力,都先从“对话”中来: 论文提到,“思维链”这个让模型学会推理的巨大飞跃,最初就是有人在对话框里加了一句“让我们一步一步地思考” 。我们不是先解剖了模型,才知道它能推理;而是先通过对话发现了迹象。

3️⃣模型的“脾气古怪”,恰是研究的宝藏: 很多人抱怨模型对提示词太敏感,像个脾气古怪的天才。但论文说,这种“敏感”或“脆弱”正是研究的切入点 。通过观察它在什么情况下会“炸毛”或“犯傻”,我们才能精确了解它的能力边界,才能放心地把它用在关键任务上。

所以,别再担心提示词会过时了。只要AI还是一个我们无法完全看透的“黑箱”,那么通过语言和它打交道,就永远是探索其未知领域最前沿、最高效的科学方法。简单的“命令”会被淘汰,但深度的“对话”和“探究”将永存。
40
卡尔李CarlLee
09:22
00
卡尔李CarlLee
1天前
珠海国际赛车场是中国第一座符合国际汽联一级方程式赛道标准的赛车场🏎
19​96年国际汽联计划将珠海纳入1999年赛历,然而因为各种因素,F1主办权最终落入上海。
20
卡尔李CarlLee
2天前
感觉把台积电换成某些国内大厂的名字,这篇文章也成立

阑夕ོ: 一个美国工程师在Reddit分享了他在台积电亚利桑那工厂干了4年后的体验,全是吐槽哈哈哈: * 这座工厂是美国重振制造业的推动结果,享受了不少补贴,我之前也翻译过文章,讲述在这座工厂里产生的文化矛盾。 简单介绍一下背景,我是在2021年拿到offer的,当年夏天就去了台湾培训,是最早从美国派去的一批人。我不想说太多细节,但那真是一场彻底的灾难,他们多次更改航班日期,发给我们的笔记本电脑根本不能用,关于宿舍的大小也撒了谎……总之,我把这些当成疫情期间的特殊情况,算了。 然后我们到了台南,依然很是糟糕,他们没有做好培训计划,几乎没有会说英语的人,对我们这批新员工,他们根本不怎么搭理,私下里说「美国人工资太高,我们不配教他们。」 经过几年在台湾的「培训」,20%的人因为工作条件的恶劣而选择辞职,而我们这些忍受下来的人终于回到了亚利桑那州。显然,一个新的晶圆厂肯定会出问题,但台积电永远会让所有问题变得更加严重。 施工进度落后,因为他们根本没有任何计划。因为觉得亚利桑那州的工人能力不足,他们总会从台湾派人过来收拾残局,甚至让我们进入没有许可资格的设施工作,将我们暴露在不合规的危险环境中,而当我们为了安全表示拒绝后,他们则以年底会在绩效上打差评来做回应。 在经历了这一切之后,我想,好吧,那只是其他地区的公司来美国建厂时必然遭遇的阵痛,一定会有好转的,对吧……错了,情况变得越来越糟。和我同期入职的员工大约有70%都跑路了,所以我们必须不断的培训新员工,而且,我后来联系过一些离职员工,他们都告诉我,换了公司之后明显改善了自己的处境。 在台积电亚利桑那工厂,所有的项目都来自台湾的「母厂」,无论如何都要遵守,完全不考虑逻辑或理由。因此,不存在任何的创新空间,更不需要员工思考什么,工作就是每天按时到岗,然后被告知今天要做什么,计划不断变更,修正,严重落后,然后反复循环。 我曾参与过所在项目组的实习生/新员工面试(我猜是因为英语是我的第一语言),而面试前他们给我准备的「指导意见」非常恶心。 我被要求优先考虑来自台湾地区的求职者,其次就是持有签证的人,因为「这些人更容易被控制」,他们不想雇佣没有移民限制的美国人,因为他们一言不合就会辞职,所以「绿卡」才是迫使员工长久工作下去的胡萝卜。我还被告知不要雇佣印度人,他们鄙夷的称呼印度求职者为「PhD People」。 我面试过两名最后拿到offer的求职者,我的老板后来对我说,这两个人在面试前就确定要进来了,他们有内部关系,面试只是走个形式,我tm……我理解「关系重于能力」的潜规则,但裙带现象如此严重,还是超出了我的想象。 我还被告知在面试里要打足预防针,强调「台湾式的工作文化」,换句话说,就是你每天都会挨骂,还得完成不可能的截止期限,因为你的同事随时都会变少,流失率太高了。 每天上班也是一场噩梦,他们期望你把全部的生命都奉献给工作。我的岗位是年薪制,然而不管工作多长时间,薪水都是一样的,哪怕经常要加班到晚上9点,我还有一些同事日均工作14-16个小时……这甚至都算正常的。 如果不忙的话,大多数人会在晚上8点左右下班,然而管理层会故意在下午4-5点布置「紧急」且「明天早上就要讨论」的任务,这意味着我们必须加班完成。 工作文化本身也很让人心累,台湾地区来的人有50%的收入来自奖金,这个奖金除了受到绩效影响,更让工作变得像是一场人际关系的比赛,更重要的是看你犯错多少。所以,如果你处在一个一半以上的收入取决于不能犯错的环境里,你的首选态度必然是回避任何多余的事情,对吧? 这正是大多数人的选择。所以,如果在工作时你想求助于同事,他们要么视而不见,要么把你推给别人,因为如果介入了你的工作,他们就得承担新的责任。这造成了一种非常冷漠的风气,没有团队合作,没有相互帮助,于是效率变得更加惨不忍睹。 台湾人很重视台积电,认为加入这家公司是这辈子的荣耀,我很尊重这一点,但我不是台湾人,我乐意把工作做好,学习新东西,但我不会把命卖给公司,而大多数台湾地区的员工会。他们把工作视为生活中第一且唯一的事情,家庭是次要的,我无法理解,我是为了生活而工作,为什么他们能够为了工作而生活? 台湾人似乎很喜欢歧视别人,我听到过他们嘲笑别人的口音、外貌和残疾,他们通常会用中文这么交流,但因为我在培训期间学了不少中文,所以能听懂他们在说什么。工作场合像是高中那样,每个人都有自己的八卦圈子,因为没有外部生活,内部员工之间的恋爱很常见。 我在台湾培训时,有个新入职的女孩,面试她的经理把她的Facebook照片发到群里,让大家打分。她被录用后,因为体重的增加,看上去和照片上的不太一样,有一个男员工对她喊道「哇,我没想到你这么胖」,然后跑到一边和朋友们一起笑,她在那哭了一整天,然后请了两天假……你很难想象这是成年人会做的事情。 你们可能会问,那么在台积电工作的好处是什么?我相信大多数员工都会说两个优点,而我则对这两个优点持有保留意见。 1、他们不裁员。这是真的,我从来没见过有人被裁。实际上在台积电被开除几乎是不可能的——除非造成了非常严重的事故——所以你可能觉得这很友好,工作有保障,可以一辈子干下去。虽然确实不用担心被裁,但这也导致了一个质量很低的员工群体。想象一下,你在一个保留了所有最差员工的地方工作,优秀的人会被提拔出这个团队,而最差的那群人却抱在了一起。所以你进入这样的团队之后,就不得不额外努力来弥补他们的不足。但如果你找到了一个不错的团队并能忍受下去,那么恭喜你,你确实得到了一个铁饭碗。我的老板在工作期间说过这么一句话:「台积电不裁员,有需要时,他们只会逼你辞职。」 2、薪资。是的,台积电的薪水的确很高。他们会故意开一个市场价略高的待遇来吸引你,但工作几年之后,你会发现涨薪速度低于行业,很快就会低于市场。不过这可能是工程师这个职业的普遍问题,跳槽永远是涨薪的最好办法。举个例子,今年我离职后,新工作涨了30%的薪水。所以你要知道,当下的工资看起来不错,不意味着它会一直不错。另外,台积电的薪资高是有原因的,他们期望你付出更多。这是一个与魔鬼交易的局面,如果你比竞争对手多拿10%的薪水,但工作量多了50%,那么扪心自问,你真的赚得更多吗? 我想给其他对台积电的工作有兴趣的人一个建议:我觉得他们的实习项目相对很好,有助于丰富简历,薪水可观,而且有明确的结束时间,这是最好的部分,他们确实会故意对实习生很好,不给实习生太大的压力(这是我带实习生时来自老板的直接指示)。 所以你们要知道,如果决定成为全职员工,压力和工作量会大幅增加,眼前的求职市场不太景气,如果你刚毕业、急需一份工作的话,台积电可以是一个不错的起点,尤其对于那些单身、没有家庭和其他责任的年轻人来说,你们可以赚到不错的收入,积累一些经验,然后再换工作。 如果你已经有丰富的就业经验了,那么我建议你还是避开台积电,因为你来了就会觉得是在坐牢——不能用手机、全天被监控、开会时被当成小孩,等等——另外,如果你申请时看到类似「我们正在扩张招聘」这样的字眼,其实非常具有误导性。他们确实一直在扩张和建造更多的晶圆厂,但大约90%的职位空缺,实际上是因为有人离职了,而员工流动率非常高。 作为最后的说明,这只是我的个人经历,所以像互联网上的所有信息一样,请带着怀疑的态度看待。我相信确实有人喜欢在那里工作(我从没遇到过,但他们肯定存在,对吧?),并且没有我经历的那些问题。那里并非全是糟糕和可怕,只是我觉得那不是一个能促进我职业发展或心理健康的地方,所以我选择离开了。 source:r/Semiconductors/comments/1m96m4f/my_experience_working_at_tsmc_arizona_for_4_years

00
卡尔李CarlLee
2天前
国家网信办透露,中国人工智能(AI)应用发展迅速,个人用户注册的大模型应用数量已超31亿。AI服务覆盖网页、移动应用、API接口等,反映了人们对智能化服务的依赖。

2023年,中国基础大模型迭代加速,全球已发布3755个大模型,中国企业贡献1509个,占比40%,位居世界第一。

截至今年3月,中国已有346款生成式AI服务完成备案,6月用户问答比例达80.9%。预计2024年,中国人工智能产业规模将突破7000亿元,保持20%以上增长率。
10
卡尔李CarlLee
2天前
这个不一定的,训练模型的公司也不是傻的,他们不会拿贴吧和头条的语料训练模型,他们获得语料的渠道很多,也可以买。
字节的人就明确说过他们不会拿头条内容训练模型(但是网上很多AI降智内容恰恰是豆包生成)
包括手握X的Grok,也没有或者不敢拿X上面的信息训练,因为太多极端言论,单单是Grok4出来后别人测试出引用了马斯克的X言论就被人诟病。

所以如果模型公司拿简中互联网语料喂模型并且被测出来(很容易),那这家模型的信誉会受到严重打击。

王铮Silvia: 因为《特朗普爱上在白宫当保洁的我》被主流媒体转载后耍了全网,有AI用户吐槽由于中文内容环境不佳,如果大模型没有批判性思维就没有使用价值……这种说法虽然有点尖锐,不过我觉得是个好问题,不知道大家怎么看?

00
卡尔李CarlLee
3天前
未经审视的人生不值得过,
但是过分审视的人生只会生不如死

我们既要对自己产生充分的觉知,
又不能过分与之纠缠,
精神上的问题不一定能用思考解决,
解决之道可能在外面,
也可能只是时间问题
00
卡尔李CarlLee
3天前
谷歌前 CEO 说,2025年内AI 实现从短期记忆到拥有永久记忆。5年内实现千步推理。
00
卡尔李CarlLee
4天前
分享一个vibe coding经验⬇️

使用 TRAE 完成了第一个可以实现的小应用工具,整个过程其实挺痛苦,最后我让 AI 帮我做了一个总结:
帮我梳理我提过哪些 bug,后面为什么解决了,代码有哪些变化……
这个复盘就可以帮助我下一次做同类应用的时候避坑。在下一次工作的时候可以作为背景。
我自己的总结还是上下文提供的不足,导致“我不知道它不知道”“它不知道我知道”,在这里耗费了很多时间。
50
卡尔李CarlLee
4天前
我用 genspark agent 模式帮我分析了一个有300多条小红书笔记数据的表格,输出分析结果。整个过程它自己写代码,做数据清晰,输出数据图表,生成文字报告,速度很快,一气呵成。效果还是挺不错的⬇️
00
卡尔李CarlLee
4天前
你们知道AI训练数据都从哪儿来吗?🤔 麻省理工科技评论最新报告揭示了一个惊人真相:AI数据正被少数科技巨头掌控! 😱

这项研究由学术界和产业界的50多名研究人员发起的数据溯源计划(Data Provenance Initiative)主导,他们深入分析了近4000个公共数据集,旨在摸清AI数据的“家底”。

以往数据来源多样,百科、财报、天气报告,百花齐放。但自从2017年Transformer架构出现,AI模型和数据集越来越大,互联网抓取成了主流!🌐 现在,大部分AI数据都来自网上,特别是视频数据,YouTube一家独大!这就意味着,Google在AI数据上拥有巨大优势,这公平吗?⚖️

更令人担忧的是,AI公司普遍不公开数据来源,甚至自己都搞不清。😵 这导致:

难以确保数据版权合规。
数据许可限制可能被忽略。
独家数据协议让小公司和研究者望尘莫及。

而且,AI训练数据还有严重的地域偏见!🌍 超过90%的数据来自欧美,非洲不足4%!这意味着AI可能只反映了“西方世界观”,忽略了全球的多样性。婚礼场景只知道西式?这可不行!👰‍♀️🤵‍♂️

AI的未来,不能只掌握在少数人手中,也不能只反映片面的世界。 我们需要更多元、透明的数据来源,才能构建真正普惠、公平的AI!💪 #AI数据 #数据霸权 #科技巨头 #AI偏见 #数据透明
00