即刻App年轻人的同好社区
下载
App内打开
Hugo功文
222关注53被关注0夸夸
1、是产品经理
2、特别喜欢喷产品经理
Hugo功文
2月前
不知道大家是否和我一样,会困在和他人的讨论中无法出来,尤其一场激烈的辩论后,持续几天仍在脑海里反刍应该如何抛出更有利的论据,如何更有力的回击,当然偶尔也会反思自己说的是否正确。

当我意识到这是一种内耗后,我会命令自己不要再去想这事了!可我管不住自己,尤其咽不下那口气。

而最近我突然从根源上解决了这个问题 —— 从思维框架上解决了。

接下来,我会建立一个思考顺序,尽力来重建我的「开悟」:

1. 在执着于为自己辩护时,我是否【二元化】的将观点标签化为「我的(正确)」vs「他人的(错误)」,这本质上是将自我价值与观点绑定。你看,我甚至没有将别人的观点再进行区分!而是一致性的将所有不同于我的声音归为了一类。

2. 随着认知和经验的丰富,就像软件版本迭代,v1.0 的你自然会否定 v0.8 的你,所有观点都是「特定时空下的产物」。对于未来的我而言,我当下维护的“我的观点”和所批判的”别人的观点“并无区别。

3.因此,所有的观点都有”归属“,无论多接近真理,也仍是特定身份的声音。我像是在俯视一个圆桌,桌上的每一个人代表了一种身份/经验/情绪,是他的背景,决定了他发出来不同的声音。当对方坚持某个观点时,可以问:「什么样的经历会让一个人形成这样的信念?」—— 这个问题能将对抗转化为探索。

经历以上三步之后,我可以平等对待不同声音了,也不再执着于运用怎么样的辩论技巧去驳倒对方。而是开始接纳一个事实:因为他是他,我是我,都没错。

终于,我看到了一切的关键:把所有的声音都收到同一个”匣子“里时,我便不再执着于要用我的牌去压到你的牌,我会看一下环境,然后:
- 继续出我的牌
- 也可以出你的牌
- 离开棋盘去喝杯茶
00
Hugo功文
2月前
在4o发布后,越发明显的看到cursor或trea windsurf ,都不是ai cording 的正确答案。
现在看这些工具就像是23年看SD:专业人士看不上,非专业人士用不了/没地方用。

但ai coding 的答案是像devin 一样的全自动工程师吗?

我并不怀疑在3年后,[用嘴写软件] 能否做得到,即使是再巨大的工程,只要没脱离射程,它就一定会出现。

我所怀疑的是它是否有必要出现?
我们真的需要那么多ai coder吗?
为什么要舍弃最优秀的团队提供的产品而去自己开发半成品?

因此我认为,像4o这样用嘴画图的体验即使可以在ai coding 上复现,但也全无必要。
那么问题来了,面相工程师所开发的产品形态应该长什么样子呢?
00
Hugo功文
3月前
忽然想做一个比较emotion的项目
10
Hugo功文
3月前
抛出一个观点,但老实承认我自己也不清楚是否正确:

起因是我在盘24年AI数据趋势时发现,角色扮演类的产品,在用户规模和增速上并不差,起码比PPT、编程、转音频这种纯粹的工具产品要好,但是讨论热度却不高(当然也可能受限于我个人的信息茧房)

然后我联想到GPT和deepseek的爆火,其实也并不是因为测评集中会强调的数学和通识能力,而是因为那种实打实的“真人感”。

所以我会想,当前应用去+AI时,是否往工具效率的偏太多了,假如就仅从基础交互层面加入LLM,提供更多的聊天、更私人化的聊天背景、更有深度更美丽的对话文字……即使产品自身边界没变化,但是用户与其连接却可以不断加深。
00
Hugo功文
3月前
LLM在小厂/独立应用的价值点在哪?

受限于人自己的能力有限,大语言模型在“传”不在“达”,纵然在不断优化预训练和COT(推理)的背景下,用户得到一个好答案的概率已经提升了很多,可是,然后呢?
最终交付的如果还只是一个答案,在很大程度上难以颠覆原有的工具价值。所以最近我看23年-24年的AI产品的沉浮录,越看越困惑,找不到小公司通过LLM能带来的什么爆发点。

当前LLM的能力边界被限制在语言的边界上了。

在现阶段,我会认为大语言模型在chatbot之外的应用价值,可能更像是一层“很美的交互界面”,不同于UI上那种视觉上的美,而是得到一个“很优秀的人在认真回复你的问题”那种心理层面的美。工具本身的能力边界暂时没有变化,但是用户与其连接却可以不断加深。
11
Hugo功文
4月前
这grok 3越狱后,也是可以聊正经话题的。
怎么说呢,像哥们喝大了,放开了说,聊得更舒坦了
00
Hugo功文
4月前
我想分享一个很冷门甚至有点邪门的AI模型测评方法,我会让AI批八字😅。。
批八字看似是玄学,其实是有很严谨的推理过程,非常考察逻辑能力的同时还要看它的知识面,相当于中文应用奥数题。
而且应该没有模型团队会针对八字做专门的强化学习,所以我觉得比数学评测集还公正些hhh
在拿着deepseek-R1、V3,还有其蒸馏的几个小参数模型都试了一圈后,回答质量差距很大,基本上能够验证之前有体感但没证据的一件事:R1的蒸馏模型,虽然数学评测集分数很高,但是在业务解决能力上并不出色。
我测试下来的结果是: R1>V3>GPT-4>R1的所有蒸馏模型。
00
Hugo功文
6月前
新学到个词叫做“职场击杀率”
最近这几年公司总在裁员,逢裁必裁我的项目组。
我真是已经杀疯了。
00