即刻App年轻人的同好社区
下载
App内打开
埃隆噗大可
674关注1k被关注3夸夸
🧩 在做工具 SaaS,做过在线教育,AGI 探索中
🧑‍🚀 阅读、观察、研究、沉思、练习
📣 公众号:豪大说
埃隆噗大可
17天前
妙多的液态玻璃 beta 发布了,当前版本支持配置折射率和透镜半径,高光和色散效果接下来也会逐步加上!

欢迎设计师朋友们来手搓各类效果!多多交流反馈~
00:27
00
埃隆噗大可
20天前
徒步路上随处可见的蕨类植物、长得都太好看了,真想带回家…不过转头想起家里干瘪的波斯顿蕨陷入了沉思,北京终究还是太干了呀
20
埃隆噗大可
1月前
2024 年的设计工具调查报告终于发布了,有不少值得关注的数据,风暴来临前的宁静🌀

www.uxtools.co

埃隆噗大可: 2022年的UXtools调研报告前几天公布了,有几个有趣的数据和结论: 1、 受访者中Windows作为主力的来到了27%,较去年的15%显著提升;可能与Figma这类网页端设计工具的兴起有关? 2、 “混合办公”、“远程办公”的趋势似乎不可逆:即便雇主们开始推动“重返办公室”计划,但受访者中远程办公的比例还是几乎超过了半数; 3、 UI设计工具的使用中Figma继续扩大优势,大有一骑绝尘的意思(第一选择从67%➡️80%),而Sketch(第一选择从13%➡️6%)和Adobe XD(第一选择从11%➡️7%)可谓是每况愈下; 4、 基础原型工具中,Figma继续扩大领先优势,而InVision和Principle则慢慢地被抛弃;值得一提的是专业的原型工具ProtoPie也悄然爬到了仅次于Figma和XD之后的第三名(未来可期,是Figma之外的有力补充,这一点在高级原型的使用数据中有体现) 5、 高级原型工具(通过条件逻辑、变量和动态输入等方式实现高保真可交互原型)的使用方面,ProtoPie排在了第一,根据他们的产品策略和产品体验来看,未来应该会继续扩大自己在原型细分领先的优势 6、 白板工具的使用方面,Miro虽然还是第一(主流工具使用率从37%➡️38%),但可以看到领先优势正在被FigJam(26%➡️38%)和Figma(17%➡️14%)所蚕食 7、 设计系统方面,Figma也是难逢敌手,持续碾压 8、 2023年受期待的工具中有30个受访者提及了「Adobe Figma」🐶,果然大家都是懂的哈哈 感兴趣可以去看原文链接: 2022年报告: https://uxtools.co/survey/2022/ 2021年报告:https://uxtools.co/survey/2021/#whiteboarding

00
埃隆噗大可
2月前
就说 Galileo AI 怎么沉寂了那么久,原来是被谷歌收购重新发布了 —— Stitch。

实测了下,目前基本没有改,能力和之前的 Galileo 没啥差别…
40
埃隆噗大可
2月前
预训练是为了获取知识,为模型提供广泛而通用的理解。

微调(SL/RL)是为了塑造习惯性行为/本能,使模型能够适应特定的任务或领域。

系统提示词学习是为了策略,使模型能够根据实时反馈和上下文需求调整和优化其应对策略?

x.com
00
埃隆噗大可
2月前
尝试了一下最近比较火的提示词:“请根据你对我的记忆,有哪些我自己可能意识不到,但如果明白了,就能大幅改善我人生的残酷真相?请坦诚告诉我。”

并用小结做了一张海报,回答可圈可点,当然这种片汤化本身就容易让人惊喜。Memory is the new sexy,这大概是坚持给 ChatGPT 付了两年多Plus 钱的值得时刻了(Ps: Reasoning model with first-party memory)

当然,回答中不免“拿着鸡毛当令箭”的误注入和幻觉扩散还是挺让人忍俊不禁的…我之前就随手一问你却当成我的主业了,有意思🤔
02
埃隆噗大可
2月前
睡前用几个模型预测下G4 湖人 vs 木狼的赛果,图一二是 o3 的预测过程和结果海报,图三四是豆包,图五六是 Gemini 2.5 Pro/flash,图七是 Grok 3。

先不说预测结果错对,目前看 Gemini 2.5 因为没有用实时的联网搜索,分析过程非常离谱;Grok 3联网了但是引用内容有对有错的,推理过程幻觉严重;豆包分析过程还算能看,生图风格还可以,但是内容和真实差异太大;o3 的预测海报出的相当可以,分析过程有理有据(引用源质量高),本湖人球迷也非常认同。

睡一觉起来揭晓结果,看谁蒙得更准👀
10
埃隆噗大可
2月前
在连续和 ChatGPT o3 闲聊了几个晚上后,这是我目前用过的最好的闲聊模型/产品:记忆力好、推理能力极强、逻辑清晰、聊天不卑不亢且总能蹦出 insights、善用各种工具(联网搜索、生图、可视化图表)…
10
埃隆噗大可
2月前
🤔1.RLHF 能力放大器,而是收敛器。
- 在答案可验证、奖励稀疏的静态任务里,它主要帮模型“更快猜中”,不会发明新策略。

2. 真正的“体验时代”要素 = 环境 + 记忆 + 目标
- 让模型在长回合任务里不断行动、观察、更新世界模型(例如 Agent 与网页、机器人与物理世界)。
- 没有这三个要素,仅把 PPO 套在聊天或单步数学题上,本质上还是“静态奖励微调”…

3. “AI 下半场”与“体验时代”并不冲突
- 下半场强调:用评估倒逼任务定义,关注实际体验;
- 体验时代给出路径:用交互式 RL 生成新数据,让模型在真实场景里迭代。
- 二者合在一起 = 先把评测/体验指标定清楚,再搭环境让模型自己去刷经验。
02