即刻App年轻人的同好社区
下载
App内打开
Allen仍将梭哈XR
561关注6k被关注12夸夸
XR+AI 应用创业失败 暂时打工
前腾讯 XR、抖音商业化产品
相信 XR 与 AI 会改变世界
欢迎加微信 allenxiang888
置顶
Allen仍将梭哈XR
4年前
MR+AI 互动娱乐应用融资创业了两年,失败后一直在找更多人交流【信息与效率】,欢迎各位加我微信聊聊天 allenxiang888

也欢迎对虚拟与混合现实感兴趣的朋友,来逛逛我的博客:【Allen在XR大道上的探索-Blog】

https://ps4zaq9q3u.feishu.cn/wiki/wikcnL00yQXFhAlalTxL0NZsU1d

3439
Allen仍将梭哈XR
5天前
在相似的形态下,我觉得唯一能活下来就看谁做到了:取代你的下一台 MacbookAir&ipad。

取舍关键差异在我看来只有两个点:
1、屏幕与价格的平衡,我觉得 3.5k 屏才是底线,4k 刚好,5k 多余,meta 2.5k 屏可能会暴雷。
2、小圈子社交与办公生态完善度,要是串流投屏,安卓应用兼容,Chrome 网页办公,多人开会体验这些都没做好,就没法形成长期口碑留存。

1个鹿: 今天看到有文章更详细地曝光了PICO 下一代头显Swan(天鹅)的信息。在行业内也是公开的秘密,今天就来和大家聊聊三款最值得关注的MR头显:PICO 的 Swan、Meta Phoenix(puffin),三星的 Moohan。 分体式是轻量化是出路吗? PICO 和 Meta 都搞起了分体式设计,运算单元与电池集成于一个“计算模块”,头显会降低到 200g 以内。 减轻头部负担是提升用户舒适度的关键,亦是 MR 从“体验性”产品向“日常化”设备演进的必要条件。 这种思路也可以在 PCVR 上看到,可以看我之前分享的笔记《如果 Vision Pro 比 iPhone 还轻》 新芯片实现低延迟 在 MR 领域,无论是空间定位与映射(SLAM),还是视频透视(VST),任何微小的延迟都可能破坏沉浸感。 PICO 正研发专用芯片,推测 Meta 也类似。毕竟,将计算能力近眼化,需要专用芯片的定制优化。MTP 是衡量 MR 体验的关键指标,而自研芯片正是缩短这一延迟的有效途径。 XREAL X1 开了 XR 行业做芯片的先河,虽然只是 3DoF,也让人感慨这个产品门槛真高。 统一渲染的无缝体验 VisionOS 的问世,为 MR 生态树立了标杆。其统一渲染引擎所提供的无缝体验,至今仍像一把达摩克利斯之剑,悬于其他 MR 平台之上。 要实现类似的效果,技术挑战外,更是艰难的生态构建。谁能为开发者提供更优越的工具,谁能吸引更多高质量的应用,谁才能最终赢得用户青睐。 分辨率多高才算够用? 苹果与三星均选择了单眼 4K。然而,我个人倾向于认为 2.5K 40 PPD,对于观影、游戏及轻办公场景已然足够。过高的分辨率不仅意味着更高的计算负荷与制造成本,其对实际体验的提升也可能并非线性。PICO 在其产品选型上或许正瞄准这一平衡点。 Meta 的两条产品线 Phoenix 预计于 2027 年发布,这一时间节点 Orion 消费者版本临近。Phoenix 的 MR 形态与 Orion 的 AR 眼镜,未来是会融合,形成统一的 AR/MR 平台?抑或是会划清界限,分别服务于特定应用场景?这是一个值得深入探讨的问题。 巨头的保守尝试 三款产品中,三星和 Google 合作的 Moohan 是最「无趣」的,和 VisionPro 几乎一样的产品定义也会有一样的佩戴问题,而且芯片、系统、生态上的弱势让他们的综合体验必然远低于前者,更像是试水的合作。类似产品定义的头显还有来自中国的玩出梦想MR 和 Vivo Vision,尤其是玩出梦想MR 的头显根据我的体验,完成度非常高。

00
Allen仍将梭哈XR
1月前
我发自内心的真诚的认为,我直到现在还没有找到那个我最感兴趣的,属于时代的关键问题是什么。我只知道模糊在了一个泛C应用的赛道,可能是信息流动,也可能是内容加工,可就算找到了,很有可能时代目前也缺了一些关键的低成本前置技术。

但任何事情想要做的正确,必然是一个需要长久有耐心的难题,在不知道最终题目之前,还是可以认真再多刷一些模拟题的,写写答案先练手。
122
Allen仍将梭哈XR
1月前
每个时代的驱动马达主题可能都是「连接」,上上个时代是工具与网站连接,上个时代是社交生活与内容推荐连接,这个时代的AI要为人类需求连接什么服务?连接的马达是什么?Agent不够具象化,到底如何把Context、SystemPrompt、Plugin、Action、Feedback等等转子线圈都组装起来,如何把技术与需求整合连接成“应用技术”,以及用在哪个赛道是最有效的,这是我想寻找的事情,或许也是智能最大的应用场景。

目前用户功能生态过于反API化(网页人机验证门槛高,交互APP化的问题),如何打破现状可能会是让我们的社会走向新便捷高度的方式。我有好多想研究清楚的问题,比如:

- 在解决了支付安全和信息隐私的前提下,Agent到底能不能取代我的滴滴和美团,Agent交互需要新硬件/OS吗?

- 兴趣社交信息和目的社交信息,能否被LLM高效分类管理,社交信息分发是否需要Agent作为推荐引擎?

- 人与人之间的沟通能否因为Agent的存在而更加高效,Agent能不能成为更好的小区业主群会长和行动代理人?

- 超长上下文的Context场景理解力和超长记忆RAG回溯细节大海捞针,究竟要靠技术解决还是要靠架构设计革新?

- 有没有可能存在一个AI和人类共同维护共同可见的高质量Context流动知识库,包含世界上一切有价值的信息?
00
Allen仍将梭哈XR
1月前
两年的创业真正划上了句号,账上剩下的钱也按比例退回了,发自内心的感谢所有投资人彼时和此刻信任,以及创业的兄弟们的支持。
​商业与时代的残酷狠狠鞭笞了我的各种 ego,但我还是希望未来能再次给予大家悦耳的回响。
152
Allen仍将梭哈XR
1月前
愈发的感受到了 AI 在全行业落地的局限性。
只有 LLM 的智能快合格了,相当于猿人拥有了高智商大脑,而 VLM DiT 的人类常识理解力缺失,相当于这个聪明猿人还只是个盲人,也不会写字。

​这两个技术如果有了突破,那么像之前 4o的看懂心肺器官 CT 片,并且能够画出轮廓图的 case,有逻辑的圈圈点点,那就无敌了。
21
Allen仍将梭哈XR
2月前
社交媒体为什么一直在演化?

我觉得是社交产品里还没有实现真正的实现个性化。如果有产品做到了,所有社交产品有没有可能固化成三类或三个?纯私域熟人im通讯,纯公域内容分发,半熟人排列组合人群&工具&内容。

LLM和Agent出来之后,第三类应该有产品形态最优解最优解,因为人群可以被AI理解和归类,工具可以被Agent智能调用,内容分发已经被机器学习证明过可行性了。进而未来就不会再有Bereal/Twitter/Discord等新产品形态出现了,因为人群和社交模式的颗粒度都可以被拆解排列重组后,千人千面的提供给每个人。

且这种产品容器,本身就是:1-圈层流动性的土壤,2-社交内容的最高效分发底层,3-工具与玩法的自适应分发的平台。如果有了更加自更新的能力(AI)后,理论上未来将不再会被颠覆。

微信现在就有这样的影子:1-微信群的新建与折叠,2-视频号的社交公域转发,3-微信小程序的系统权限。但现在微信光有这样的影子,还不够适应AI时代的“自由”。

社交产品目前有两个痛点没被解决好:半熟人关系链维护效率低,和社交的衍生内容信息流动效率不够高。
社交关系链在微信群和QQ群中流动性过强,发现新圈子的社交路径过长,老圈子的自然存活时间又不长,历史上加过的老圈子又会造成垃圾信息泛滥阅读管理成本高,社交注意力被频繁拉扯。

社交衍生内容过于极致的在卷内容本身,无论单双列的容器都对内容本身的质量有太高要求和模板范式,社交和内容的主次关系太固化了,内容评论区和弹幕里的个体只能通过共鸣得到很模糊的圈层认同感。

纯内容社区产品和纯im熟人通讯工具不是痛点,目前既有产品都满足的很好,但兴趣社交和需求社交不是这样,兴趣爱好群,小区公告群,行业交流群等既有明确信息目的,又有半熟人圈层认同目的,还有内容消费目的的社交产品而言,微信群和贴吧对于这些半熟人社交关系的处理却是两个极端,都没处理的很好,对纯内容性产品的兼容与社交流通性也砌高墙。

如果AI时代的产品形态来解决这个问题:LLMcontext理解➕mcp信息沟通与交易闭环➕auto Agent tool use/AI coding垂直需求功能实现➕im/feed流的个性化身份平衡社交内容与社交交流。

有可能就可以让AI来管理自己的社交关系链➕社交内容,用户留下的是自己对“眼熟人名”的信任和“tag身份”的认同,还有丰富的“挑选信息/吸收信息/收藏信息”的context知识库大脑。

那么这个形态应该可以吃点80%的微信时长(非熟人群➕朋友圈),留下泾渭分明的定位切割是,微信只用来跟熟人聊天,内容产品只用来刺激多巴胺,而社会意义的关系链和朋友圈,都用这个新形态的产品来交流。
如果非要类比的话,我觉得更像是推特➕Discord➕动态拼装无数tag/Groups➕个性化推荐feed。

对应的Agent需要新时代的OS才能真正释放权限上的潜力,手机和XR眼镜如果有更AI native OS 后,这样的社交产品形态一定会出现,但现在在手机有限的生态空间里,这个命题作文似乎也有局部解题思路。
82
Allen仍将梭哈XR
2月前
视频就是目前通用意义上最好的载体,为什么,信息维度覆盖周全且基础信息量还可以,而且好理解,离用户心智近,所以做离视频近的AI产品目前也都更赚钱,且ARR体量更大。

相对应的,AI coding和Agent才是资本组局形态的垄断工具,不是水电煤的费用在社会主义国家可以很便宜,在战乱和资本主义国家可以很贵,nocode这样的工具无论如何演进,它就像一把做事情的武器,总会被一小撮更聪明的人加速迭代的用起来,磨的比另一批的大多数人更锋利,整体是倾向于内卷和熵减的残酷。

AI内容范式的新工作流如果真拆明白了,那不仅仅是视频制作的美观和效率问题了,是真的能有“改故事”和“与故事互动”的能力了,虽然精神鸦片不好,但人类社会历史总有这种文娱精神消费产物的存在必要之处,且通常来说是对人类社会文化产生关键影响力的媒介,媒介用的好,是四书五经和辩证思想启蒙,媒介用的不好才是玩物丧志破坏社会良俗。
00
Allen仍将梭哈XR
2月前
这 4 个形态总结很精辟 hhh,除了 PICO 的形态有点大而全的重度场景,其他三个落到需求上我觉得都可以归类为「信息助理」,既然是助理,那就是不助也能自己上,不是不可或缺的东西,那销量就不会是爆炸式的增长,而是渐进式的。 //@1个鹿: 先等待一个让大家愿意佩戴的、有自己的核心场景的、厂商也不赔本赚吆喝的 XR 产品。
候选:
1. Apple 的 AR 眼镜
2. Meta 的带屏 AI 眼镜
3. PICO 的分体 MR
4. 大模型公司深度定制的多模态 AI 眼镜

Allen仍将梭哈XR: XR场景究竟有多大? 又到了周期性触发的时间点来纠结这个问题了,虽然最近几个月在搞完全跟XR无关的AI,但还是会从朋友那里听到XR的各种声音和讨论。 比如谷歌IO大会的眼镜、比如昨晚刚发布的雷鸟一系列新品,BB产品继续下探价格底线,AI眼镜产品继续出slim款细分用户,AR眼镜产品开始尝试新的技术组合方案(第一次用上自研Xcube光机配合JBD的MicroLED屏),行业有我没我都在稳步前行,现在缺的就是硬件的进步,软件产品能干的事情确实有限。 两周前Quest开放了VST视频访问权限,VisionOS 3也宣布会公开VST视频访问权限,且支持端到端视觉模型理解环境。停止XR创业状态后再看这两件事,才能旁观者清的意识到VST权限根本不是什么“重要节点”,一切体验都受制于硬件本身的形态,Twitter上那些demo也都将一直停在只是demo的状态无法规模化toC见用户,现在做游戏和体验仍然是Quest生态在这个时间点最合理的事情,not app。 刚刚听了下AK的这个采访,感慨良多:对话雷鸟创新CEO:X3 Pro才是真的遥遥领先「SIGNOW」_哔哩哔哩_bilibili。 相比于有些超前科幻但模糊不清的场景,在当下这个教育市场的阶段,体验还没发酵,售前参数更关键,有性价比就是王道。 明年可能才是真正的XR关键技术变革年,除了21年的Quest2销量暴涨以外,之前的几年都有点“纯技术突破”的意思,离用户都有挺远的距离,消息仍只在小圈子内流转。明年关键的技术点有这三个: 1.分体算力终于成为共识,AVP日活用户普遍选择开放式头戴来缓解重量和余光VST的体验,成为了最后push一把的动力,PICO和苹果的估计还得再憋一憋,而万有引力和Meta将先声夺人,看看供应链上千万的订单赌注,最后究竟是唬人还是真能解决需求,只要先有了分体,颈环成为下一步共识就不远了; 2.单色光波导有机会开始量产了,整机成本低至500元以下,且重量控制的非常不错,显示带来的这一点点交互feedback,在经过产品经理对垂直场景的打磨后,会比现在干巴巴的AI眼镜要生动很多; 3.明年AI辅助视频转3D,或者高斯3D/4D可能有些学术界的突破,让3D观看体验和渲染效率有巨大飞跃,可能可以看到XR娱乐内容的新变量与新机遇。 在这些技术成熟度和硬件工程形态的限制下,量产产品能cover多大的场景,才能摆脱地心引力一飞冲天呢?算了,不想这个了,我去看《悉达多》解脱下自己,搞XR的哪有不疯的。

00
Allen仍将梭哈XR
2月前
XR场景究竟有多大?

又到了周期性触发的时间点来纠结这个问题了,虽然最近几个月在搞完全跟XR无关的AI,但还是会从朋友那里听到XR的各种声音和讨论。

比如谷歌IO大会的眼镜、比如昨晚刚发布的雷鸟一系列新品,BB产品继续下探价格底线,AI眼镜产品继续出slim款细分用户,AR眼镜产品开始尝试新的技术组合方案(第一次用上自研Xcube光机配合JBD的MicroLED屏),行业有我没我都在稳步前行,现在缺的就是硬件的进步,软件产品能干的事情确实有限。

两周前Quest开放了VST视频访问权限,VisionOS 3也宣布会公开VST视频访问权限,且支持端到端视觉模型理解环境。停止XR创业状态后再看这两件事,才能旁观者清的意识到VST权限根本不是什么“重要节点”,一切体验都受制于硬件本身的形态,Twitter上那些demo也都将一直停在只是demo的状态无法规模化toC见用户,现在做游戏和体验仍然是Quest生态在这个时间点最合理的事情,not app。

刚刚听了下AK的这个采访,感慨良多:对话雷鸟创新CEO:X3 Pro才是真的遥遥领先「SIGNOW」_哔哩哔哩_bilibili。

相比于有些超前科幻但模糊不清的场景,在当下这个教育市场的阶段,体验还没发酵,售前参数更关键,有性价比就是王道。

明年可能才是真正的XR关键技术变革年,除了21年的Quest2销量暴涨以外,之前的几年都有点“纯技术突破”的意思,离用户都有挺远的距离,消息仍只在小圈子内流转。明年关键的技术点有这三个:

1.分体算力终于成为共识,AVP日活用户普遍选择开放式头戴来缓解重量和余光VST的体验,成为了最后push一把的动力,PICO和苹果的估计还得再憋一憋,而万有引力和Meta将先声夺人,看看供应链上千万的订单赌注,最后究竟是唬人还是真能解决需求,只要先有了分体,颈环成为下一步共识就不远了;

2.单色光波导有机会开始量产了,整机成本低至500元以下,且重量控制的非常不错,显示带来的这一点点交互feedback,在经过产品经理对垂直场景的打磨后,会比现在干巴巴的AI眼镜要生动很多;

3.明年AI辅助视频转3D,或者高斯3D/4D可能有些学术界的突破,让3D观看体验和渲染效率有巨大飞跃,可能可以看到XR娱乐内容的新变量与新机遇。

在这些技术成熟度和硬件工程形态的限制下,量产产品能cover多大的场景,才能摆脱地心引力一飞冲天呢?算了,不想这个了,我去看《悉达多》解脱下自己,搞XR的哪有不疯的。
125
Allen仍将梭哈XR
2月前
最后一句已经点名方向了,分体颈环,启动!

1个鹿: 2025 年,不温不火的 MR 领域中,轻量化高清显示器作为新的趋势正在酝酿。 将 Vision Pro 的显示效果保留,对着 Soc、传感器、电池砍几刀,直到把重量砍到 200g 以内,一个可以「长时间配置」的合理重量。 Bigscreen Beyond 2 系列采用 Pancake 光学和 2.5K 的 Micro-OLED 显示技术,视野范围增加到 116 度,重量降至 107 克,成为市场上最轻薄的 PC VR 头显。歌尔 XEO BIG 拥有单目 4K 的显示屏,机身重量控制在 189g,还支持 6DoF 追踪。小派最新发布的 DreamAir,单眼 4K+内向外 SLAM+手势和眼动追踪,重量不到 180g,参数非常漂亮。 这产品可以理解为 1. 对于 PCVR 的供应链刷新:HTC Vive、Valve Index 都垂垂老矣,随着 Pancake 和 MicroOLED 技术被一体机 VR 催熟,PCVR 也终于享受到了轻量化的体验。 2. 对于 Apple Vision Pro 佩戴舒适度问题的纠偏:精致的外观、细腻的显示、沉浸的内容都无法拯救顶着 600g 重量的 Vision Pro 用户,保留其高清显示这个最关键的特性,砍掉其他功能换取舒适的佩戴。 所以,对于还在坚持 PCVR 的硬核玩家来说,这类产品具有充足的吸引力,譬如 Bigscreen 一代兼容 Value 的基站和手柄,可以让他们无缝更新装备。 但这终究只是一个老市场,对于一体机/移动设备来说呢?轻量化高清显示器的意义可能是通往下一代设备——分体式设备。

00