即刻App年轻人的同好社区
下载
App内打开
AI_Native_Vito
128关注46被关注0夸夸
00后,SUFE,ENTP,VCer,AI Native,Start Up
AI_Native_Vito
7天前
GPT OSS 开源的精准卡位:
​- 大杯总参数量120B, 刚好可以放在一张H100上。比qwen的235B和deepseek的671B等需要几张卡的更好部署,智谱 kimi minimax的大杯等也都是几百B,卡了一个很舒服的位置,对开源模型使用者来说很容易部署
- 大杯激活参数仅仅5.1B,横向对比qwen的22B和deepseek的37B, 以及其他几个开源的大杯也是几十B,小了一大圈,这意味非常低的成本,图1和图2都是反映这个点
- 小杯的竞争力倒是基本上和国产差距不大
- 闭源模型的旗舰往往没有平替,比如Claude的代码能力,你为了效果,再贵,捏着鼻子也要用,但是大多数开源模型的核心竞争力还是性价比
- gpt oss在部署难度和推理消耗上面,比市面上同等级模型低一个档次,卡位了,在模型能力差别不大的情况下,开发者没理由不用更便宜的
- 这个卡位未来可能会持续存在。OpenAI 开源这个模型对他自己的商业价值可能不大,但是对国产一众开源模型比较麻烦
- Anthropic不太可能会做这事,但Grok和Google会不会也跟进?
​- P3是最新是一张发展进程图,战争越发白热化,先发者能维持优势的时间越来越短,这可能也是OpenAI焦虑的原因
00
AI_Native_Vito
15天前
「DS R1 的爆火不是标志着其他模型厂商的退场,而是中国+开源向世界发起挑战」
- 第一梯队仍然是gemini openai claude grok,但是和第二梯队差距变小。
- 国产的一众第二梯队有性价比优势,主要是模型激活参数小:卡少有卡少的玩法。
- 如果卡的问题被完全解决,弹药无限,国产大模型能够达到怎样的高度?参考grok的光速进步,国内团队潜力巨大。
- 第二梯队原来有qwen和deepseek,现在kimi 智谱 minimax 都返场往里面挤。这些都是开源的,互相促进技术进步。
- 而国产闭源中字节在第二梯队,腾讯在二点五梯队。除了这几家公司外,只有Mistral能上桌,但是可能在第三梯队了。
- meta什么时候能重回第一梯队?现在只能算二点五梯队了。
- AI创建全栈应用也是所有模型厂商的目标,字节 阿里腾讯美团智谱minimax无不发力,暗面是context engineering和模型内化agent能力的路线竞争还在继续。
​- 这个竞争可能是建立在模型通用能力不足的情况下的。大胆预言家一下:百分之九十九的场景是用不到端到端RL的。
00
AI_Native_Vito
23天前
很多时候我们简单的认为,Agent无法完成全栈应用开发、无法在小红书看攻略后在携程上面订票、无法写出非常棒的研究报告,是智商问题。
​其实llm的智商早已过了那个线,不然也不能完成这么复杂的数学和代码竞赛。​
我们很容易造出扫地机器人,因为它的奖励函数极其简单:地面干净。但是我们很难造出捕猎机器人,他需要寻找干净的水源、独自搭建庇护所、设置陷阱,追寻猎物、生火等等一系列复杂的操作,并且需要实时判断,奖励的函数又往往不直观。
​现代人类能够完成这么多混合操作的任务,建立在非常长时间的奖励函数的培养当中,和非常高效持久的记忆力基础,以及一个强大的预训练模型(基因)的基础上。如果让现代人类突然回到原始社会捕猎,也需要花很长时间适应,甚至大部分人无法生存。
​显然,LLM还没学会怎么和世界相处,越是复杂越是面向人类的任务,越难找到高质量数据。同时,我们的网络世界也并不是面向LLM设计的,我不认为browser use和operator这样的交互方式是优雅的。
00
AI_Native_Vito
28天前
年初,DeepSeek爆火之后,仿佛六小龙一夜之间失去了所有光环,市场情绪立马变成了“应用要开始爆发了”“套壳即是正义”“训模型的不行了”。
最近,Kimi 发布了足以在agent和前端能力上媲美最优秀的Claude系列的K2,Minimax 发布了M1并且做了自己的Agent,搞了生成全栈应用的功能。二者称得上强势归来,同时还有智谱和阶跃在憋大招。
​游戏还早,不要太早闭环。模型竞争最多在上半场,应用竞争也相当早期,甚至基础设施上的竞争还没正式开场。
一段时间的赢家,往往不是最后的赢家,判断越细可能会越错。
​如果信AI,那就要相信Scalling Law,很多场景会有一百倍的Boost,以现在的视角来看,是无法预测的。
00
AI_Native_Vito
1月前
一些自己的经历,也给一些后来的朋友一些启发,有的内容有点自我,对前半部分没兴趣的可以跳过。

某211菜鸡商科生一级市场存活指南

00
AI_Native_Vito
1月前
2G 时代,网速是几十kbps,所以只能孕育网络发短信(QQ)这样的产品,你想象不到别的PMF,想到了你也只能做个半成品。
4G 时代,网速是几十mbps,快了五百倍,抖音、直播、王者、美团都冒出来了,产品形态百花齐放,PMF 遍地都是,这个时候的应用才算真正成熟了。
现在的AI应用,很多时候都是拿着2G的网速,用各种各样的办法,创作属于4G时代的应用,去找PMF,所以最后发现,产品效果还是不好。所以到现在为止,唯一成功的产品竟然还是最简单的Chatbot。
那AI时代的​4G怎么才会来?一方面是模型能力提升,意味着单位token的智能程度提高;另一方面是推理速度提升,意味着更快更便宜的token。
​大半年,从芯片到基建到各种模型应用,我个人觉得,现在模型的能力被大多数人低估了,基建的成熟度被大多数人高估了。
​AI 时代的斜率会更高,速率提升会比互联网和移动互联网时代更大,所以机会也更大。
00
AI_Native_Vito
1月前
- Web Cursor Agent,支持手机端,更多是修改已有的GitHub代码,融入工作流。
- ​Lovable,UI设计年轻,注重分享社区和Remix功能,主打漂亮的同款网页。
- ​Bolt.new,功能强大,效果出色,打通了自己的云IDE和一键部署,个人最喜欢。
​还有一堆相似的国产版,Youware、Clacky、Readdy,雨后春笋,各有特点,这些是已经冒出来的,还有大量在暗处的。
暗牌变成明牌,大厂还没下场,格局未定,都有机会,短兵相接,都在尝试从不同的反向切这块蛋糕。
​Vibe Coding 的解法会是什么?是最后只有一个形态把所有的吞掉,还是各种形态的都有自己的一小块市场?
​Vibe Coding 的上限是什么?Coding 能承载的东西太多:个人主页、PPT、小工具、海报设计、游戏,都可以。是真有市场还是伪需求?会有多大?
欢迎各位评论区一起讨论~
00
AI_Native_Vito
1月前
AI 是冲浪,面对一个十年甚至二十年的叙事,今天的赢家往往不是最后的赢家。
找冲浪手,比找哪个 Agent 值得投,更为重要。
第一次手搓万字长文。

https://mp.weixin.qq.com/s/wtOagh4sEINo57D5ZqNarA

00
AI_Native_Vito
2月前
会议纪要是junior的必修课。现在有一堆ai memo软件,试了一下,不好用。
我的需求:
可以教给他格式,身份(比如VC)和我的思维方式(比如第一性原理),并且记住。
它不瞎编,还能交叉验证,还能反思。
有记忆能力,我的信息,我改过一次的地方,它下次就记住了,越来越懂我的习惯。
可以做知识库,可以快速检索。
在Blot.new上搓了我觉得我想要的会议纪要agent,一个糙的MVP,settings里面需要填入一些东西才可以试用,有兴趣的可以试试!

MemoAgent - Intelligent Meeting Memos

00
AI_Native_Vito
3月前
让claude帮忙做的可视化 虽然不太满意 但大概是这个味儿。
​Vibe coding我们已经看到了,Vibe market ing、Vibe clipping 、Vibe designing一大堆已经在路上了,还有什么是这张图里漏掉的方向?最后会Vibe anything吗?
00