AI_Native_Vito的个人主页

即刻App年轻人的同好社区

下载

AI_Native_Vito

128关注46被关注0夸夸

00后，SUFE，ENTP，VCer，AI Native，Start Up

AI_Native_Vito

7天前

GPT OSS 开源的精准卡位：
- 大杯总参数量120B, 刚好可以放在一张H100上。比qwen的235B和deepseek的671B等需要几张卡的更好部署，智谱 kimi minimax的大杯等也都是几百B，卡了一个很舒服的位置，对开源模型使用者来说很容易部署
- 大杯激活参数仅仅5.1B，横向对比qwen的22B和deepseek的37B, 以及其他几个开源的大杯也是几十B，小了一大圈，这意味非常低的成本，图1和图2都是反映这个点
- 小杯的竞争力倒是基本上和国产差距不大
- 闭源模型的旗舰往往没有平替，比如Claude的代码能力，你为了效果，再贵，捏着鼻子也要用，但是大多数开源模型的核心竞争力还是性价比
- gpt oss在部署难度和推理消耗上面，比市面上同等级模型低一个档次，卡位了，在模型能力差别不大的情况下，开发者没理由不用更便宜的
- 这个卡位未来可能会持续存在。OpenAI 开源这个模型对他自己的商业价值可能不大，但是对国产一众开源模型比较麻烦
- Anthropic不太可能会做这事，但Grok和Google会不会也跟进？
- P3是最新是一张发展进程图，战争越发白热化，先发者能维持优势的时间越来越短，这可能也是OpenAI焦虑的原因

0 00

AI_Native_Vito

15天前

「DS R1 的爆火不是标志着其他模型厂商的退场，而是中国+开源向世界发起挑战」
- 第一梯队仍然是gemini openai claude grok，但是和第二梯队差距变小。
- 国产的一众第二梯队有性价比优势，主要是模型激活参数小：卡少有卡少的玩法。
- 如果卡的问题被完全解决，弹药无限，国产大模型能够达到怎样的高度？参考grok的光速进步，国内团队潜力巨大。
- 第二梯队原来有qwen和deepseek，现在kimi 智谱和 minimax 都返场往里面挤。这些都是开源的，互相促进技术进步。
- 而国产闭源中字节在第二梯队，腾讯在二点五梯队。除了这几家公司外，只有Mistral能上桌，但是可能在第三梯队了。
- meta什么时候能重回第一梯队？现在只能算二点五梯队了。
- AI创建全栈应用也是所有模型厂商的目标，字节阿里腾讯美团智谱minimax无不发力，暗面是context engineering和模型内化agent能力的路线竞争还在继续。
- 这个竞争可能是建立在模型通用能力不足的情况下的。大胆预言家一下：百分之九十九的场景是用不到端到端RL的。

1 00

AI_Native_Vito

23天前

很多时候我们简单的认为，Agent无法完成全栈应用开发、无法在小红书看攻略后在携程上面订票、无法写出非常棒的研究报告，是智商问题。
其实llm的智商早已过了那个线，不然也不能完成这么复杂的数学和代码竞赛。
我们很容易造出扫地机器人，因为它的奖励函数极其简单：地面干净。但是我们很难造出捕猎机器人，他需要寻找干净的水源、独自搭建庇护所、设置陷阱，追寻猎物、生火等等一系列复杂的操作，并且需要实时判断，奖励的函数又往往不直观。
现代人类能够完成这么多混合操作的任务，建立在非常长时间的奖励函数的培养当中，和非常高效持久的记忆力基础，以及一个强大的预训练模型（基因）的基础上。如果让现代人类突然回到原始社会捕猎，也需要花很长时间适应，甚至大部分人无法生存。
显然，LLM还没学会怎么和世界相处，越是复杂越是面向人类的任务，越难找到高质量数据。同时，我们的网络世界也并不是面向LLM设计的，我不认为browser use和operator这样的交互方式是优雅的。

1 00

AI_Native_Vito

28天前

年初，DeepSeek爆火之后，仿佛六小龙一夜之间失去了所有光环，市场情绪立马变成了“应用要开始爆发了”“套壳即是正义”“训模型的不行了”。
最近，Kimi 发布了足以在agent和前端能力上媲美最优秀的Claude系列的K2，Minimax 发布了M1并且做了自己的Agent，搞了生成全栈应用的功能。二者称得上强势归来，同时还有智谱和阶跃在憋大招。
游戏还早，不要太早闭环。模型竞争最多在上半场，应用竞争也相当早期，甚至基础设施上的竞争还没正式开场。
一段时间的赢家，往往不是最后的赢家，判断越细可能会越错。
如果信AI，那就要相信Scalling Law，很多场景会有一百倍的Boost，以现在的视角来看，是无法预测的。

1 00

AI_Native_Vito

1月前

一些自己的经历，也给一些后来的朋友一些启发，有的内容有点自我，对前半部分没兴趣的可以跳过。

某211菜鸡商科生一级市场存活指南

4 00

AI_Native_Vito

1月前

2G 时代，网速是几十kbps，所以只能孕育网络发短信(QQ)这样的产品，你想象不到别的PMF，想到了你也只能做个半成品。
4G 时代，网速是几十mbps，快了五百倍，抖音、直播、王者、美团都冒出来了，产品形态百花齐放，PMF 遍地都是，这个时候的应用才算真正成熟了。
现在的AI应用，很多时候都是拿着2G的网速，用各种各样的办法，创作属于4G时代的应用，去找PMF，所以最后发现，产品效果还是不好。所以到现在为止，唯一成功的产品竟然还是最简单的Chatbot。
那AI时代的4G怎么才会来？一方面是模型能力提升，意味着单位token的智能程度提高；另一方面是推理速度提升，意味着更快更便宜的token。
大半年，从芯片到基建到各种模型应用，我个人觉得，现在模型的能力被大多数人低估了，基建的成熟度被大多数人高估了。
AI 时代的斜率会更高，速率提升会比互联网和移动互联网时代更大，所以机会也更大。

0 00

AI_Native_Vito

1月前

- Web Cursor Agent，支持手机端，更多是修改已有的GitHub代码，融入工作流。
- Lovable，UI设计年轻，注重分享社区和Remix功能，主打漂亮的同款网页。
- Bolt.new，功能强大，效果出色，打通了自己的云IDE和一键部署，个人最喜欢。
还有一堆相似的国产版，Youware、Clacky、Readdy，雨后春笋，各有特点，这些是已经冒出来的，还有大量在暗处的。
暗牌变成明牌，大厂还没下场，格局未定，都有机会，短兵相接，都在尝试从不同的反向切这块蛋糕。
Vibe Coding 的解法会是什么？是最后只有一个形态把所有的吞掉，还是各种形态的都有自己的一小块市场？
Vibe Coding 的上限是什么？Coding 能承载的东西太多：个人主页、PPT、小工具、海报设计、游戏，都可以。是真有市场还是伪需求？会有多大？
欢迎各位评论区一起讨论～

2 00

AI_Native_Vito

1月前

AI 是冲浪，面对一个十年甚至二十年的叙事，今天的赢家往往不是最后的赢家。
找冲浪手，比找哪个 Agent 值得投，更为重要。
第一次手搓万字长文。

https://mp.weixin.qq.com/s/wtOagh4sEINo57D5ZqNarA

1 00

AI_Native_Vito

2月前

会议纪要是junior的必修课。现在有一堆ai memo软件，试了一下，不好用。
我的需求：
可以教给他格式，身份（比如VC）和我的思维方式（比如第一性原理)，并且记住。
它不瞎编，还能交叉验证，还能反思。
有记忆能力，我的信息，我改过一次的地方，它下次就记住了，越来越懂我的习惯。
可以做知识库，可以快速检索。
在Blot.new上搓了我觉得我想要的会议纪要agent，一个糙的MVP，settings里面需要填入一些东西才可以试用，有兴趣的可以试试！

MemoAgent - Intelligent Meeting Memos

3 00

AI_Native_Vito

3月前

让claude帮忙做的可视化虽然不太满意但大概是这个味儿。
Vibe coding我们已经看到了，Vibe market ing、Vibe clipping 、Vibe designing一大堆已经在路上了，还有什么是这张图里漏掉的方向？最后会Vibe anything吗？

2 00