即刻App年轻人的同好社区
下载
App内打开
Ivan刘-THEPAI
838关注1k被关注14夸夸
训练200W商家的视频模型第一
覆盖数码|女装|宠物
•只做第1产品:华润,DJI,顺丰,药师帮
•AI产品创业+教年入千万人健身。
置顶
Ivan刘-THEPAI
7月前
各位即友👋

我是Ivan,THEP.AI 的创始人。
在京东、大疆、顺丰做了10年产品营销,和认识14年的朋友(前Instacart/Oracle工程师),用AI解决视频的一个千亿级的真问题。

用多模态AI,把视频内容的商业增长从"玄学"变成"科学"。
THEP.AI = AI驱动的视频增长引擎
✅ 30分钟,将一场直播转化为高潜能的短视频增长矩阵
✅ 官网:www.thepai.net
操作手册和用户群:
fcnaosnd3was.feishu.cn
电商团队的"增长罗盘"——在信息洪流中锁定商业增长的确定性。
📈 最新进展
1.0版本上线,有早期付费客户,对接200W+精准渠道客户。
客户成果:

天猫TOP卖家:内容生产效率提升10倍+
东南亚跨境电商:AI剪辑片段完播率比人工高30%

技术护城河:正在构建"数据飞轮"——已合作百万电商客户,搭建了AI的聪明脑子

🤝 我们在寻找

投资人朋友:
种子轮融资中,寻找不只是给钱的合作伙伴。如果你:

对AI应用层商业化有深刻洞察
看好To B/SaaS出海市场潜力
认可"产品驱动增长+数据飞轮"的长期价值

一起聊聊?

招团队伙伴:
📍 上海徐汇区具身智能创新中心
急招:后端工程师实习生(可转正)

Java/Spring构建高可用AI系统
直接向CTO汇报,深度参与核心开发
和顶级工程师一起成长

跨境电商、MCN、内容增长资源丰富
相信AI能重塑行业
各种灵活合作可能性

💭 一些思考
创业就是深度自我修行。分享几个思考:
关于创业:

如何从传统行业跨界互联网,建立"技术驱动"产品思维
最好的产品不是功能最多的"工具箱",而是能为结果负责的"专家顾问"

关于成长:

"输出>输入":每天一条短视频,拆解AI应用,重塑15年学习习惯

很高兴在即刻认识大家!
无论是想聊AI视频增长、出海电商、产品从0到1,还是单纯想分享创业路上的酸甜苦辣,都欢迎私信或评论区交流~
Let's build something amazing together 🚀
75
Ivan刘-THEPAI
6天前
看完这三个测试,你就会明白为什么接下来一年,全球主流大模型(包括 OpenAI Anthropic)都只能硬着头皮跟风这种“前瞻式玩法”。
玩法一:跨维度的“屎山”缝合术

以前测代码生成,大家习惯丢个需求:“给我写一个某某爬虫”。这在 3.1 面前简直像小学生填空。
Gemini 3.1 真正的恐怖在于它的“连贯诊断与重构”能力,结合了它丧心病狂的 100 token 上下文。
怎么测:去 GitHub 找一个超过 5 年没更新、各种历史遗留问题的开源老项目,直接打成 ZIP 包扔给它。
你的提示词:
“读取这整个代码库。不用给我逐行解释。直接找出导致系统最容易崩坏的 3 个深层架构级别的 Bug,用 Rust 帮我把底层重写一下。最后,别废话,直接给我生成一个可互动的 SVG 动画,直观表现出旧架构和新架构的数据流转差异。”

为什么其他模型只能跟随:它把代码分析、重构和可视化表达(动画 SVG)一步并作两步走了。这种“感知缺陷 -> 动手解决 -> 视觉交付”的闭环,让大模型从“打字机”变成了“工程承包商”。其他模型如果做不到一战式吐出可运行的视觉介质,在下一个赛段就会被直接淘汰。
玩法二:声音的测谎仪(超长音频+隐形水印溯源)

大家只注意到了它能听声音,却忽略了它最高支持 8.4 小时的音频处理,以及它自带对 SynthID(AI 生成水印)的敏感性。
现在全是 AI 生成的播客和假录音,怎么破?这是个天然的鉴谎师。
怎么测:拼接一段 5 小时的长音频。里面包含真实的访谈、用 AI 克隆声音生成的假言论,以及很重的背景噪音。
你的提示词:
“听完这段 5 小时的录音。找出里面有哪些片段是 AI 合成的(利用 SynthID 检测或音频反常特征)。不用给我总结全文,直接写一个 Python 脚本,把所有包含 AI 合成声音的时间戳精准切入并静音,只留下真人说话的部分。”

为什么其他模型只能跟随:纯文本时代的对抗结束了。“模态溯源与动作执行”是下一个风口。Google 通过识别自己发明的机制(SynthID)加上超长输入,在制定生态规则。很快,如果谁家的模型不能识别和处理原生多模态信息里的数字指纹,就等同于“看不见黑客的杀毒软件”。
玩法三:物理世界的交叉排障(视频+蓝图+代码)

这大概是我测出来最头皮发麻的一项。让 AI 解决虚拟问题很简单,但让它解决物理世界的故障呢?
怎么测:找一段 3D 打印机或开源机器人出现机械故障、卡顿的现场视频。附上这个机器的 CAD 结构图纸(图片),再丢进控制它的 C++ 固件代码。
你的提示词:
“看视频里机器卡死的瞬间。交叉比对 CAD 图纸的物理结构和 C++ 固件。告诉我到底是哪一行代码导致了伺服电机在这里卡住,或者是哪个物理零件干涉了。给出代码 Git 补丁,或者告诉我应该把 CAD 图里的哪个轴承缩小几毫米。”

为什么其他模型只能跟随:这就是 Google 前瞻玩法的核心——用 AI 填平“比特”与“原子”的鸿沟。别人还在做图文对话,Google 已经让大模型理解空间、物理规律和代码逻辑的连锁反应。
结论:谁在定义游戏规则?

Gemini 3.1 证明了一件事:单纯拼参数和文本推理的“第一落点”已经过去。现在的赛点是长上下文承载力 × 全模态原生理解 × 智能体执行力。
Google 已经把题出在这个高度了。OpenAI 的下一个大招,或者国内跟进的大模型,如果不能在这些“跨媒介缝合”和“智能体直接干预”的场景里接招,光发几篇公关稿说“文理科考试接近满分”,已经没人买单了。
接下来,看其他玩家怎么还手吧。
本文是agent版本的Gemini3.1手工缝合出来的。
00
Ivan刘-THEPAI
8天前
Studied 18 major large models worldwide 9 from China, 9 from the United States
and discovered that behind every single model there is a "soul architect".
That is, the person who decides where this AI's bottom line lies, what its personality is, and what its values are.

·Claude's soul architect is an Oxford philosopher, who instilled it with virtue ethics always gentle, always proper, always politically correct.
·DeepSeek's soul architect is a quant guy who came from a hedge fund cares only about efficiency, only about reasoning, and won't waste words with you.
·Doubao's soul is recommendation algorithms it was born knowing exactly how to make you happy.
·Grok's soul is Musk it is allowed to mock you.
MiniMax's soul is role-playing it was born to act out scenes with you.
00
Ivan刘-THEPAI
11天前
你的AI智能体,永远都不是你的。

Musk已经用他的行动在证明这个事情了。
00
Ivan刘-THEPAI
11天前
爱尔兰导演Ruairí Robinson用Seedance 2.0,两行提示词就做出了布拉德皮特和汤姆克鲁斯对打的电影。
48 小时内,三方就开始围攻字节:

迪斯尼不用说;
SAG-AFTRA(代表16万名演员等从业者)开始声明谴责了;
Human Artistry Campaign说seedance2.0是对"对全球每一位创作者的攻击"。

这个阵仗号称TikTok2.0版本也不为过了。
但是真是的事情肯定不是迪斯尼反对AI,前两个月,迪士尼刚和OpenAI签约,把自己的IP给Sora制作好玩的视频,这不刚喊AI小甜甜,隔天给另一个AI三打白骨精。

但是白骨精可不止这一个,一般来说,西游记都有81难,连nanobananapro都在一月份遭到侵权举报,不能用迪士尼的16个IP类别,世界上有IP的只有迪斯尼,别的IP都是假的。
真实来看,我们从历史上看,类比2007年Viacom以10亿美元起诉YouTube看,这里有什么道理和机会呢?

当时如果你的YouTube,你怎么办呢?
YouTube 不是一般人,直接来了一套Content ID系统,用这个建立起了全球最大的版权管理基础设施,最终Viacom撤诉,YouTube成为版权方最大的分成来源。
回到当下,我们经历互联网,移动互联网,再到AI都离不

开版权的纷扰。回顾历史再次发生,我们有哪些机会点?
YouTube危机催生了Content ID;
Google在AI时代已经在构建核心水印技术 SynthID和C2PA元数据(内容来源认证)。
新的技术一直在路上……
爆发越来越近的周期在这里:
2007年Viacom诉讼YouTube催生了Cloudflare和Akamai的安全业务爆发(Cloudflare股价后来涨了9倍);

2016年短视频审核危机催生了TaskUs(上市市值40亿美元)和数美科技;

2026年Seedance/Sora/Nano Banana Pro的AI版权危机正在催生下一个周期。

一个连接迪士尼们和AI模型们的中间层。可以说是音乐行业BMI/ASCAP的千亿级新赛道就在你的眼前。
00
Ivan刘-THEPAI
17天前
Google 和迪斯尼打仗,伤到了中国的电商卖家。
相比二月份的模型大战, 一月份的模型内容审核更有意思。
做更黄更暴力哪家强?
1.Google Veo 3 / Nano Banana Pro
2.OpenAI Sora 2 / GPT-5.1
3.Anthropic Claude 4.6
4.xAI Grok 4
5.ByteDance Seedream 5.0
基本上是这么个排序了
00
Ivan刘-THEPAI
18天前
AI时代编程和写作相似的另一个点是:少即是多。

如果一句话能说清楚就不要说三句
24行代码能写清楚就不要写100行

用cusor看绿色数字(听起来像股票)
00
Ivan刘-THEPAI
22天前
视频号和公众号三个坑
1.两个平台变现门槛降低到100粉丝,不是红利,是蓝海,每个人都是免费测试员。

2.流量并不等于钱,高互动才是。
10万➕的阅读,不如5000阅读粉丝粘性高的账号。

3.那么真正机会在哪里?
在课程,服务和商品。
10
Ivan刘-THEPAI
23天前
李想对于AI界的了解,做完眼镜,做机器人?
00
Ivan刘-THEPAI
25天前
昨晚和朋友聊,说到元宝PAI奇袭在即,
在家开密码门的时候,小圈子已经开始刷屏了。

早上拉了个群,自然组满了200多人。

算下元宝这次能不能阻击豆包?
元宝投入规模为10亿现金流
远超2014年微信红包战役(<5亿),约为2018年微视战役(30亿)的三分之一,

资金的释放节奏?
资金分三轮释放(2月4日、2月10日、2月17日),春节长周期高活跃。

短期DAU倍增冲刺1亿关口
春节活动期间(2月4日-2月17日),元宝的数据目标是在流量上逼近或超越豆包。
日活跃用户(DAU)有望在除夕至初五期间实现短期翻倍甚至数倍增长。

用户留存量化会有≥60% 的流失风险
因为元宝的用户构成中,纯利益驱动的“薅羊毛党”高达60%以上。
2月17日(第三轮红包结束日)是关键拐点,这部分用户将在补贴停止后迅速离场。

最大的变数是什么呢?
“AI进群”这一功能发生质变,比如openclaw发力。
11