即刻App年轻人的同好社区
下载
App内打开
AI_Native_Vito
57关注9被关注0夸夸
SUFE,ENTP,VC,AI Native,Me
AI_Native_Vito
2天前
泛文科的毕业论文就是一套水水的八股文,也没人指望本科生能做出什么学术贡献,AIGC也是解放生产力了。
00
AI_Native_Vito
17天前
#AI工作流 建议搭配Gemini 2. 5 pro使用效果最佳,基本上效果大于等于实习生手动整理

Prompt 分享:一分钟解决令人头疼的会议纪要/MEMO?

01
AI_Native_Vito
17天前
TTS的公司研究了一遍,体验了一遍,大失所望。
基本没有任何一家能够实现情感理解和情绪输出,给我的感觉类似微软小冰那个时代的chatbot:勉强可以用,但是说不上智能和体验。合适的停顿和韵律等还达不到,不过延迟倒是很低了。
最早让计算机说话是“活字印刷术”,现在的TTS都用了新的方法,有和LLM结合的hume,有和SSM(mamba)结合的cartesia,实际出来的效果却没有明显大于“活字印刷术”。这是为什么?
30
AI_Native_Vito
19天前
沉寂了一年多的曹越,一上来就干了个大的。在AI视频领域,我认为他是最有魅力的,连夜体验之后,几个感受:
1 官网逻辑很有意思,跟大多数文生视频的网站从风格到流程上都不一样
2 主打图生视频,一致性较强,实测效果还不错,但是很卡,可能是算力不够
3 读了论文,里面改进非常多,关键的改进是自回归,而不是双向去噪的扩散模型,所以更有逻辑性
4 自回归vs双向去噪的又一个例子,上一个是 4o 的图像生成
5 团队工作很深,从 attention swiglue infra 各种细节都做了工作,可以看得出非常有思考,论文也非常完整
今年过年时间就和几个做comfyui的朋友讨论,扩散很难完成精确控制,未来可能是自回归的。没想到,未来来得比我们想象的更快。
00
AI_Native_Vito
27天前
这次聚焦在RDMA网卡,直到现在也很好奇为什么这个领域没有像光模块那样,出一个中际旭创,如果有见解的欢迎交流。
btw,claude简直是可视化神器,太好用了!

RDMA 网卡速通:AI 集群的“神经中枢”

00
AI_Native_Vito
1月前
2T 怪不得藏了那么久。。。
00
AI_Native_Vito
1月前
存算一体的芯片,关键优势在于可以把延迟降低十倍,token输出速度提高十倍,最近我的最大启发是,最刚需的场景可能不是数据中心,也许会是智驾或者具身,在这个场景上,10s和1s、1s和1ms,是完全不同的两件事。
​现在的解决方案是快慢思考系统,复杂、麻烦,是个不太优美的解决方案,如果有存算一体也许能统一起来。
从历史来看,深度学习算法的每次突破,都是当时对算力的尽可能利用,让人教的更少,让计算机学得更多,用算力来scalling一切。transformer的前提是gpu计算能力ready,具身、视频这些领域的“transformer”的前提会不会也是一种全新的硬件形态,能把现在memory wall导致的latency的痛点解决?
00
AI_Native_Vito
1月前
猜猜谁是AI写的 谁是人写的?
50
AI_Native_Vito
1月前
推理芯片:一面是GPU,一面是...
深入研究了国外做推理芯片的初创,进行整理和蒸馏后得出了这篇文章,欢迎感兴趣的朋友一起讨论。

https://mp.weixin.qq.com/s/YsEyh7ZNzf1L1md9uUZMug

00
AI_Native_Vito
2月前
大模型也有性别歧视?
Trash in,Trash out!
看看你们都把大模型教成什么了。。。
Wait!DeepSeek居然是唯一清流!
这个故事告诉我们:

性别刻板印象、类O1模型和DeepSeek的完胜

00