即刻App年轻人的同好社区
下载
App内打开
甜菜欣欣
118关注603被关注0夸夸
硅谷AI创业者,前谷歌工程师,哥大本科💙
CVPRw最佳论文,全网20万订阅。
英文推特: tiancaixinxin
置顶
甜菜欣欣
3月前
AI写代码太可怕了。亲测现在的Claude + Cursor,已经达到直接原地起项目框架,一句话写function,半自动debug,半自动部署的程度。
一个人一星期,就能上线一个产品。对于产品落地标准的项目,目前仍要求用户具有一定技术能力。

预测未来的2-5年在米国 ,不仅junior级别程序员受到冲击,人才需求大幅缩水,senior一些的岗位也无法幸免。
这件事情已经在发生了。据Indeed公布的数据(图二),米国发布程序员招聘帖的数目从2022年顶峰以来大幅下降。
我认为长期受欢迎的,会是
🔺有领域内经验、能拿下单子的创业者
🔺能拆解复杂技术的程序员
🔺有审美能力的设计师

与此同时,欣欣在Sensortower等统计网站看到,过去独立开发者能达到的盈利有限,然而从去年开始,一人公司、小团队获得上百万刀营收的情况越来越多。
我们现在处在技术奇点的前夕,技术人在这个时间节点应当发挥优势,完成资源积累和转型。
#人工智能# #硅谷# #创业# #程序员就业#
88
甜菜欣欣
7天前
已布局谷歌,英伟达,Meta,Anthropic,xai
30
甜菜欣欣
11天前
LLM训练的有趣观察:知识注入和小语种💡
Posttrain阶段注入新知识是可行的。我发现这个现象非常偶然,在我做数据集的时候,有好几次AI问我叫什么我都回答同一个名字,结果训练出来的AI就会默认所有用户都叫这个名字。
就是注入效率可能有点低下。一个知识在pre-train阶段注入的话, 会很有效地改变生成概率的分布。 但是如果是finetune的话,相当于你需要把关于这一个知识的各种可能的问法都做一遍问答数据。
接下来我想实验在人类偏好对齐的阶段能不能注入新的知识,效率怎么样。

还有就是不同语言之间的训练助力,之前听说过但这次亲身体验。当我们去训练LLM在某一个语种的能力,跟它比较相近的小语种的能力也会得到提升,这时如果我们想训练邻近的小语种, 只要配比比较少的数据去激活就可以了。
我们的产品,我没料到会有很多欧洲的用户,用法语、德语、意大利语能聊出非常长的对话,说明模型效果还不错,但当时我们小语种的配比是非常低的。
当然训练也有失败的时候。我们训了半天波兰语训不动,才发现原来波兰语是在斯拉夫语系里的,跟英语离得有点远。吃了没文化的亏,窝连夜开始学语言学😂
00
甜菜欣欣
19天前
2012年的欣欣:手搓二叉树!千行代码实现力学模拟!给我一张白纸,我就能写出整个程序!

2025年的欣欣:呜呜呜Cursor你看看这个for loop写得对不对😭
30
甜菜欣欣
1月前
去年有幸在北京拜访张祥雨,老师从第一性原理出发分享了好多,包括为什么llm做不了乘法,还有合成数据的局限性。
这个播客的信息密度非常高,很多地方要展开来讲都能讲一节课。比如“生成和理解是一体的”,我从中受到启发,在posttrain训练模型时加入长内容总结的任务,提高模型理解上下文的能力。

张小珺: 这集关于多模态和下一个“GPT-4时刻”,并且讨论了一个有意思的问题:随着模型规模扩大,对话能力、知识量和情商都在变强;但推理能力(尤其是数学)的表现是先上升后平缓,再扩大反而是下降。反复观察发现,更大的模型做数学题倾向于跳步,不老实——这可能是next token prediction的本质缺陷🗺️

00
甜菜欣欣
1月前
随着时间,创投巨佬们的共识也可能被证伪。
记得21年左右硅谷流行的观点是,社交平台会垂直化,也目睹了某友轰轰烈烈搞游戏社交的全过程。结果发现,即使人们兴趣点不一样,还是喜欢挤在同一个平台玩。
大模型这一波也有一些共识被推翻,比如当OpenAI一骑绝尘的时候,第二和第三还有多少价值。结果发现大模型也是可以有侧重点和多样性的,更别说还能泛化到写代码等等的场景。
对于第一个例子的判断,让我绕开了一些方向性的错误。对第二个例子的判断,直接让我低估值入手Anthropic。
最后吐个槽吧,YC对C端产品的助力还是有限。我是想不明白,差不多时间发布的产品,至少50万🔪在手的团队 vs. 我们0预算纯有机增长,还比不过我们在一堆封号和K站之后的流量成绩😂
40
甜菜欣欣
2月前
米国的服务业有多离谱呢?
1000刀一晚的酒店,要个一次性牙刷都不一定有,纯看运气。
一盘沙拉三十刀,要自己走过去端,想结账发现一个服务员都找不到😂
10
甜菜欣欣
2月前
AI产品加了个每日限额,挺高的,没想到一些用户不仅用满,还评分吐槽说免费额度不够用~
经验:soft paywall很重要。让用户看ads增加使用额度,既可以筛选出没有耐心而付费的用户,又能让愿意看ads的用户得到更多额度。
00
甜菜欣欣
2月前
只有我感觉Mistral系列 是个很无趣的大模型吗?能从对话感受到训练数据就没有这一块的,nerd的感觉。传说中的法国人的浪漫在哪里?
Claude的偏见很重。不是政治正确方面的偏见,而是你告诉它一件事,它凭只言片语说了一大段,然后你一句话反转,它再反过来给你编一大段。ChatGPT分析这种完全反转的情况就要淡定很多。
Deepseek写代码那就跟我喝了酒似的,啥飘忽忽的幻觉都开始往外冒,所以在windsurf里不要钱。
#AI工作流
00