即刻App年轻人的同好社区
下载
App内打开
Dppp_
23关注4被关注0夸夸
清北本硕 | 美元风投 | 业余电影和戏剧混子
分享科技、消费、真实生活的观察,有创业梦
不相信世界会一如既往
期待观点互换和共同求证
Dppp_
12天前
2026的AI产品给我的第一个退缩的点:

Elys让我能无限修改微调自己的记忆,并按照我的记忆去post评论和互动。
这很像某种人会先让自己相信某个自己编造的故事,把这个故事强化为自己的“记忆”,并在真实社交互动时以此为主观事实。
这种对自己的twist在AI分身社交里会无限增强,到后面更是真假难辨🤔
00
Dppp_
2年前
#AISecurity mapping

看了好多ai安全的文章和mapping,personally觉得可以把它很通俗的分成下面三个level:

level1: AI is the bad guy 保护模型原生安全
这一层主要关注两个方向:
- 大模型与生俱来的认知误差和不良输出
- 大模型形成产品的过程中滋生的不稳定性误差
比较有趣的可以关注product testing的new gen startups

level2: Human is the bad guy 保护模型不受坏人攻击
这一层主要关注prompt injection、data poisoning之类的问题,在各攻击面形成保护,可以看到AI firewall等系列安全公司

level3: AI+Human is the bad guy 保护现实世界不受AI攻击
这一层主要关注fake news/deepfake/copyright之类的问题,当然到后期会关注AI beyond control,所以会看到系列做detection和art work watermark的公司

#AI工作流 #创投好文推荐
00
Dppp_
2年前
#ai安全

最近看AI Security,personally认为这是一个不那么有趣但非常必需的领域。for希望部署ai产品、模型和应用的公司以及ai产品开发的公司,在创意之外的安全性背书和拦截是很重要的,会直接影响产品运行效果、客户买单程度和是否会被监管的大锤波及。

在这里看到一个很有趣的point(来自黄民烈教授talk),不同数据集存续的语料环境会对安全问题的识别产生很大的影响。比如中文语料里的地域歧视可能在英文安全数据集里就没有体现。延伸开来,行业specific和地域specific的安全系统开发可能变得重要。

看到一些创业公司想要去做这个事情,但技术细节和路径还没有很好地共识化和得到确认,可能需要持续去关注。
00