即刻App年轻人的同好社区
下载
App内打开
歸藏
563关注24k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
12:29
Claude Skills 创建一个简单的 Agent 真的太简单了

人人都能创建自己的 Agent 大军,我这里搞了一个 Nano Banana Pro PPT 生成 Skills

基于任何文档生成 PPT,支持风格选择、页数自定义

生成后会导出图片文件以及帮你生成一个全屏预览的网页

也可以作为整个图文混排 Agent 体系的一个部分
00:17
01
歸藏
11:57
昨天早上起来一看,发现 ChatGPT 发布了他们新的医疗健康功能,很多朋友说这不就是蚂蚁阿福吗?

难得,终于有一次是 OpenAI 跟随国内AI了。

我试了一下蚂蚁阿福,从能力上来看,Open AI比蚂蚁阿福差了不少,Open AI 的健康功能支持将你的检测结果和一些健康应用的数据同步过去,然后它会基于专门打造的健康模型,对你的体检结果及健康数据进行分析。

这些功能蚂蚁阿福都是有的,而且不止支持健康应用的数据同步,还支持连接各种专业的血压仪等医疗器械。

蚂蚁阿福比较强大的是:它的智能问答能力支持多种提问方式,包括语音、文字和拍照,甚至可以通过拍皮肤去识别皮肤病,拍药盒以获得药物疗效和一些禁忌的指导,以及拍摄体检报告来提供医疗资料等。

这些功能都非常易用,在体验层面非常符合中国国情。毕竟我们有很多老人和偏远地区用户,对他们来说,打字是挺费劲的。

另外,他们还支持与一些国内非常有名的医生 AI 分身进行对话。还支持:在线问诊和医院就医指导以及挂号服务。通过这些功能,他们把整个健康链路都打通了。线下就医还能直接语音唤起医保码进行支付,体验好太多了。

12 15 号发布新版蚂蚁阿福之后月活翻倍达到了 3000 万,单日提问量超过了 1000 万,说明很多人确实非常需要一个一站式有优秀体验的的 AI 健康中心。
15
歸藏
1天前
谷歌 AI 开年王炸,Gemini 开始跟 Gmail 深度集成

Gmail 正在转型为主动的 Gemini 驱动 AI 邮箱,具体包括下面几个功能:

AI 收件箱:最重要的是 AI 收件箱类似一个简报页面,他会按照优先级帮你重新整理所有邮件的信息。你不需要在翻你的收件箱就能快速浏览重要的信息和提醒,所有相关信息都会被汇总到一起,方便多了。这个目前在缓慢放量。

AI 概览:在搜索框用自然语言提出问题之后,会使用 Gemini 生成一个简洁的 AI 概览来从你的邮件中获取信息提供答案,这个能力是免费的。

AI 写邮件:所有人都可以使用“帮助我写”来润色邮件或从头起草邮件。还有新的“建议回复”会利用会话上下文提供相关的一键式回复,匹配你的写作风格。帮写功能免费,校对能力对 Pro Ultra 用户开放。

新版 Gmail 将会从今天开始向美国的英语 Gmail 用户和 Gemini 付费订阅者推出。
01:11
17
歸藏
2天前
Codex 现在可以通过 $ 符号快速启动 Skills
33
歸藏
2天前
ChatGPT 发布医疗健康功能,这个好啊,大部分人都很需要。

支持整合你的电子病历、检测结果和 ios 健康应用数据信息提供健康和医学建议。

可以直接连接到EHR、Apple 健康、Function、MyFitnessPal 等获取到你的数据。

使用方式与能力:在侧边栏进入“健康”,连接医疗记录与应用或上传文件,围绕个人健康进行对话。

比如分析化验结果、分析你的 Apple Watch 数据、提供饮食指导、发现徒步路线等等。

目前向美国地区优先开放,需要提交候补名单。
63
歸藏
2天前
高德发布了一个名叫 FantasyWorld 的世界模型,阿里的模型版图再次扩张。

作为头部导航应用这么大的数据量确实可以用来搞个模型。

发布之后在 WorldScore Leaderboard 这个专门用于世界模型的测试集排第一。

随着自动驾驶各家转向 VLA 和纯视觉方案,加上具身智能的火爆,感觉这类追求物理表现和 3D 一直性的世界模型会越来越重要。

FantasyWorld旨在为具身智能与AGI提供高质量3D世界模型。

在冻结的视频骨干上增设可训练的几何分支,联合建模“视频潜变量”和“隐式3D场”于一次前向计算中。

生成视频在保持强视觉真实感的同时,显著提升多视角一致性与几何保真,相比近期几何一致方法在多视角协同与风格一致性上更优。
23
歸藏
2天前
昨天玩 Open Code 的时候有个教训,大家可以参考

oh-my-opencode 这个插件的时候它可以搞 Open AI Antigravity Auth

把你账号的 Codex Gemini 模型额度给 Open Code 用。

不建议开启这个:

一个是本身这是违反两家用户协议的,有封号风险

另一个是这种反向代理,会影响网络,本身我们国内的网络环境就相当复杂。

我搞了这个以后 Antigrvity 直接没有办法选择模型了,最后卸载掉 oh-my-opencode 的配置才变好。

还有一个问题是,它对于我们现在国内常用的这种 Claude 模型的代理 API 处理得不是很好,或者说支持得不是很好。

我不知道是两端哪一端的问题,添加以后过程很复杂,而且效果也不好。
11
歸藏
2天前
可能 AI Studio 又要有大更新了。

模型输入框增加了工具选项,他们员工说是为了即将到来的更新做的准备

目前 Gemini 3 Pro 开放了 5 个工具:结构化输出、代码执行、Google 搜索、 URL 获取上下文、Function Call
32
歸藏
2天前
Anthropic 发布了本地带界面的 Claude Code

内置在 Claude 桌面端里面,在侧边栏点击“Code”切换后选择启动的文件夹就行
36
歸藏
3天前
他妈的一大早罗技的鼠标驱动掉了,搞了好久

结果是他们证书跟英雄联盟一样也过期了

真服了,而且这么长时间都没修复,不能干别干了,罗技

找了半天,终于找到解决方法了:

把日期改成昨天,启动调好之后再把它关了,最后再把日期改回来
44