即刻App年轻人的同好社区
下载
App内打开

AI探索站

95703人已经加入

  • 木遥
    1天前
    遇到了一个有趣的问题,正好落在 AI 模型的能力边界处:试证明不可能把平面分成无穷个圆的无交并。

    在我尝试的所有模型里,只有 GPT 5 thinking model 成功做了出来(虽然花了点时间)。

    有趣的不是这个结论,而是观察它们的思路。所有失败的模型都有个共同点:它们的思考基本上是从文字到文字的。它们会调用自己脑海中各种已有的定理和知识,然后漫无目的地试图拼凑出一个证明,但所有这些定理,不管是拓扑的还是几何的还是测度的,对它们来说都是纯粹字面意义上的陈述。Qwen 的思考过程最典型:它滔滔不绝想了很久,但很显然从头到尾它都并不真的理解它在说什么。圆也罢,开集闭集也罢,Baire 纲定理也罢,对它来说都是纯粹的概念,给人的感觉是它甚至并不真的知道「圆是圆的」。

    微妙之处在于,这种「没有几何直觉的几何思考」在某些时候其实未必是一种劣势。现代数学早已挣脱了对三维现实想象的依赖,大部份数学思考本来也确实是在纯粹的概念思辨空间中进行(特别是当问题进入代数乃至范畴论的领域的时候,这时从概念到概念的思考就变成了一种必然)。有的时候,几何直觉甚至反而会成为一种束缚,特别是当思考高维空间的时候,基于低维现实的直观常常是有误导性的。在这些问题上,AI 的「盲目」反而带来了自由,使得它不必受困于视觉直觉。——当然,人类的视觉直觉可能会渗透进人类的文本语料里,在某种程度上「污染」AI,但这是另一个问题。

    然而对原问题来说,因为这是一个低维问题,直觉在这里不但有用,而且能大大缩短思考搜索的难度。在这一点上,一个把圆只作为抽象概念来理解的 AI 就会有巨大的劣势,因为它无法享受到几何直觉带来的跳步。这种直觉使得人可以一眼「看出」关键的构造,而这种构造在文本层面被搜索出来是困难的。

    考虑到 AI 的应用毕竟大多数情况下还是为了解决世界现实问题而不是思考高维几何,有几何直觉的 AI 会在大多数问题上显得聪明得多。于是一个现实问题是,这种直觉是只有依赖多模态的训练才能获取,还是可以通过精巧的文本训练就能实现?这有点像是 AI 领域的玛丽房间问题。这是一个经典的知识论思想实验:一个从出生就生活在黑白房间里、精通颜色物理与神经机制的科学家玛丽,当她第一次走出房间看到红色时,她是否获得了新的知识?

    今天大多数 AI 领域的困难都可以归结于此。人类是自己感官的奴隶,我们听到、看到、闻到,我们体会身体激素的涨落,我们想象、困惑、愤怒,然后试图把这一切投射在文字空间里。AI 则正好相反,它们在文字里理解这一切,但最终需要努力地——有时候是徒劳地——明白,一个圆在什么意义上是圆的。
    63
  • Szhans
    5天前
    ✨ GPT-5 初体验

    作为ChatGPT 的深度同行者,我在GPT-5 发布这个重要节点,选择了最朴素的交流方式—— 模拟大学生询问它有什么特别之处? GPT-5 以极快的速度输出了一张场景匹配表,隐约揭示出我们正站在新的分水岭。

    随后,想到了ChatGPT最新Study模式正风靡全球,想看看它会怎么介绍给新时代的中学生们;让GPT-5 写了欢迎信进行自我介绍;GPT-5 非常快、而5 Pro的缜密和深度令人印象相当深刻。

    回想起任天堂刚刚发布了一个独立游戏的直面会还没看,要不先让Agent 帮我梳理一下? GPT-5 在 Agent 模式花了18分钟,列出了一份详实的清单:好家伙,21个新游、熟悉面孔不多;不过铲子骑士家出的新作《挖掘者米娜》很期待呢

    打开Open AI 的GPT-5直播发布会,气氛依旧温暖、平等并充满人文气, 其中关于 GPT-5 语音模式的对话意外相当亲切;于是拿起手机端也聊了几句,更智能、也更个人化(调皮),我知道以后的日子里更离不开它了。

    GPT-5的发布会如老朋友般松弛,这与当年的苹果式发布会炫酷创新形成鲜明反差。任何一个保持开放、拥抱变化的AI 创造者来说,无论过去三年多么的波澜壮阔,也会在这个时刻有那么点怀旧;Open AI 也找来了早期员工分享2022年底正式发布前,内部还称呼这个产品还叫Chat with GPT的往事,不疾不徐、简约克制。

    然而,新时代的改变又是极为剧烈的:过去我们与AI对话,现在我们委托AI执行;每天数十个任务ChatGPT Agents ——做研究、写创意文案、完成海量设计和编码。这个全能助手已经彻底融入工作和生活,比移动设备更加亲密和自然。

    我知道无法在短短几十分钟揭示GPT-5的全貌, 便让它以自己最擅长的方式—— Deep Research ——进行一次深度回顾。

    三年巨浪,我们从旁观者成为创造者。这不只是技术进步的见证,更是每个深度用户内心变迁的缩影。 相信你也能在这个回顾中找到自己的心路历程。Enjoy~

    《从ChatGPT到GPT-5:三年AI革命的全景回顾》
    chatgpt.com
    109
  • 歸藏
    3天前
    B 站全站排行 19 名,发布一天 200 万播放,纯 AI 视频终于被大家接受,又出了一个超级爆款

    整个视频所有图片看起来都是 4o 生成,部分场景瑞克和莫蒂是抠图贴上去的,和 4o 黄绿色氛围形成鲜明对比,而且不违和

    目前来看图像和视频模型的提示词理解和遵循确实是排在第一位的能力。
    3629
  • 歸藏
    1天前
    试了一下扣子空间新增的设计能力

    这个一键生成公众号文章图片、文字素材并且排版的能力太屌了

    而且支持一键复刻和生成带很多文字的小红书封面完全不用写提示。

    🧵下面是我发现的一些玩法和功能介绍

    首先是即使在设计模式下,扣子空间依然是可以调用搜索功能的。
    这样你就能批量生产那种小红书常见的很有设计感的不同品类知识卡片,另外他也可以参考你上传的图片的排版帮你基于新的内容生成图片。
    比如这里我就找了一个健康类的卡片让他帮我生成一个养狗须知的宠物类知识卡片。

    然后我就想这个参考能不能做带人物的呢,于是就找了一个排版的参考一个人物照片,让他生成新的封面图。
    本来我就是试一下,没想到他能搞定的。
    他居然直接把第二张图的人像扣了出来加上了描边,而且放到了新生成的图片上,太牛了这个,大家以后想做类似封面可以参考我这个玩法。

    然后我试了一下让他出一些连续的剧情图片,比如我找了一个小说的前两张然后让扣子空间生成连续的漫画。
    以往生成漫画的时候由于小字比较多,都是图片生成之后再手动加文字,很麻烦,扣子空间的强大文字能力可以连文字和图像一起搞定,而且他还会自己处理提示词,你只需要简单提要求就行。

    最后就是这次发现的最吊的功能了,他可以直出排版好的公众号文章,而且里面连素材图和文本的排版都搞定了。
    来看一下结果,看到的时候我都惊了,他真的生成了这个文章里面的所有素材图和文案,而且把这些素材图和文案排版成了一个视觉信息很丰富的公众号文章。
    这个时候你只需要点击右侧的公众号图标就可以一键复制,直接粘贴到公众号编辑器的时候图片和排版都跟预览的一致,直接发布就可以了。

    然后我们再看看他在最基础的提示词下,就是我只说我的文字内容,完全不管设计他能做成什么样。
    可以看到这些日常生活中各行业常见的设计需求他都完成的很好。
    而且扣子空间这次不知道做了啥骚操作,即使图片里面的小字也超级清晰。
    这里就有了一个非常大的商机和认知套利空间,比如你可以去任何能接触到有设计需求但是预算不到的用户的地方宣传,然后用扣子空间出图,然后用极低的价格或者搭配其他服务销售给他们,这部分需求非常强烈。

    扣子空间直接生成的图片已经不错了,但是我们肯定会有一些修改需求,比如有个字错了,或者说想要图片变得清晰一些,这些扣子空间也是支持的,而且都非常实用和精准。
    你可以在扣子生成图片预览窗口的上面找到这些功能。
    无痕改字是这里面最强的功能,我们之前在其他产品上生成带文字图片的时候经常遇到,这张图特别好就是某个字错了,这时候非常可惜,想改对非常难。
    但还扣子空间这个改字非常强大,基本改就有,涂抹一下,输入想要改的字,字体和原来的还是一致,而且新生成的文字也都是对的。

    上面就是这次扣子空间设计能力的测试和我发掘的玩法了。
    我之前常说 80 老太都能操作,扣子空间这个设计能力真的达到了这个需求,加个语音输入说句话就行,可以说日常的设计需求 100% 0 门槛化了。
    我这里说的日常设计需求,不是我们所理解的电商或者互联网运营设计,而是每一个不会设计的普通人,比如小红书发个简单的帖子、为自己的小店整一个招聘海报或者小区物业需要个简单的报告。
    其实这些人日常也是需要设计的,只是以前设计师太贵,而且沟通成本很高,AI 来了之后又得需要付费和找提示词,非常麻烦。
    335
  • 鱼仔Joey
    1天前
    坏了 感觉自己真长这样
    图四感觉真是我
    231
  • 苍何
    2天前
    这是我见过最牛逼,功能最全的多平台同步工具了,我反手就冲了会员,真香!
    1411
  • benn
    6天前
    感觉 OpenAI 最近开源的 gpt-oss 真的被严重低估了。它虽然不是最聪明的,但在使用场景和定位上是非常成功的(服了 Sam 老六)。

    首先最小尺寸的 gpt-oss:20b 绝对是你在 Mac 或者家用电脑上就能跑的最好模型之一(对我来说是“唯一”)。它是那种少有的“真正能用”的本地模型,对话体验非常好,持续对话下来非常稳定、不会出现输出混乱崩溃的问题。大部分早期能跑的本地模型是不具备的。

    它的尺寸刚刚好,不管是模型文件还是运行显/内存都非常小(大约是 12~16GB),大部分电脑都能使用。在我的 M4 Mac 上能做到 70token/秒 的输出,在我的 19 年老 Intel Mac 上能做到大约 1 token/秒的输出。整体性能上非常出色。

    最为重要的是,虽然硬件要求非常低,但它的智能表现出乎意外的好。我把个人最近一些非编程类的问题同时发给 gpt-oss:20b 和元宝(DeepSeek R1),不管是回答速度还是回答质量,我更喜欢 gpt-oss:20b 多一点。这不是严谨的对比测试,我也只尝试了五、六个问题,但考虑到硬件要求,这样的回答效果已经让我感到满意了。

    如果你的对话需求非常简单,或者想要一个完全离线、隐私自由的本地模型,gpt-oss:20b 绝对是一个简单可靠的选择。

    其次是最大尺寸的 gpt-oss:120b,OpenAI 号称接近 o4-mini 的水平。理论上它也能在 Mac 或者家用电脑上运行起来。我记得大约需要 60~80 GB 的显/内存,对我的 Mac 来说非常吃力。如果电脑硬件足够强、或者并行几个 Mac Mini 跑起来问题应该不大,这就能拥有一个接近 o4-mini 水平的离线本地模型了。

    gpt-oss:120b 另外一个被低估的意义是在价格上。在 together.ai 上这个模型的价格低至 $0.15 / $0.60,相比之下 DeepSeek V3(注意是 V3 不是 R1)的价格是 $0.27 / $1.10。也就是说,这么一个号称性能接近 o4-mini 的模型,价格只需要 DeepSeek V3 的一半!!据我所知这样的价格已经是 LLM 中的最低档,类似价格的是 gpt-4o-nano gemini 2.5 flash-lite。

    我现在非常怀疑 OpenAI 这波就是冲着 DeepSeek 来的……

    另外我还发现了 gpt-oss 非常容易破解,比其他开源模型简单很多。容易到什么程度呢,我可以在大约三次对话内让它回答各种非法问题。不过这个话题不适合在这里讨论了……
    1217
  • 静怡Lisa
    7天前
    👀Gemini Storybook玩了,整体内容输出质量很高,故事情节连贯性和配图质量都符合预期。提了一个指令是“做一个梵高和毕加索绘画风格结合的插图(图7)”,生成物的确融入了毕加索立体主义时期的创作风格。

    主要是生成的真快,可以想象在哄娃睡觉这个场景下,面对不停提需求的娃,崩溃的家长可以直接打开Gemini寻求帮助了。

    📝prompt:
    Using Vincent van Gogh artistic style to create a storybook about Pablo Picasso enthusiastically tries to convince van Gogh to collaboratively draw and commercialize their collaborative work through art dealers. The story should be open ending about the fate of van Gogh and should be based on historical facts. At least one picture in the storybook should demonstrate a collaborative work of van Gogh and Picasso. Targeted readers are females between 20-35 years old.
    07
  • 龙爪槐守望者
    3天前
    Watermark Zero—— AI去除照片水印

    利用Flux Kontext模型,轻松去除照片中的水印、文本或标志,保留图像原始质量。无论是复杂的水印还是半透明的文本,这款工具都能智能识别并重建背后的像素。

    🔗:watermarkzero.com
    612
  • 玉伯
    2天前
    大厂能干成的,往往是资源密集型的事。比如云计算、外卖。AGI 可能最终得靠大厂才能做成。大厂更有钱获取芯片、数据、人才等资源。

    OpenAI 正在逐步成为大厂。DeepSeek 如果坚持不融资,芯片等资源会不够用,然后掉队。

    非资源密集型的事,可能创业公司更有机会。很多应用层的创新,需要不内卷的放松环境,需要没有绩效压力的持续探索。在非大厂叙事下,创新应用更容易生长出来。

    以上,可能都是对的。
    对的,也就都是错的。
    61