即刻App年轻人的同好社区
下载
App内打开
歸藏
557关注20k被关注42夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
置顶
歸藏
2年前
很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新:

1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章:
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词:
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中:
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词:
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道:
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型:
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用:
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析:
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com
22165
歸藏
15:35
写了一篇完整的 Veo 3 测试和 FLOW 的使用教程

整理了上午跑的所有案例以及案例分析

里面还解释了你使用 FLOW 可能遇到的各种问题

在这里看:mp.weixin.qq.com
50
歸藏
13:59
妈的 Veo 3 还支持视频延长,延长的视频可以保持一致性

我去这个太强了,刚才那几个应用场景都能搞定了
00:16
14
歸藏
13:34
你甚至能用 Veo 3 让牛顿亲自给你讲万有引力定律

让爱因斯坦给你讲广义相对论,而且提示词能让他一次生成两个分镜
00:16
37
歸藏
13:12
飞书发布了知识问答功能,试了一下很强

而且跟你组织的数据是相辅相成的,数据和记录越多这个 AI 的能力越强

简单介绍一下:

飞书知识问答是企业知识的企业专属 AI 问答工具。
当你在工作中遇到问题可以向它提问,他会根据互联网知识以及你在组织中有权限访问的数据消息、文档、知识库、文件等信息回答你的问题。
也可以用它帮助自己进行内容创作,获得更多的业务了解。

企业能力介绍:

这里因为我自己没有合适的飞书组织借用了 AJ Way to AGI 组织进行体验。
刚好她们最近在筹备全球 AI 大会的东京站有非常多的调动和准备工作
我自己模拟一个新加入的员工使用飞书知识问答来了解信息和跟上进度。
比如我临时要参与这个项目,我肯定需要了解这个项目的筹备进度。
有了飞书知识问答之后我就可以直接向它提问,查询准备的进度。可以看到飞书知识问答给出的结果非常精确而且简练。

之后我就可以针对性的详细了解我自己负责的那部分内容了。
比如我需要负责相关嘉宾和演讲分享内容的联络和准备工作,需要沟通的嘉宾和内容是非常多的,我不可能都了解,通过这个功能我可以继续针对性的询问我不了解的内容。

而且我发现,他不止会检索文案,也会给你展示所有相关的图片,这里他就给了相关的海报信息和演讲地点的照片帮助协调嘉宾进行准备。

你还可以让他基于现有的信息,判断后给你一些新的活动筹备建议,他给的非常全面,从场地到推广策略到嘉宾都照顾到了。
作为一个工作来说了解完进行了操作之后肯定是要有一些交付物的,这个时候我们就可以让飞书知识问答基于上面的查询和交流内容生成一个筹备进度汇报文档。
我们底层牛马相当多的时间都浪费在这种事情上了,飞书知识问答真的能把效率提高非常多。

个人成长辅助:

很多人应该和我一样没有对应的组织就自己用飞书的文档之类的能力,相当多的自己写的信息和内容都在飞书文档里面。
如果你也是这样的用户那恭喜你,你有了一个体验最好、最强的 AI 知识库产品。

大家都知道藏师傅自己写了非常多的网页生成提示词,这几个月光顾着写了,其实也没整理过。
现在这问题被解决了,直接让飞书知识问答读取我所有的相关文章,并且列出对应的提示词,之后让他详细分析列出可能的优化点帮我进行脑暴就行。
他非常详细的对我网页生成提示词的写作结构和方式、模型适配方案甚至产品化流程都给出了建议,有些我确实自己都没想到,非常成体系。

另外我们知道飞书里面有非常多的免费的知识库,里面有很丰富而且高质量的内容。
比如刚才说的 Way to AGI,以往我们浏览的时候都只能按照知识库的目录和链接去浏览,很难找到需要的信息。
现在有了飞书知识问答之后,你可以指定知识库向它提问,非常轻松的就能检索出所有的相关内容,而且会被重新整理成完整的有逻辑的信息。

体验到这里就结束了。

我在用的时候在想一个问题,那么为什么飞书知识问答这个看起来跟其他 AI 产品没什么区别,但是用起来这么强呢。
核心在于上下文,OpenAI Michelle Pokrass 说过:“AI 最大的瓶颈不是模型能力,而是如何获取足够相关的上下文。”
互联网的信息非常多,但是在企业管理层面互联网信息的作用非常有限,而飞书文档的各种丰富功能和组织形式刚好提供了 B 端管理和生产场景最丰富最全面的上下文内容。
AI 的真正价值在于理解和利用用户的上下文,而在这个企业 AI 化这个层面,做好知识问答是成本最低也是收益最大的方案。
16
歸藏
11:41
Veo 3 直接生成真人播客对话视频,还能指定主题

这要再长点,直接把视频编排 Agent 干死了,果然最后一切都是模型

提示词:一个播客录制场景,两位女性主持人正在讨论有关大语言模型(LLM)训练主题的内容,其中一位提问,另一位解答。
00:08
518
歸藏
11:12
Veo 3 甚至可以生成非常真实的游戏主播玩堡垒之夜的视频

你可以指定游戏画面和主播的口播内容

我复刻了一下,非常真实,游戏的 UI 和物理效果都是对的

数字人就这么被干死了?
00:08
417
歸藏
11:02
谷歌 AI Mode 体验,真的猛啊

直接放到了谷歌搜索最显眼的位置,这得损失多少广告费

目前只支持英文提问,你可以让他用中文输出
61
歸藏
09:09
推出 Google AI Ultra 一站式订阅所有谷歌 AI 服务

直接订阅,这不比Open AI Pro 值多了!

每月 249.99 美元(新用户可享前三个月五折优惠124美元)

Gemni:提供 Deep Research 领域的最高使用限额,优先获得突破性的 Veo 3 模型使用权。

Flow:Google AI Ultra 订阅方案将 Flow 的性能上限提升至 1080p 视频生成、高级摄像机控制及优先体验 Veo 3。

Whisk: Google AI Ultra可获得 Whisk Animate 的最高使用权限,该功能通过 Veo 2 将图像转化为八秒视频

NotebookLM:能获得最高使用限制和增强的模型功能。

Chrome 中的 Gemini:从明天开始,直接在 Chrome 浏览器中抢先体验 Gemini。该功能利用当前页面的上下文。

Project Mariner:这款智能研究原型可通过单一仪表板同时管理多达 10 项任务——从研究到预订和采购。

YouTube Premium:个人版 YouTube Premium 套餐可无广告观看 YouTube 视频、离线收听 YouTube Music

30 TB 存储空间:在 Google Photos、Drive Gmail 中提供海量存储容量
24
歸藏
1天前
Lovart 生成了一套中国戏曲风格的塔罗牌

整体选用的戏曲内容跟对应塔罗牌表达的意思是一样的
94