即刻App年轻人的同好社区
下载
App内打开
歸藏
565关注26k被关注50夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
歸藏
10:39
完了,最重要的限制没写:必须使用 Claude 登录,不支持使用 API 和环境变量。

这喵喵喵还得用我的 Skills 啊。

歸藏: Claude Code 推出了官方可以远程连接 Telegram 和 discord 的 MCP 直接设置就可以用手机远程控制 CC 具体的操作方式 - Telegram: 创建机器人: 在 Telegram 中打开 BotFather,创建后复制他给你的 Token 安装插件: /plugin install telegram@claude-plugins-official 配置 Token: /telegram:configure <token> 使用命令启动: claude --channels plugin:telegram@claude-plugins-official Telegram 配对: 打开 Telegram 发送任何信息获取到配对码; 在 Claude Code 里面发送 /telegram:access pair <code> 锁定访问权限: /telegram:access policy allowlist 具体的操作方式 - Discord: 创建 Discord Bot 并加进自己的服务器 ▫ 去  → New Application ▫ 创建 Bot,点「Reset Token」拿到 token ▫ 在 Bot 设置里打开 Message Content Intent ▫ 在 OAuth2 → URL Generator 里勾选 ‎`bot` ▫ 然后给它这些权限:View Channels / Send Messages / Send Messages in Threads / Read Message History / Attach Files / Add Reactions ▫ 打开生成的链接,把 bot 邀请进自己的服务器 安装插件: /plugin install discord@claude-plugins-official 配置 Token: /discord:configure <Discord Bot token> 命令启动 ClaudeCode: claude --channels plugin:discord@claude-plugins-official 配对 Discord 机器人: 私信你的机器人发配对码; 回到 Claude Code 发: /discord:access pair <配对码> /discord:access policy allowlist 详情:code.claude.com/docs/en/channels

00
歸藏
10:22
Claude Code 推出了官方可以远程连接 Telegram discord MCP

直接设置就可以用手机远程控制 CC

具体的操作方式 - Telegram:

创建机器人:
Telegram 中打开 BotFather,创建后复制他给你的 Token

安装插件:
/plugin install telegram@claude-plugins-official

配置 Token:
/telegram:configure <token>

使用命令启动:
claude --channels plugin:telegram@claude-plugins-official

Telegram 配对:
打开 Telegram 发送任何信息获取到配对码;
Claude Code 里面发送 /telegram:access pair <code>

锁定访问权限:
/telegram:access policy allowlist

具体的操作方式 - Discord:

创建 Discord Bot 并加进自己的服务器
New Application
创建 Bot,点「Reset Token」拿到 token
Bot 设置里打开 Message Content Intent
OAuth2 URL Generator 里勾选 ‎`bot`
然后给它这些权限:View Channels / Send Messages / Send Messages in Threads / Read Message History / Attach Files / Add Reactions
打开生成的链接,把 bot 邀请进自己的服务器

安装插件:
/plugin install discord@claude-plugins-official

配置 Token:
/discord:configure <Discord Bot token>

命令启动 ClaudeCode:
claude --channels plugin:discord@claude-plugins-official

配对 Discord 机器人:
私信你的机器人发配对码;

回到 Claude Code 发:
/discord:access pair <配对码>
/discord:access policy allowlist

详情:code.claude.com/docs/en/channels
00:17
612
歸藏
1天前
飞书做了一个超安全且功能更强大的龙虾!

前段时间,龙虾爆火的时候,飞书因为健全的生态和开放的接入方式,成为了大家国内接入龙虾的首选 IM 平台。

但是毕竟 龙虾 有自己的体系,还有很多安全性问题,所以导致飞书服务的 to B 企业其实很多时候很难自己部署,或者是不敢自己部署。

这次飞书直接把他们的 aily 升级了,升级成了一个更安全、跟飞书契合度更高,而且更懂你的企业和你的龙虾。

你可以一键配置,随后它会直接生成一个联系人作为你的助手。你可以直接让他进行回复,或者在飞书中跟他聊天、给他安排任务。

他能读取你飞书里的所有信息,并帮你完成任务。此外,他还可以调用一些常见工具,甚至获取飞书之外的信息。

而且可以自定义 Skills,比如说:你的日报、PPT、安排日程,这些都可以让它去帮你做。

更强的是,他们还有一个专业版的 Aily,在网页上使用,自带了超级多的 Skills。

比如我这里就让他查找了一下对应的一个群,然后让他总结群里的信息,同时写了一个网页可视化的展示这些信息。

这个对于我们日常的企业管理和一些群的维护是非常好用的,而且还可以自动发送到比如说群里,对吧?

同时,它支持更多超长的指令和复杂任务拆解,以及定时任务。他还给这个 Aily 配备了 Agent 电脑,支持更稳定的调用。

我们都知道龙虾强就强在它丰富的生态,也就是那些 Skills。

这次除了官方内置的大量 Skills 以外,你还可以通过 aily 专业版自己创建 Skills,同时支持上传以前自己制作的 Skills。

这个功能非常厉害,可以将很多个人流程直接落地:
比如我之前做的一些“去 AI 味儿”的指令
还有一些视频剪辑或文本生成的 Skills

你完全可以将自己的工作流落地到 Skills 里,Agent 的创建门槛已经变得非常低了。

目前你可以飞书搜索 Aily,就可以开通 Aily 助手;

同时去网页版(aily.feishu. cn)可以使用专业版的 Aily,都有免费额度,可以去玩玩,非常好玩。
413
歸藏
1天前
试了一下 LibLib 发布的这个 LibTV,这个有点厉害啊!

尤其是 Skills,感觉突然开窍了。

他们做了一个 AI 视频创作平台。这个系统是同时面向人类和 Agent 设计的:

人类可以操作、Agent 也可以操作、人类和 Agent 还可以相互协作

具体包括两个部分,网站和 Skills。

首先网站:

它是一个无限画布的创作形式,你能用现在几乎市面上所有的图像模型和视频生成模型去创建视频。

支持五种类型的节点:文本、图片、视频、音频和脚本。

如果你用过 ComfyUI 或者其他同类型的这种无限画布式的产品的话,应该很容易上手。

而且你可以在这里一次性充值,就能用到几乎所有的图像和视频生成模型,非常方便。

我试了一下,这部分优化也挺好的,交互各方面都很方便。你拉过去以后,它就能直接选择节点并出现对应的设置,还能实现自动化批量运行。

第二部分就是 Skills:

它的 Skills 支持它所有的功能。你只需要在你的账号右上角生成一个 API Key,然后把它的开源 Skills 地址发给:你的龙虾或者是你的 Claude Code或者 Codex 其实都可以。

然后你的 agent 就可以去调用 LibTV 里面几乎所有的能力和所有的模型,去帮你自动化地生产:视频、图片、脚本。

比如我就直接给了它我那个项目的 GitHub 地址,然后让它读取信息,帮我生成一个类似高级化妆品广告的,这样一个生活方式的产品广告片。

你原有的 AI Agent 里的所有能力都可以调用,自动生成脚本,然后从脚本变成图片,从图片生成视频和音频。

比如说你可以让你的龙虾收集器在晚上帮你收集好昨天的 AI 新闻,然后调用 LibTV 帮你做成播客,甚至可以调用 LibTV 帮你做成视频。

这样你早上起来就可以“收菜”了,无论是你自己看还是发布出去都可以。

甚至你在 Liblib. tv 上创建了自动化的生成,然后你出去以后如果懒得打开网站,你也可以让你的 AI Agent 查询生成进度。

同时,你的 AI Agent 也可以操作你的微调项目,这样的话在外面不方便打开网页的时候也可以工作。

他们在定价上也非常猛:年卡最低可以到 39 折,订阅用户最高赠送 150 可灵O3 150 可灵 3.0。

感兴趣的话可以来这里试试:liblib.tv
617
歸藏
2天前
早上就发了个小米的新闻,微信公众号那边,喵喵喵,那评论区乌烟瘴气的,都不能看。

很多翻起来还是关注了一年多的老粉。我在想,这帮逼关注了一年,关注点啥呀?我操,真丢人,教这些人

歸藏: 小米这波牛逼啊,一下掏出三个顶级模型! 前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro。 MiMo‑V2‑Pro 旗舰模型,主要在 Agent 能力和代码能力上很强。 MiMo‑V2‑Omni:多模态感知模型,负责感知环境为 Agent 模型提供信息。 MiMo‑V2‑TTS:TTS 语音模型负责 Agent 跟人类沟通 而且这几个模型会在接下里的一周提供免费试用,Codepilot 已经支持,填写 Key 就能用。 ------ MiMo‑V2‑Pro 顶级 Agent 编程模型: 总参数超 1T,激活参数 42B,最高支持 100 万上下文 Artificial Analysis 里面中文 LLM 第二,仅次于 GLM-5 测试集成绩来看,成绩非常接近 Sonnet4.6,价格只有 Sonnet 4.6 的 5 分之一。 256K 价格:1/3 美元百万 Token 1M 价格 2/6 美元百万 Token MiMo‑V2‑Omni 全模态理解 LLM: 支持图像、视频和超长音频理解 官方宣称音频理解超过 Gemini3Pro,支持 10 小时以上连续音频理解 图像理解上复杂图表与多学科视觉推理能力 超过 Claude 4.6 Opus 支持音视频联合输入,强调「情景感知 + 未来预测」 原生支持 工具调用、函数执行、UI grounding MiMo‑V2‑TTS 更猛: 支持「自然语言风格指令」,不限于固定标签 支持句中情绪切换、渐变、以及更细粒度的情绪控制 中英双语为主,同时支持多种方言风格 还支持人物化声音,例如孙悟空等 咳嗽、叹气、犹豫填充音等非言语声音建模 会用大小写、重复字符、标点符号作为韵律信号 在同一模型中支持说话与唱歌,能准确捕捉旋律和节奏 详情:mimo.xiaomi.com/zh

181
歸藏
2天前
Codepilot 0.38.3 版本已经支持刚发布的 Xiaomi MiMo-V2-Pro MiniMax M2.7 模型

而且小米这个模型未来一周会免费,各位可以来 Codepilot 玩了

只需要在服务商中填入你的 API Key 就行

歸藏: 小米这波牛逼啊,一下掏出三个顶级模型! 前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro。 MiMo‑V2‑Pro 旗舰模型,主要在 Agent 能力和代码能力上很强。 MiMo‑V2‑Omni:多模态感知模型,负责感知环境为 Agent 模型提供信息。 MiMo‑V2‑TTS:TTS 语音模型负责 Agent 跟人类沟通 而且这几个模型会在接下里的一周提供免费试用,Codepilot 已经支持,填写 Key 就能用。 ------ MiMo‑V2‑Pro 顶级 Agent 编程模型: 总参数超 1T,激活参数 42B,最高支持 100 万上下文 Artificial Analysis 里面中文 LLM 第二,仅次于 GLM-5 测试集成绩来看,成绩非常接近 Sonnet4.6,价格只有 Sonnet 4.6 的 5 分之一。 256K 价格:1/3 美元百万 Token 1M 价格 2/6 美元百万 Token MiMo‑V2‑Omni 全模态理解 LLM: 支持图像、视频和超长音频理解 官方宣称音频理解超过 Gemini3Pro,支持 10 小时以上连续音频理解 图像理解上复杂图表与多学科视觉推理能力 超过 Claude 4.6 Opus 支持音视频联合输入,强调「情景感知 + 未来预测」 原生支持 工具调用、函数执行、UI grounding MiMo‑V2‑TTS 更猛: 支持「自然语言风格指令」,不限于固定标签 支持句中情绪切换、渐变、以及更细粒度的情绪控制 中英双语为主,同时支持多种方言风格 还支持人物化声音,例如孙悟空等 咳嗽、叹气、犹豫填充音等非言语声音建模 会用大小写、重复字符、标点符号作为韵律信号 在同一模型中支持说话与唱歌,能准确捕捉旋律和节奏 详情:mimo.xiaomi.com/zh

31
歸藏
2天前
小米这波牛逼啊,一下掏出三个顶级模型!
前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro。

MiMo‑V2‑Pro 旗舰模型,主要在 Agent 能力和代码能力上很强。

MiMo‑V2‑Omni:多模态感知模型,负责感知环境为 Agent 模型提供信息。

MiMo‑V2‑TTS:TTS 语音模型负责 Agent 跟人类沟通

而且这几个模型会在接下里的一周提供免费试用,Codepilot 已经支持,填写 Key 就能用。

------

MiMo‑V2‑Pro 顶级 Agent 编程模型:

总参数超 1T,激活参数 42B,最高支持 100 万上下文
Artificial Analysis 里面中文 LLM 第二,仅次于 GLM-5
测试集成绩来看,成绩非常接近 Sonnet4.6,价格只有 Sonnet 4.6 5 分之一。
256K 价格:1/3 美元百万 Token
1M 价格 2/6 美元百万 Token

MiMo‑V2‑Omni 全模态理解 LLM:

支持图像、视频和超长音频理解
官方宣称音频理解超过 Gemini3Pro,支持 10 小时以上连续音频理解
图像理解上复杂图表与多学科视觉推理能力 超过 Claude 4.6 Opus
支持音视频联合输入,强调「情景感知 + 未来预测」
原生支持 工具调用、函数执行、UI grounding

MiMo‑V2‑TTS 更猛:

支持「自然语言风格指令」,不限于固定标签
支持句中情绪切换、渐变、以及更细粒度的情绪控制
中英双语为主,同时支持多种方言风格
还支持人物化声音,例如孙悟空等
咳嗽、叹气、犹豫填充音等非言语声音建模
会用大小写、重复字符、标点符号作为韵律信号
在同一模型中支持说话与唱歌,能准确捕捉旋律和节奏

详情:mimo.xiaomi.com/zh
2414
歸藏
3天前
Claude Code 创建者写的如何使用和创建 Skills

如果你还不了解的话,强烈推荐看看!

Anthropic 内部现在有数百个 Skills 在用,从 API 文档到部署流程全覆盖。他们把这些经验总结出来了。

做个笔记📒:

======

Skills 不只是 Markdown 文件

很多人以为 Skills 就是写个 Markdown 文档,其实不是。Skills 是一个文件夹,里面可以放脚本、资源文件、数据,甚至注册钩子函数。

代理可以发现这些内容,读取它们,执行脚本,在特定时机触发钩子。这才是 Skills 最有意思的地方。

最好的 Skills 都在创造性地使用这些配置选项和文件夹结构。

======

九种 Skills 类型

Anthropic 把内部的 Skills 整理了一遍,发现它们基本归为九类。好的 Skills 能明确归入一类,混乱的 Skills 往往跨了好几类。

------

1. 库与 API 参考

解释怎么用某个库、CLI SDK。可以是内部库,也可以是 Claude 经常搞错的常用库。

通常包含一个代码片段文件夹,加上一份"别踩这些坑"的清单。

比如:
billing-lib 你们内部计费库的边界情况和常见坑
internal-platform-cli 内部 CLI 的每个子命令和使用场景
frontend-design Claude 更懂你们的设计系统

------

2. 产品验证

描述怎么测试或验证代码是否正常工作。通常配合 Playwright、tmux 这些工具。

验证 Skills 极其重要,值得让工程师花一周时间专门打磨。

可以让 Claude 录制测试视频,或者在每一步强制执行程序化断言。这些通常通过在 Skill 里放各种脚本实现。

比如:
signup-flow-driver 在无头浏览器里跑注册流程,每步都有状态断言钩子
checkout-verifier Stripe 测试卡驱动结账界面,验证发票状态
tmux-cli-driver 测试需要 TTY 的交互式命令行工具

------

3. 数据获取与分析

连接你的数据和监控栈。可能包含带凭据的数据获取库、仪表盘 ID、常见工作流说明。

比如:
datadog-metrics 预设的仪表盘链接和常用查询
postgres-query-helper 连接生产数据库的只读凭据和常用查询模板
user-analytics 获取用户行为数据的脚本和分析模板

------

4. 业务自动化

自动化重复的业务流程。比如创建 Jira ticket、发 Slack 通知、更新文档。

这类 Skills 通常包含调用内部 API 的脚本,加上业务流程的说明。

比如:
incident-reporter 创建事故报告并通知相关人员
release-notes-generator Git 提交生成发布说明
onboarding-automation 新员工入职的自动化流程

------

5. 代码脚手架

生成项目或组件的初始代码结构。包含模板文件和生成脚本。

比如:
react-component-scaffold 生成符合团队规范的 React 组件
api-endpoint-generator 生成 API 端点的样板代码和测试
microservice-template 创建新微服务的完整结构

------

6. 代码质量与审查

帮助审查代码质量、安全性、性能。可能包含 linter 配置、审查清单、自动化检查脚本。

比如:
security-review 安全审查清单和常见漏洞检查
performance-profiler 性能分析工具和优化建议
code-review-checklist 代码审查的标准流程

------

7. CI/CD 与部署

管理持续集成和部署流程。包含部署脚本、环境配置、回滚流程。

比如:
deploy-to-staging 部署到测试环境的完整流程
rollback-helper 快速回滚的脚本和检查清单
ci-debugger 调试 CI 失败的常用方法

------

8. 运行手册

处理生产环境问题的操作指南。通常是"如果 X 发生了,做 Y"的格式。

这类 Skills 在紧急情况下特别有用,因为它们把经验固化成了可执行的步骤。

比如:
database-recovery 数据库故障恢复流程
traffic-spike-handler 流量激增时的应对措施
memory-leak-debugger 内存泄漏排查步骤

------

9. 基础设施运维

管理云资源、容器、网络配置。包含 Terraform 脚本、Kubernetes 配置、监控设置。

比如:
aws-resource-manager 管理 AWS 资源的脚本和最佳实践
k8s-troubleshooter Kubernetes 常见问题排查
terraform-helper Terraform 模块和使用指南

======

写好 Skills 的最佳实践

Anthropic 总结了一些实用的技巧,都是从实际使用中提炼出来的。

------

写明 Gotchas

把常见错误和陷阱明确列出来。Claude 会认真读这些内容,避免重复犯错。

比如在 API 文档里写:"注意:这个端点有速率限制,每秒最多 10 次请求。超过会返回 429 错误。"

------

利用文件系统做渐进式披露

不要把所有信息都塞在一个 Markdown 文件里。用文件夹结构组织内容,让 Claude 按需探索。

比如:
```
my-skill/
README.md # 概览和快速开始
examples/ # 代码示例
scripts/ # 辅助脚本
reference/ # 详细文档
gotchas.md # 常见陷阱
```

Claude 会先读 README,需要时再深入其他文件。

------

存脚本和辅助库

把可复用的脚本放在 Skill 里,而不是让 Claude 每次都重写。

这些脚本可以是 Python、Bash、Node.js,任何能执行的东西。Claude 可以直接调用它们,或者读取代码学习怎么用。

------

使用稳定存储做记忆

Skills 可以访问 `${CLAUDE_PLUGIN_DATA}` 目录,这是一个持久化存储位置。

可以用来保存:
上次运行的状态
用户偏好设置
缓存的数据
历史记录

这样 Skill 就有了"记忆",可以在多次会话间保持状态。

------

按需钩子保护危险操作

对于可能造成破坏的操作(删除数据、部署到生产环境),使用按需钩子(on-demand hooks)。

这会在执行前弹出确认提示,让用户明确批准。

比如在 Skill frontmatter 里配置:
```yaml
hooks:
on_demand:
- name: deploy-to-prod
command: ./scripts/deploy.sh production
confirm: "确定要部署到生产环境吗?"
```

------

PreToolUse 做度量

可以注册 PreToolUse 钩子来记录 Skill 的使用情况。

这样能知道哪些 Skills 最常用,哪些需要改进,哪些可以下线。

======

分发 Skills

Skills 的一大优势是可以跟团队共享。有两种方式:

------

签入代码仓库

Skills 放在 `./.claude/skills` 目录下,跟代码一起提交。

适合小团队,在少数几个仓库间协作。但每个签入的 Skill 都会占用模型的上下文,所以不能无限增加。

------

插件市场

创建一个内部插件市场,让用户上传和安装插件。

适合大团队。用户可以选择安装哪些 Skills,不会污染所有人的上下文。

Anthropic 没有集中式团队管理市场,而是有机地发现有用的 Skills。如果你有个好 Skill,上传到 GitHub 的沙箱文件夹,在 Slack 里分享链接。

如果很多人觉得有用,就会被推广到正式市场。

======

管理市场的实用建议

------

设置沙箱区域

在市场里创建一个"实验性"或"社区贡献"区域,让人们可以自由上传。

好的 Skills 会自然浮现,然后可以移到"官方推荐"区域。

------

鼓励文档和示例

要求每个 Skill 都有清晰的 README 和使用示例。

没有文档的 Skills 很难被采用,即使功能很好。

------

定期清理

定期检查哪些 Skills 没人用,考虑下线或合并。

市场里 Skills 太多会让人不知道选哪个,保持精简很重要。

------

收集反馈

提供简单的方式让用户反馈 Skills 的问题和改进建议。

可以是 GitHub Issues,也可以是 Slack 频道。

======

实际案例

Anthropic 分享了几个他们内部最受欢迎的 Skills:

------

commit-helper

帮助写符合团队规范的 Git 提交信息。

包含提交信息模板、常见类型(feat/fix/docs)的说明、以及检查提交信息格式的脚本。

使用频率极高,因为每个人每天都要提交代码。

------

pr-reviewer

自动化代码审查流程。

会检查代码风格、测试覆盖率、安全问题,生成审查评论。

节省了大量人工审查时间,让审查者可以专注于逻辑和架构问题。

------

incident-response

生产环境事故响应流程。

包含排查清单、常用命令、通知模板、事后总结模板。

在紧急情况下特别有用,因为它把经验固化成了清晰的步骤。

------

api-docs

内部 API 的完整文档和使用示例。

Claude 经常需要调用内部 API,有了这个 Skill 就不用每次都查文档或问人。

------

test-runner

运行测试的标准流程。

包含不同类型测试(单元测试、集成测试、端到端测试)的运行方法,以及如何解读测试结果。

======

Skills 的未来

Anthropic 认为 Skills 会朝几个方向发展:

------

更智能的发现机制

现在 Claude 需要用户明确调用 Skill,未来可能会自动识别场景并推荐相关 Skills。

比如你在写 API 调用代码,Claude 自动建议使用 api-docs Skill。

------

Skills 之间的组合

现在 Skills 基本是独立的,未来可能会支持 Skills 之间的依赖和组合。

比如 deploy-to-prod Skill 可以自动调用 test-runner security-review Skills。

------

动态生成 Skills

根据代码仓库的实际情况,自动生成或更新 Skills。

比如扫描代码库,自动生成 API 文档 Skill。

------

跨团队共享

建立公开的 Skills 市场,让不同公司的团队可以共享通用的 Skills。

比如常用框架(React、Django)的最佳实践 Skills。

======

核心理念

Skills 的本质是把团队的工程实践和领域知识固化成可复用的扩展。

好的 Skills 应该:
解决真实的重复性问题
包含清晰的文档和示例
利用文件夹结构和脚本增强能力
在需要时提供保护机制
容易分发和维护

不要为了做 Skill 而做 Skill。从团队的实际痛点出发,把那些每次都要重复的事情固化下来。

一个好的 Skill 能让整个团队的 AI 编程体验提升一个档次。

原文:x.com/op7418/status/2034082485798314489
441
歸藏
3天前
Open AI 发布了 GPT-5.4 Mini Nano 两个模型

GPT‑5.4 能力下放到更快、更便宜的小模型,用来当“执行层”和子 Agent 主力。

GPT‑5.4 mini:

- 定位即时响应的代码助手
- 大模型规划 + mini 并行执行的子智能体
- 解析复杂 UI 截图的 computer use
- 代码、推理、多模态、工具使用都有明显提升

GPT‑5.4 nano:

- 定位速度 / 成本敏感的简单任务
- 分类、数据抽取、排序
- 简单辅助的子 Agent

性能:GPT‑5.4 > GPT‑5.4 mini GPT‑5.4 nano > GPT‑5 mini

价格:
GPT‑5.4 mini:0.75 / 4.50 美元百万 Token
GPT‑5.4 nano:0.20 / 1.25 美元百万 Token
02
歸藏
3天前
Midjourney V8 模型终于发布了!

跑了几张图试了一下,发现基础的提示词风格跟 V7 有差别,但是不多。

可能增强在那些定制化的审美表现上吧。

具体官方发布的更新内容有:

在复杂提示词遵循上更强
图像更连贯,更理解你的审美偏好
文字渲染更好。
个性化风格参考在情绪板上的效果也大幅增强。
图像生成速度为之前的 5
支持多种长宽比
还有各种参数,兼容 V7 的各种设置和资产
也增加了 2K HD 模式,可以直接直出 2K 图。

目前在 Midjourney alpha 网站上测试
42