即刻App年轻人的同好社区
下载
App内打开
AI百宝箱
62关注94被关注0夸夸
✅好玩的AIGC产品与应用
✅AI前沿技术、观点与趋势
AI百宝箱
1天前
AI程序员产品|阿里云通义灵码AI程序员

阿里云通义灵码AI程序员已全面上线,是全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员产品。

相比传统AI辅助编程工具,能力更全面,可通过全程对话协作完成从0到1的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。

底层模型升级至Qwen2.5-coder,代码生成准确率及生成速度达世界前列,结合智能体技术,复杂任务解决效果显著提升,支持文件、图片、全工程代码检索等上下文和用户输入提示词自由组装。

率先引入多文件代码修改能力,可对工程内多个代码文件同时修改,开发者能看到生成过程及状态,可一键采纳或局部修改,还可通过快照功能回退并重新提问。

在单元测试任务中能自动编译、运行和报错修复,提升准确性和覆盖率,还可自动感知报错信息并给出修复方案和代码建议。

能打破编程语言边界,让Java开发者使用Python、JavaScript等多种语言快速编写网页、小工具、小游戏。例如开发一个具有用户登录、数据管理功能及美化的前端页面,过去需前端及后端工程师配合

官宣!通义灵码 AI 程序员全面上线

00
AI百宝箱
2天前
英伟达推出Cosmos生成式世界基础模型平台

它是生成式世界基础模型平台,主要发力在自动驾驶和机器人领域,能推动物理 AI 系统飞速发展。

Cosmos 只要给它文本、图像或视频提示,就能生成超逼真的虚拟世界状态,输出超独特的视频,给自动驾驶和机器人应用提供支持。

而且它集成了生成式世界基础模型、高级标记器和加速视频处理管道,让开发者能轻松生成大量基于物理的合成数据,不用完全依赖真实世界数据。

Cosmos的模型系列

Nano模型
特点:适用于低延迟和实时应用。
参数规模:约40亿参数。
应用场景:适合需要快速响应的应用场景,如实时视频分析和简单的机器人控制任务。

Super模型
特点:提供高性能基准。
参数规模:约70亿参数。
应用场景:适用于需要较高性能和精度的应用,如自动驾驶车辆的环境感知和决策支持,以及复杂机器人任务的模拟和训练。

Ultra模型
特点:追求最高质量和精确度。
参数规模:约140亿参数。
应用场景:适用于对精度和质量要求极高的应用,如高精度的自动驾驶模拟、复杂的工业机器人操作模拟等。

目前,可在nvidia项目官网、github和huggingface上进行部署体验。
00
AI百宝箱
3天前
4 步速通 LLM 微调:手把手带你用 SiliconCloud 打造领域大模型

此前,SiliconCloud 上线了语言模型的在线 LoRA 微调功能。通过简单的上传语料数据、创建微调任务,就可以获得专属微调语言模型。

最近,SiliconCloud LLM 在线 LoRA 微调,更是扩展了 Qwen2.5-32B、Qwen2.5-14B 以及 Llama-3.1-8B 模型作为微调基座模型,进一步丰富了微调的可玩性,也进一步降低了微调模型的训练、使用成本。

事实上,微调一个自己的专属大语言模型非常简单。使用 SiliconCloud 的微调功能,仅需准备几十条训练语料,就可以让模型产生“显著”区别于基础模型的变化。

4 步速通 LLM 微调:手把手带你用 SiliconCloud 打造领域大模型

00
AI百宝箱
4天前
昆仑万维|天工大模型o1、4o正式上线

天工大模型 o1
推理强:国内首款具中文逻辑推理能力,含 Open、Lite、Preview 三款。Open 版提升开源模型指标;Lite 版中文支持好、推理思考快;Preview 版推理能力强,搭配自研算法。
训练优:三阶段方案,含推理反思、能力强化学习,用自蒸馏等提效率,全球首次公开 Q*算法提升线上推理能力。
应用广:能处理多种推理问题,应用于学术、编程、生活等领域。

天工大模型 4o
多模态:支持文字、语音等输入。
语音助手佳:赋能的 Skyo 助手可主动对话、实时打断,克服“幻觉”,能情感化反应和个性化定制,支持长时间陪伴互动。
响应快:端到端建模,低延迟,接近人对话速度。

「天工大模型4.0」o1版和4o版正式上线天工APP和网页 免费使用

00
AI百宝箱
7天前
还在被三大定会公众号的资讯包围吗?

Oneflow作为深耕AI领域的公众号,一直坚持把具有行业洞察力、文笔犀利专业、商业理念新颖的文章带入大众视野。 也曾被方家瑞等大佬推荐阅读📖

年末,Oneflow 一如既往记录和探讨了诸多生成式AI与大模型领域的变化。并从中精选60多篇文章,并制作成一份900页的“年货”赠予每一位读者朋友,希望帮助更多人了解大模型的构建过程,行业现状与趋势。

这份合集分为八大板块:概览、大模型基本原理、大模型训练没有秘密、大模型“第二增长曲线”:推理、AI芯片变局、生成式AI产品构建、生成式AI产业分析、AGI的挑战与未来。

可以进行免费阅读下载:

900页免费“生成式AI与大模型”电子书|OneFlow年货

00
AI百宝箱
8天前
SiliconCloud x Fastgpt|专属AI知识库构建教程

FastGPT(fastgpt.cn)是由环界云团队开发的基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景。FastGPT 已在 Github 获得 19.4k 个 star。

硅基流动的 SiliconCloud(cloud.siliconflow.cn)是一个大模型云服务平台,并拥有自己的加速引擎。SiliconCloud 能帮助用户低成本、快速地进行开源模型的测试和使用。实际体验下来,他们家模型的速度和稳定性都非常不错,并且种类丰富,覆盖语言、向量、重排序、TTS、STT、绘图、视频生成等数十款模型,可以满足 FastGPT 中所有模型需求。

本文是由 FastGPT 团队编写的教程,将介绍完全使用 SiliconCloud 模型在本地开发部署 FastGPT 的方案。

SiliconCloud x FastGPT:让20万用户打造专属AI知识库

00
AI百宝箱
10天前
无须部署直接玩|CosyVoice2.0支持方言合成
具体而言,与CosyVoice 1.0版本相比,2.0版本有以下优势:

·多语言支持支持语言:中文、英文、日文、韩文、中文方言(粤语、四川话、上海话、天津话、武汉话等)。跨语言 & 混合语言:支持跨语言和代码切换场景下的零样本语音克隆。

·超低延迟双向流式支持:CosyVoice 2.0集成了离线和流建模技术。快速首包合成:在保持高质量音频输出的同时,实现低至150毫秒的延迟。

·高精度发音改进:与CosyVoice 1.0相比,发音错误减少30%到50%。基准成就:在Seed-TTS评估集的困难测试集上达到最低的字符错误率。

·强稳定性音色一致性:确保零样本和跨语言语音合成的音色可靠一致。跨语言合成:与1.0版本相比有显著改进。

·自然流畅度韵律和音质增强:将MOS评估分数从5.4提高到5.53。情感和方言灵活性:支持更精细的情感控制和方言口音调整。

现在,无需复杂本地部署,小白也可以轻松体验高质量的cosyvoice2.0语音合成。

只需要注册登录一站式云平台SiliconCloud,就可以免费体验哦,还可以结合平台其他免费AI大模型,轻松实现交叉调用~

Siliconcloud上线加速版CosyVoice2:150ms实时语音合成,支持混合语种和方言

00
AI百宝箱
10天前
智谱AI推出深度推理模型|GLM-Zero

近日,智谱发布了基于扩展强化学习技术训练的推理模型GLM-Zero的初代版本GLM-Zero-Preview。

以下是对该模型的介绍:
技术特点:核心技术为扩展强化学习(ERL),允许模型根据反馈不断进行自我优化,进而提升推理的准确性和适应性。还涉及生成对抗网络(GAN)、变分自编码器(VAE)和多模态AI技术,能够创造出更加真实和多样化的输出,并处理并理解文本、音频与视频等不同类型的数据。

能力表现:
逻辑推理:善于识别逻辑漏洞,能够模拟多种假设和可能性,如在处理特定图片时,能识别其中数字并发现“9”可倒置为“6”这一关键。
数学能力:具有强大的归纳与演绎能力,能够快速处理复杂的数学运算,解答代数、微积分、概率统计等领域的问题。
代码编写:能够熟练使用多种编程语言,帮助开发者快速编写代码,如可根据指令用html编写一个有趣的第一人称射击游戏,还能在代码调试方面提供详细修复建议。

使用方式:用户现已可以通过「智谱清言」(chatglm.cn)中的「Zero推理模型」智能体免费使用,支持上传文字或图片,并输出完整的推理过程。开发者也可以在「智谱开放平台」(bigmodel.cn)中通过API进行调用。

2024 最后一环,智谱开启对 GLM-Zero 探索。

00
AI百宝箱
11天前
支付宝推出新一代AI视觉搜索产品“探一下”

近日,支付宝推出了新一代AI视觉搜索产品“探一下”,以下是其具体介绍:

核心技术

基于支付宝自研的多模态大模型技术,将计算机视觉与自然语言处理相结合,能够快速、准确地分析和识别图像,并生成相应的文本信息.

主要功能

探知识:帮助用户识别花草、昆虫、美食、建筑等,如户外旅行时可获取陌生植物的相关信息,年轻人购买潮玩时可查阅种草攻略,家长还可借此识别玩具角色.
探灵感:能为宠物照片定制“读心物语”,也可为儿童成长瞬间生成趣味配文,丰富用户的社交分享内容.
探文本:方便用户在国外旅行或学习外语时,快速识别外文菜单、招牌等并进行翻译,还可查询药品说明书等信息,若需更多用药须知可调用“AI健康管家”.

使用方式

用户在支付宝首页点击“扫一扫”后左滑,或通过支小宝App,即可找到并使用“探一下”.

来支付宝「探一下」,满足你的好奇心

00
AI百宝箱
14天前
近日,阿里巴巴通义千问团队为各位开发者送上了“圣诞礼物🎁”,QVQ-72B-Preview —— 一个基于 Qwen2-VL-72B 构建的开源多模态推理模型。

QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。在 MMMU 评测中,QVQ 取得了 70.3 的优异成绩,并且在各项数学相关基准测试中相比 Qwen2-VL-72B-Instruct 都有显著提升。通过细致的逐步推理,QVQ 在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。

SiliconCloud上线加速版QVQ:2025考研数学成绩近100分

00