在刚刚发布的 Chatbot Arena 中,又多了一个中国模型!
Qwen-Max-2025-01-25 以 1332 分冲上第七,超过了 DeepSeek v3(第八)和 Claude-3.5-sonnet(第14)。
简单说一下,Qwen2.5-Max 是一个大规模MoE模型,预训练超20万亿token,并采用SFT+RLHF精调。相比 DeepSeek V3、GPT-4o、Claude 3.5 Sonnet等顶级模型,它表现稳健,甚至在多个基准测试中领先。
Qwen2.5-Max 的基础模型,也在开源巨头中称霸,对比DeepSeek V3、Llama-3.1-405B等模型,优势明显。
相关 paper:
arxiv.org目前,Chatbot Arena 的前十里,已经有 3 家 的 4 款国产模型了(Qwen,DeepSeek, GLM)
最后...欧洲人在干啥?