华强: 哥们儿,这大模型怎么卖的?
老板: 大模型,20块钱一千万Tokens。
华强: 卧槽,这Token皮是金子做的,还是这参数量是金子做的?
老板: 你瞧瞧现在这行情,哪有便宜的啊?这都是顶配的「全自研高集成多模态混合专家模型(MoE)」,你嫌贵我还嫌贵呢。
华强: 行,给我挑一个。
老板: 行。
华强: 这模型行不行啊?
老板: 我开公司的,能卖你生搬硬套的开源微套壳模型?
华强: 我问你这大模型能落地吗?
老板: 你他妈是故意找茬是不是?你要不要吧!
华强: 只要能落地,我肯定要啊。它要是不能落地,买回去天天幻觉、天天胡说八道,你吞下去啊?
老板: 要是不能落地,我自己把它给卸载了!满意了吧?
老板: (转头对小弟)来,给他测一个,1.5万亿参数的。
老板: 瞧好了,MMLU刷榜第一,GSM8K数学满分,Hugging Face排名前三。一共1.5万亿参数,20万Tokens上下文窗口,按量付费算你300块。
华强: 1.5万亿参数?你这Prompt提示词里是不是塞历史对话了?
老板: 你特么故意找茬是不是?
华强: (一把扯过键盘,敲下两行代码,指着屏幕)
华强: 你瞧瞧这底层权重,你瞧瞧这系统Prompt,这不就是开源的 Llama-3 吗?里面还夹着一堆中文微调的死代码,这能有1.5万亿参数?!你这参数量特么缩水了啊!
老板: 你特么查我模型是吧!我……
(华强眼疾手快,一U盘拍在桌上,直接格式化了服务器)
老板小弟: 萨日朗!萨日朗!华强把我们家全量权重开源啦!