闲来无事,让Ai帮我计算一些我平时洗澡会在玻璃上计算的数学问题(对,我洗澡喜欢用雾气写字算数🤡)
一开始只是用了千问,发现千问一开始给的结论和最终的结果不匹配,于是我把同样的问题扔给了豆包和DeepSeek的专家模式,发现他俩也各有问题。
阿里的问题在于答案没错,但最初提供的结论写错。
豆包在于加减乘除的算数顺序有问题,在没有括号的情况下先算了后面的乘除。
DeepSeek专家模式在于它长得像个好学生,写公式计算路径写的非常复杂,然后算出的答案像个弱智,把他的答案让他自己算一遍,他就会发现自己有问题,然后重新算,再给你一个错误的答案。一个问题重新算了四回。太专家了。