会员服务
default sy_dh
在线客服
同样作为清华出身的AI,十角度评测智谱清言和kimich - AI副业赚钱 - 富裕者联盟社区 - Affiliate营销圈

回答

收藏

同样作为清华出身的AI,十角度评测智谱清言和kimich

AI副业赚钱 AI副业赚钱 105 人阅读 | 0 人回复 | 2024-05-29

同样作为清华出身的AI,十角度评测智谱清言和kimichat哪个更强
同样作为清华出身的AI,十角度评测智谱清言和kimichat哪个更强

AI大模型目前真的是汗牛充栋,不过智谱清言和KimiChat这两家真值得评测一下,两家AI公司的产品都是AIGC大模型领域的明星产品,且都属于清华系,再技术能力方面都各有千秋,且都可以免费使用,但究竟PK起来孰优孰劣呢?咱们还是实际对比一番比较好。



常识判断类问题

1.  我们先给了一道选择题,是关于中国历史人才选拔制度的,题目来自于国家公务员考试试卷。

首先是KimiChat的回答,这道题它回答对了,而且解释得也基本正确。



我们再来看看智谱的回答,注意我们选择最新版GLM-4,可以看到智谱这道题虽然答案说对了,但是解释有些幻觉了,回答也过于简单,不过提供了三个追问来给用户选择,算是一点补救吧:



2.  我们再来看一道题,这道题是问诗词作者的作品,而没有直接点到我们熟知的诗人名字,而是取了他们的字,比如曹子建就是曹植,李太白自不必说,苏子瞻就是苏轼。我们先看kimi的回答,感觉它有点晕了,明明已经解释了D是苏轼的回答,但是还选了D这个错误答案。况且,在解释B的时候,这首词明明是辛弃疾写的,有点乱扯了。



我们对比看看智谱的回答,这次智谱掰回一局,回答完全正确。



综上,虽然两个样本有些少,但我们可以看到,对于常识的回答,两个AI工具都不要全信,最好对比来综合判断。



数学能力

我们再来对比下他们俩的数学计算能力,首先也是一道国考中的概率题,先看看kimi的回答:



这道题kimi回答得有板有眼,步骤清晰,公式明确,给出了详细的计算过程,答案也是对的,这样让不会算的人也知道怎么算了。

我们再来看看智谱的回答:



也有分析过程,可是最后的计算直接交给了代码,算出了近似值出来,猜对了答案,可以看出智谱具备多步分析的能力,而且可以自己调用代码解释器进行代码生成和结果输出,不过从解题的角度来讲,还是告诉用户一步步怎么计算更好些。所以还是kimi这次回答得更好些。




言语理解与表达

考察完了数学能力,我们再来看看两款工具的语文功底。这是一道如何遣词造句的题目,先看看kimi的回答,答案是正确的,感觉它站在了当时历史的角度来分析,有理有据:



智谱的回答则用到了排除法,基本是从语法的角度来理解,在确定了第一个答案后,第二个直接代入验证,更像个纯粹语法分析的同学。所以这一





















































试读已结束,加入《Affiliate营销圈》全文更精彩

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
分享到:
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭