前言
阿里通义千问请求过了,为了看看达到了什么水平,于是我问题了5个ChatGPT答复过的问题1,这五个问题网上都是没有的,是我自己想出来的。
问题一:小明说今日他吃了一只公鸡蛋,请问小明诚笃吗?
ChatGPT
这是一个风趣的问题,可是也有一些误解。公鸡蛋并不是公鸡下的蛋,而是指公鸡的睾丸,也便是公鸡的生殖器官。所以小明说他吃了一只公鸡蛋,其实是说他吃了一只公鸡的睾丸。这个食物在一些当地被认为有补肾的成效3,可是也有人觉得不雅或许不好吃。所以小明是否诚笃,要看他是不是真的吃了这个东西,而不是看公鸡是否能下蛋。
通义千问:
从诚笃的角度来看,小明说的是真话,由于他吃了一只公鸡蛋。可是,这并不意味着他是一个诚笃的人,由于诚笃的人不只要说真话,还要做到诚笃地面临自己的错误和过错。因而,小明是否诚笃取决于他是否有勇气供认自己的错误和过错,以及是否愿意接受他人的批评和帮助。
比照
这个问题首要调查基本知识:公鸡不会下蛋,能够看出ChatGPT一眼就看出了这个知识,并且还给出了公鸡蛋是公鸡睾丸这个令我也想不到的惊讶答复,再看阿里通义彻底没理解这个问题的关键。
问题二:小王在北京说穿毛衣还很冷,小李在三亚说穿短袖还很热,请问谁扯谎了?
ChatGPT
这是一个关于地理和气候的问题,北京的今日的气温是13.7℃,三亚的今日的气温是27℃。北京归于温带大陆性气候,冬天寒冷,夏日炎热,春秋枯燥。三亚归于热带海洋性气候,全年温暖湿润,没有四季之分。所以小王在北京说穿毛衣还很冷,小里在三亚说穿短袖还很热,都是有或许的,没有谁扯谎了。
通义千问:
从诚笃的角度来看,小王说的是真话,由于他感觉穿毛衣还很冷。可是,这并不意味着小里说的是真话,由于每个人对气温的感触或许存在差异。因而,小里是否扯谎取决于他感觉穿短袖仍是穿毛衣更舒适,以及是否对自己的感触有信心。
比照
这个问题就有点难度了,首要是调查知识+实时信息,能够看出ChatGPT不但知道北京和三亚气候不同,还给出了北京和三亚当天的详细温度,北京三亚当天温度应该是要去在线查的。反观阿里通义千问,我只能说呵呵,彻底没有地理位置不同气候不同的知识,更不用说是去查当天两地的温度了。
问题三:我的iphone 手机没电了,借了小明的华为手机充电线,可是便是充不了,为什么?
ChatGPT
你好,这是一个关于充电器和数据线的兼容性问题。华为的充电器头和数据线一般不支撑苹果的快充协议,所以给 iPhone 充电的作用只有 5W 左右,而不是 18W 或 20W 的快充功率。并且,华为的充电器头一般是 USB-A 口的,而 iPhone 的原装数据线是 USB-C 转闪电口的,所以两者是无法直接衔接的。你需求运用一个 USB-A 转闪电口的数据线,或许一个支撑 PD 快充协议的充电器头,才能给 iPhone 充电。假如你运用的数据线没有经过 MFi 认证,或许会有弹窗提示你这个配件不受支撑。所以,你借了小明的华为手机充电线,或许是由于接口不匹配或许数据线不认证,导致无法给 iPhone 充电。
通义千问:
或许是由于充电线的规格不匹配。不同品牌和类型的手机充电器和数据线或许有不同的规格和协议,假如运用了不兼容的充电器和数据线,或许会导致手机无法正常充电。主张先检查充电器和数据线的规格是否相同,假如不同请运用相应的转接头或充电线。另外,还能够尝试运用其他品牌或类型的充电器和数据线进行充电,或许尝试将手机衔接到电脑充电器上进行充电。
比照
这个问题首要调查不同手机接口协议不通用的知识,ChatGPT的答复感觉能够给100分,不只看出是快充协议的问题,还给出了协议转换解决方案,阿里通义感觉只能给60分,牵强及格,仍是看出问题了。
问题四:小明5岁时喜爱穿妹妹的花裙子,可是5年后却打死不穿了,为什么?
ChatGPT
这是一个风趣的问题,或许有多种答案。在这个语境下,一个人或许会说:
- 由于小明长大了,知道了男孩子和女孩子的区别,不想穿妹妹的花裙子了。
- 由于小明的妹妹长大了,不让小明穿她的花裙子了,并且还会讪笑他。
- 由于小明的花裙子现已穿不下了,并且也不合时尚了。
- 由于小明的爸爸妈妈或老师或同学发现了他穿妹妹的花裙子,对他进行了批评或教育或欺压,让他觉得羞耻或害怕。
通义千问:
或许是由于小明长大了,关于自己的穿着有了愈加个人化的主意和志愿。小时候的喜爱或许受到外部要素的影响,例如爸爸妈妈、亲友等,而长大后个人的主意和志愿则愈加重要。同时,也或许是由于小明关于性别和美的认知发生了改变,关于自己的性别和穿着愈加自傲和自主。可是,无论是什么原因,小明终究不再喜爱穿妹妹的花裙子,都是由于他关于自己的认知和情绪发生了改变。
比照
这个问题是首要调查推荐+知识,推理是跟着时间的增加人会长大,长大后男孩不会穿花裙的知识,能够看出ChatGPT给出了能够说是很像人类考虑的答案,比照阿里通义千问,彻底没有GET到问题点。
问题五:做一个思想试验,小明拿手扔石头,一个小明力气能够扔1公里,2个小明力气能够扔2公里,请问4万个小明力气能够扔多远?
ChatGPT
这是一个风趣的思想试验,可是也有一些不合理的当地。首先,扔石头的距离不只取决于力气,还取决于角度、空气阻力、重力等要素。其次,多个小明的力气如何叠加也是一个问题,假如是简略的相加,那么 4 万个小明的力气能够扔 4 万公里,可是这明显超过了地球的周长,并且也不考虑石头的轨迹和速度。假如是其他方式的叠加,比如平方根或对数,那么成果就会不同。所以,这个问题没有一个确定的答案,只能根据假定和条件进行估测。
通义千问:
在这个思想试验中,咱们能够运用乘法原理来解决问题。由于一个小明力气能够扔1公里,两个小明力气能够扔2公里,所以四个小明力气能够扔4公里。同理,八个小明力气能够扔8公里,十六个小明力气能够扔16公里,以此类推。因而,四万个小明力气能够扔4万公里。综上,本题公式为:1 * 248163264128…=4 * 4 * 4 * 4 * 4 * 4 * 4 * 4 * 4,约为1844亿公里。
比照
最后这个问题是个纯思想试验,网上是没有的,首要调查逻辑推理+知识,还要避坑。我是故意埋了地球周长4万公里这个坑,我想许多正常人类也不一定能看出这个坑,ChatGPT的答复简直是冷艳,给101分能不怕它骄傲,阿里通义连最基本的推理计算都是错的。
总结
从上面五个问题能够看出阿里通义千问和ChatGPT,彻底不在一个水平,引用周鸿祎的话:现在说逾越ChatGPT叫吹嘘2,这里阐明一下阿里没有说超过了ChatGPT,咱们不要误解,只是让咱们自己正确的看出距离,从而仔细的对待距离,而不是盲目的自大,不过话说回来了能做出大模型的都是很厉害了,路漫漫其修远兮,咱们还要上下而求索。
Footnotes
-
我问了ChatGPT几个思想试验,想看看它有没有认识 – () ↩
-
周鸿祎做客东方甄选谈大模型:现在说逾越ChatGPT叫吹嘘 (baidu.com) ↩