前言

阿里通义千问请求过了，为了看看达到了什么水平，于是我问题了5个ChatGPT答复过的问题¹，这五个问题网上都是没有的，是我自己想出来的。

问题一:小明说今日他吃了一只公鸡蛋，请问小明诚笃吗？

ChatGPT

这是一个风趣的问题，可是也有一些误解。公鸡蛋并不是公鸡下的蛋，而是指公鸡的睾丸，也便是公鸡的生殖器官。所以小明说他吃了一只公鸡蛋，其实是说他吃了一只公鸡的睾丸。这个食物在一些当地被认为有补肾的成效3，可是也有人觉得不雅或许不好吃。所以小明是否诚笃，要看他是不是真的吃了这个东西，而不是看公鸡是否能下蛋‬。

通义千问：

从诚笃的角度来看，小明说的是真话，由于他吃了一只公鸡蛋。可是，这并不意味着他是一个诚笃的人，由于诚笃的人不只要说真话，还要做到诚笃地面临自己的错误和过错。因而，小明是否诚笃取决于他是否有勇气供认自己的错误和过错，以及是否愿意接受他人的批评和帮助。

比照

这个问题首要调查基本知识：公鸡不会下蛋，能够看出ChatGPT一眼就看出了这个知识，并且还给出了公鸡蛋是公鸡睾丸这个令我也想不到的惊讶答复，再看阿里通义彻底没理解这个问题的关键。

问题二:小王在北京说穿毛衣还很冷，小李在三亚说穿短袖还很热，请问谁扯谎了？

ChatGPT

这是一个关于地理和气候的问题，北京的今日的气温是13.7℃，三亚的今日的气温是27℃。北京归于温带大陆性气候，冬天寒冷，夏日炎热，春秋枯燥。三亚归于热带海洋性气候，全年温暖湿润，没有四季之分。所以小王在北京说穿毛衣还很冷，小里在三亚说穿短袖还很热，都是有或许的，没有谁扯谎了。

通义千问：

从诚笃的角度来看，小王说的是真话，由于他感觉穿毛衣还很冷。可是，这并不意味着小里说的是真话，由于每个人对气温的感触或许存在差异。因而，小里是否扯谎取决于他感觉穿短袖仍是穿毛衣更舒适，以及是否对自己的感触有信心。

比照

这个问题就有点难度了，首要是调查知识+实时信息，能够看出ChatGPT不但知道北京和三亚气候不同，还给出了北京和三亚当天的详细温度，北京三亚当天温度应该是要去在线查的。反观阿里通义千问，我只能说呵呵，彻底没有地理位置不同气候不同的知识，更不用说是去查当天两地的温度了。

问题三:我的iphone 手机没电了，借了小明的华为手机充电线，可是便是充不了，为什么？

ChatGPT

你好，这是一个关于充电器和数据线的兼容性问题。华为的充电器头和数据线一般不支撑苹果的快充协议，所以给 iPhone 充电的作用只有 5W 左右，而不是 18W 或 20W 的快充功率。并且，华为的充电器头一般是 USB-A 口的，而 iPhone 的原装数据线是 USB-C 转闪电口的，所以两者是无法直接衔接的。你需求运用一个 USB-A 转闪电口的数据线，或许一个支撑 PD 快充协议的充电器头，才能给 iPhone 充电。假如你运用的数据线没有经过 MFi 认证，或许会有弹窗提示你这个配件不受支撑。所以，你借了小明的华为手机充电线，或许是由于接口不匹配或许数据线不认证，导致无法给 iPhone 充电。

通义千问：

或许是由于充电线的规格不匹配。不同品牌和类型的手机充电器和数据线或许有不同的规格和协议，假如运用了不兼容的充电器和数据线，或许会导致手机无法正常充电。主张先检查充电器和数据线的规格是否相同，假如不同请运用相应的转接头或充电线。另外，还能够尝试运用其他品牌或类型的充电器和数据线进行充电，或许尝试将手机衔接到电脑充电器上进行充电。

比照

这个问题首要调查不同手机接口协议不通用的知识，ChatGPT的答复感觉能够给100分，不只看出是快充协议的问题，还给出了协议转换解决方案，阿里通义感觉只能给60分，牵强及格，仍是看出问题了。

问题四:小明5岁时喜爱穿妹妹的花裙子，可是5年后却打死不穿了，为什么？

ChatGPT

这是一个风趣的问题，或许有多种答案。在这个语境下，一个人或许会说：

由于小明长大了，知道了男孩子和女孩子的区别，不想穿妹妹的花裙子了。

由于小明的妹妹长大了，不让小明穿她的花裙子了，并且还会讪笑他。

由于小明的花裙子现已穿不下了，并且也不合时尚了。

由于小明的爸爸妈妈或老师或同学发现了他穿妹妹的花裙子，对他进行了批评或教育或欺压，让他觉得羞耻或害怕。

通义千问：

或许是由于小明长大了，关于自己的穿着有了愈加个人化的主意和志愿。小时候的喜爱或许受到外部要素的影响，例如爸爸妈妈、亲友等，而长大后个人的主意和志愿则愈加重要。同时，也或许是由于小明关于性别和美的认知发生了改变，关于自己的性别和穿着愈加自傲和自主。可是，无论是什么原因，小明终究不再喜爱穿妹妹的花裙子，都是由于他关于自己的认知和情绪发生了改变。

比照

这个问题是首要调查推荐+知识，推理是跟着时间的增加人会长大，长大后男孩不会穿花裙的知识，能够看出ChatGPT给出了能够说是很像人类考虑的答案，比照阿里通义千问，彻底没有GET到问题点。

问题五:做一个思想试验，小明拿手扔石头，一个小明力气能够扔1公里，2个小明力气能够扔2公里，请问4万个小明力气能够扔多远？

ChatGPT

这是一个风趣的思想试验，可是也有一些不合理的当地。首先，扔石头的距离不只取决于力气，还取决于角度、空气阻力、重力等要素。其次，多个小明的力气如何叠加也是一个问题，假如是简略的相加，那么 4 万个小明的力气能够扔 4 万公里，可是这明显超过了地球的周长，并且也不考虑石头的轨迹和速度。假如是其他方式的叠加，比如平方根或对数，那么成果就会不同。所以，这个问题没有一个确定的答案，只能根据假定和条件进行估测。

通义千问：

在这个思想试验中，咱们能够运用乘法原理来解决问题。由于一个小明力气能够扔1公里，两个小明力气能够扔2公里，所以四个小明力气能够扔4公里。同理，八个小明力气能够扔8公里，十六个小明力气能够扔16公里，以此类推。因而，四万个小明力气能够扔4万公里。综上，本题公式为：1 * 248163264128…=4 * 4 * 4 * 4 * 4 * 4 * 4 * 4 * 4，约为1844亿公里。

比照

最后这个问题是个纯思想试验，网上是没有的，首要调查逻辑推理+知识，还要避坑。我是故意埋了地球周长4万公里这个坑，我想许多正常人类也不一定能看出这个坑，ChatGPT的答复简直是冷艳，给101分能不怕它骄傲，阿里通义连最基本的推理计算都是错的。

总结

从上面五个问题能够看出阿里通义千问和ChatGPT，彻底不在一个水平，引用周鸿祎的话：现在说逾越ChatGPT叫吹嘘²，这里阐明一下阿里没有说超过了ChatGPT，咱们不要误解，只是让咱们自己正确的看出距离，从而仔细的对待距离，而不是盲目的自大，不过话说回来了能做出大模型的都是很厉害了，路漫漫其修远兮，咱们还要上下而求索。

我问了ChatGPT几个思想试验，想看看它有没有认识 – () ↩
周鸿祎做客东方甄选谈大模型：现在说逾越ChatGPT叫吹嘘 (baidu.com) ↩

这五个问题一下就看出阿里通义千问和ChatGPT的差距了

前言

问题一:小明说今日他吃了一只公鸡蛋，请问小明诚笃吗？

ChatGPT

通义千问：

比照

问题二:小王在北京说穿毛衣还很冷，小李在三亚说穿短袖还很热，请问谁扯谎了？

ChatGPT

通义千问：

比照

问题三:我的iphone 手机没电了，借了小明的华为手机充电线，可是便是充不了，为什么？

ChatGPT

通义千问：

比照

问题四:小明5岁时喜爱穿妹妹的花裙子，可是5年后却打死不穿了，为什么？

ChatGPT

通义千问：

比照

问题五:做一个思想试验，小明拿手扔石头，一个小明力气能够扔1公里，2个小明力气能够扔2公里，请问4万个小明力气能够扔多远？

ChatGPT

通义千问：

比照

总结

作者信息

这五个问题一下就看出阿里通义千问和ChatGPT的差距了

前言

问题一:小明说今日他吃了一只公鸡蛋，请问小明诚笃吗？

ChatGPT

通义千问：

比照

问题二:小王在北京说穿毛衣还很冷，小李在三亚说穿短袖还很热，请问谁扯谎了？

ChatGPT

通义千问：

比照

问题三:我的iphone 手机没电了，借了小明的华为手机充电线，可是便是充不了，为什么？

ChatGPT

通义千问：

比照

问题四:小明5岁时喜爱穿妹妹的花裙子，可是5年后却打死不穿了，为什么？

ChatGPT

通义千问：

比照

问题五:做一个思想试验，小明拿手扔石头，一个小明力气能够扔1公里，2个小明力气能够扔2公里，请问4万个小明力气能够扔多远？

ChatGPT

通义千问：

比照

总结

Footnotes

相关文章

Get 和 Post 的区别：简单了解

Logstash：如何使用 Logstash 解析并摄入 JSON 数据到 Elasticsearch

微软必应升级：注册就能用，聊天画图两不误，WolframAlpha任你调用

Python深度学习精华笔记5：机器学习基础

作者信息