编辑:桃子
【新智元导读】数学天才陶哲轩的研讨也用上了 AI 东西 GPT-4。有了 GPT-4,你想做的,只需仿制、张贴、一键完成!
当红炸子鸡 ChatGPT,也成为数学天才陶哲轩的研讨东西了。
近日,他在网上称自己发现了一些 ChatGPT 的小用例。
首要,它很拿手解析代码格局的文档(在这种情况下是 #arXiv 搜索的 API),然后返回一个正确格局的代码查询(后来它还供给了一些作业的 python 代码,以我要求的方法调用这个 API,虽然我不得不手动安装一个包来使它运转)。其次,我让它想出一些,聪明的学生在本科线性代数课上可能会问的问题(为此我供给了一些样本题目),它给出了一些很好的例子,让我对课程可能方向,以及潜在的作业问题有所启示。
总之,我发现 ChatGPT 等 AI 东西虽然不能帮我霸占一个未处理的数学问题,但对其他作业相关的问题很有用,虽然事后常常需要进行一些手动调整。
GPT-4 和 GPT-3.5 不同不大
GPT-4 是怎样拿手解析代码格局的文档?
陶哲轩让 GPT-4 对所有的 arXiv 文章进行搜索查询,这些文章的元数据是一个给定的关键词(比方,「Collatz」),并且是在一定的日期范围内提交的(比方,在 2011-2016 之间)。依据下面的文档,这样的查询的格局是什么?
对此,GPT-4 不仅给出了代码,还列出了查询的分类。
网友问,作为一个阅读东西,给定一篇论文,让它提出审稿人或演讲者可能会问哪些问题?在这一方面 GPT-4 做得怎么?
对此,陶哲轩拿去测评了一番,大赞「确实不错」。
「这里是最近一篇论文的前几页。你能提出一些听众在听关于这篇论文的讲座时可能提出的问题吗?」
ChatGPT 回答「当然,这里有一些数学家在听了关于这篇论文的讲座后可能会问的问题」。然后,巴拉巴拉列出了 7 个问题。
细心网友发现陶哲轩发帖的截图是 GPT-4。
便问道,「你认为以前的 ChatGPT 和依据 GPT-4 模型的新帮手之间有什么区别?」
陶哲轩称,「到目前为止,GPT-4 的答复稍微有用一些,并且符合我的要求,但我没有看到质量上的重大不同。」
ChatGPT 加入作业流
ChatGPT 的诞生,许多人都在惊呼自己的作业要被 AI 代替了。
就连天才数学家陶哲轩也上手 ChatGPT 了。
3 月 5 日,陶哲轩在网上称自己决定尝试以不同的方法将 AI 东西纳入我的作业流程。其中就包含 GPT-4、DeepL 等东西。
在此期间,ChatGPT 躲藏功用都被他挖掘了出来,比方寻找公式、解析代码格局的文档、改写论文语句等等。
比方,ChatGPT 有时能够在数学中做一个半成品的语义检索,也就是用它来生成一些提示。
比方,陶哲轩让 ChatGPT 从描绘中辨认库默尔定理,它没能给出正确答案,但依据它给出的近似答案(Legendre 公式)。
对此,陶哲轩称,人工智能在数学中的作用是供给一个开始的近似答案,然后能够结合传统搜索引擎轻松找到正确答案。
陶哲轩还发现了 ChatGPT 在处理数学问题时的亮点,能够辨认不同语言的数学概念音译版。
另外,能够要求 ChatGPT 转换从 MathSciNet 获得的一堆参考文献,并在 LaTeX 书目环境下将其格局化为 \ bibitems。
然而 ChatGPT 就没有犯错的时分吗?
在一个关于「素数是否无量多」的证明问题中,陶哲轩发现 ChatGPT 给出的答案并不是彻底正确的。
从另一面看,他发现 ChatGPT 给出的证明思路是能够被固定下来的,并且这个思路他之前都从未见过。
仿制、张贴、一键完成!
挖掘 GPT-4 的用例,网友们也是花了不少功夫。
让 GPT-4 评定论文不仅合理,并且还能击中关键。
「作为一个学者,我不知道怎么看待这个问题:我把我的一篇旧论文放到 GPT-4 中(分成两部分),要求一个经济社会学家进行严厉但公平的同行评定。」
它创造了一个彻底合理的同行评定,踩中了我的评定员提出的许多关键。
对许多人来讲,想要做什么,直接问 GPT-4,「仿制、张贴、一键完成!」
就比方用 GPT-4 做一个复杂的游戏。
网友把 GPT-4、Replit、MidJourney、Claude 组建成一个人工智能帮手团队,从头开始创建了一个 3D 太空跑酷游戏。
然鹅,自己竟对 Javascript 或 3D 游戏编程一无所知。
参考资料:
mathstodon.xyz/@tao