撰文 |
翻译 | 蒋迅
译者注:本文试图说明Chat-GPT在数学证明领域里还有缺陷。所以下面除了最基本的问题外,Chat-GPT给出的证明都是不正确的。请读者不要把这里的证明当作标准答案。
Chat-GPT是Open AI发布的令人印象深刻的全新AI聊天机器人。它令人印象深刻的应用程序可以在整个互联网上找到。但它能做数学吗?
通过数学,我们并不意味着简单地做一些计算。它自己的设计确保了存在着它无法解决的计算问题。我更感兴趣的是它可否解决需要一些数学推理的问题。
为了选择我们的问题,我们使用了MMLU数据集。Meta AI最近发布的大型语言模型在这个数据集上取得了一些不错的结果。他们的发现陈述在他们论文的第5.3节中。
接下来,我们将挑选几个问题,看看Chat-GPT如何处理它们。如果失败,我们将尝试改写这个问题以期获得部分结果。
我们注意到MMLU数据集有多项选择题,但我们只是将问题呈现给Chat-GPT。我们只是从MMLU的抽象代数部分选择问题。之后,我们将刺激Chat-GPT以获得直觉和证明。在最后,我们将向数学家推荐Chat-GPT的一些应用。
问题一
问题二
问题三
但是直觉是什么?
使研究数学家伟大的是对问题的某种“直觉”。让我们看看Chat-GPT是否可以解释其中的任何一个。
我:你能解释一下柯西-施瓦茨不等式背后的直觉吗?请用latex写所述的数学公式。
我希望这有所帮助!如果你有任何问题,请告诉我。
注:这还算不错,但肯定可以改进。例如,解释什么时候何时成立(当一个向量是另一向量的倍数时)有助于给出最后一段更精确的含义。人们可以看到陶哲轩这篇博客文章的前几段,以了解来自世界领先数学家之一的解释。此外,这是上关于该主题的数学讨论。
给出证明
我:你能证明这个吗?
Chat-GPT:当然!这是柯西-施瓦茨不等式的证明:
首先,我们可以将不等式重写为:
我希望这个能有所帮助!如果你有任何问题,请告诉我。
注:不幸的是,这个证明并不完全正确。无论是证明方法还是细节(即它对 AM-GM 的应用)都存在严重缺陷。
结论
老实说,Chat-GPT对于一个无论如何都不是为数学量身定做的模型来说是相当令人印象深刻的。我认为,以目前的格式,它已经可以帮助数学家准备讲义甚至论文中更简单的部分。也许它最大的用处在于自动处理基金和工作申请的某些部分。