机器之心报道
参与:魔王、张倩
「有 A、B 两个集合,A 与 B 相交,C 是 A 与 B 的交集,分别将三个集合命名为 、、Venn 。」给出这样一段描述,你要怎么作图?先画两个相交的圆,然后各自命名?太麻烦了!卡内基梅隆大学开发的一款新工具可以帮你自动生成。
在有些人眼里,数学公式就是一堆数字和符号,但在另一些人看来,这些数字和符号是可以动的,而且极富美感。为什么会有这种差距?那是因为对于后者来说,这些数字和符号的背后是一幅灵动的图,他们可以根据公式约定的规律进行变换,让人感受到数学规律带来的美感。
但问题在于,不是每个人都有这么好的「脑补」能力,能将数学公式自动想象成图。因此,我们需要借助于工具。
说到工具,你可能想到的是 Adobe 等广泛使用的画图工具。没错,这些工具确实好用,但未免有点繁琐,你要不断地花时间手动调整坐标等信息。
有没有简单一点的方法呢?类似于「我来说,你来画」那种。卡内基梅隆大学开发的 就是这样一款工具。
你只需要描述一些数学关系或输入数学表达式,该软件就能自动帮你画图,从而将抽象的数学公式转化为直观的图,文章开头给出的只是一个简单的例子。如果你不想用圆来表示上述关系,软件还可以帮你换成箭头表示。
不同于普通的图形计算器,你输入的表达式不仅限于基本函数,也可以是来自任何数学领域的复杂关系。
「在设计之初,我们问自己『人们是如何在脑海中将数学公式转换为图像的?』」卡内基梅隆大学计算机科学系博士生 Ye 表示。「我们系统的秘密武器就是让人们能够很容易地向电脑『解释』这一转换过程,然后将比较困难的作图过程留给计算机。」
为了让计算机理解人类所描述的关系,研究团队还专门开发了一种编程语言:
如上图所示,研究者用自己设计的编程语言表述了几个集合的包含关系,即使没学过这种编程语言的同学也能读懂。根据这些描述可以生成如下图形:
这款软件的名字来源于著名数学家、物理学家罗杰 · 彭罗斯(Roger )。彭罗斯以善用图表交流复杂的数学和科学思想而闻名。
「想象一下,你从图书馆的书架上拿下一本尘封已久的数学书,将上面的内容输入计算机,然后就能得到一本带插图、更容易理解的新书」,这就是该研究团队的愿景, 只是迈向这个愿景的第一步。研究人员将在 2020 大会上展示 。不过, 目前还处在开发阶段,因此暂时无法上手。
论文地址:
地址:
这款工具到底有多好用
可以把抽象的数学表示转化成一或多个不同风格的视觉表示,研发团队在视频 demo 中展示了对多个不同领域数学表达式的转化效果。
比如,几何领域:
线性代数:
集合论:
函数:
看了该研究团队给出的 demo 之后,有人称赞道,「这款工具可能变革科学和数学交流。」
还有人将其比作「科学图表界的 LaTex」:
那么,用户要怎么操作才能实现上述效果呢?
界面和基本功能
我们首先来看 的界面。
如下图所示,界面顶部是该工具的基本功能和选项。
左侧第一个下拉框:表示用户试图转化的数学公式所属的领域,上图示例显示的是「集合论」(set );
左侧第二个框:可供用户选择想要生成的图样式,上图选择的是维恩图(venn),用户可以点击该下拉框,选择自己喜欢的样式;
右侧「run」按钮:点击该按钮,等待几秒,即可得到左侧数学内容所对应的图。
只选择数学领域还不够,用户还需要在界面左侧填充数学内容。这里需要注意的是界面第二行的「sub」、「sty」、「dsl」按钮。
的语言框架包含三部分: (dsl)、 (sub)和 Style (sty)。
如下图所示,这三部分分别表示:
dsl:数学领域中可用的对象、关系和符号;
sub:填充数学内容;
sty:从数学表述到视觉表示。
用户可以逐个点击这些按钮,填充所需的数学内容,选择所需的视觉表示形式。
高阶优化操作
说完了基本功能,我们再来看「优化」操作。
右下方「」按钮:如果你对生成的图不满意,点击该按钮,即可重新生成图;
「」按钮:实现图的自动生成,如果你想对图进行调整,只需禁用该功能即可。
UI 界面中的优化过程。
背后的技术
团队设计此工具的目标是:
以用户熟悉的方式表达数学对象;
系统不局限于固定的某些领域;
对相同的数学内容进行不同的可视化展示;
视觉复杂度方面不存在内在限制;
速度快,支持迭代工作流;
为制图所做的努力应该是可泛化和可重用的。
基于以上目标,该团队制定了以下组织原则:
通过从数学对象到视觉图标的映射来规定图;
通过解决相关的约束优化问题来合成图。
工作流程
下图展示了 的工作流程:
第一阶段:用编程语言指定数学对象和视觉表示
将数学内容与视觉表示分离开来,并使用 -based 来提供该分离所需的抽象。
如前所述, 为数学内容与视觉表示提供了两种不同的语言: 和 Style。
借助精确的断言()来诠释标准的数学表述,参见下图示例:
第二阶段:基于优化的合成
使用约束优化来合成与给定描述相对应的图。这个方法主要是受到手绘图的启发:将视觉图标放在画布上,不断地调整直到无需再改进。
此外, 用户界面提供了插件接口,方便调用 和 Style 中的外部代码,从而提供系统级的可扩展性。该插件系统可以帮助用户集成可用于解决逻辑或图难题的外部代码。
目前,该项目已发布在 。不过 团队表示,目前版本处于早期阶段,仍在持续开发中。
感兴趣的同学可以访问 网站,跟进更多信息。
网站地址: