ai里的形状生成工具怎么用 数学表达式一键变图,CMU开发实用工具Penrose,堪称图解界LaTeX

默认分类12个月前发布 admin
3,525 0
ChatGPT国内版

机器之心报道

参与:魔王、张倩

「有 A、B 两个集合,A 与 B 相交,C 是 A 与 B 的交集,分别将三个集合命名为 、、Venn 。」给出这样一段描述,你要怎么作图?先画两个相交的圆,然后各自命名?太麻烦了!卡内基梅隆大学开发的一款新工具可以帮你自动生成。

在有些人眼里,数学公式就是一堆数字和符号,但在另一些人看来,这些数字和符号是可以动的,而且极富美感。为什么会有这种差距?那是因为对于后者来说,这些数字和符号的背后是一幅灵动的图,他们可以根据公式约定的规律进行变换,让人感受到数学规律带来的美感。

但问题在于,不是每个人都有这么好的「脑补」能力,能将数学公式自动想象成图。因此,我们需要借助于工具。

说到工具,你可能想到的是 Adobe 等广泛使用的画图工具。没错,这些工具确实好用,但未免有点繁琐,你要不断地花时间手动调整坐标等信息。

有没有简单一点的方法呢?类似于「我来说,你来画」那种。卡内基梅隆大学开发的 就是这样一款工具。

你只需要描述一些数学关系或输入数学表达式,该软件就能自动帮你画图,从而将抽象的数学公式转化为直观的图,文章开头给出的只是一个简单的例子。如果你不想用圆来表示上述关系,软件还可以帮你换成箭头表示。

不同于普通的图形计算器,你输入的表达式不仅限于基本函数,也可以是来自任何数学领域的复杂关系。

「在设计之初,我们问自己『人们是如何在脑海中将数学公式转换为图像的?』」卡内基梅隆大学计算机科学系博士生 Ye 表示。「我们系统的秘密武器就是让人们能够很容易地向电脑『解释』这一转换过程,然后将比较困难的作图过程留给计算机。」

为了让计算机理解人类所描述的关系,研究团队还专门开发了一种编程语言:

如上图所示,研究者用自己设计的编程语言表述了几个集合的包含关系,即使没学过这种编程语言的同学也能读懂。根据这些描述可以生成如下图形:

这款软件的名字来源于著名数学家、物理学家罗杰 · 彭罗斯(Roger )。彭罗斯以善用图表交流复杂的数学和科学思想而闻名。

「想象一下,你从图书馆的书架上拿下一本尘封已久的数学书,将上面的内容输入计算机,然后就能得到一本带插图、更容易理解的新书」,这就是该研究团队的愿景, 只是迈向这个愿景的第一步。研究人员将在 2020 大会上展示 。不过, 目前还处在开发阶段,因此暂时无法上手。

论文地址:

地址:

这款工具到底有多好用

可以把抽象的数学表示转化成一或多个不同风格的视觉表示,研发团队在视频 demo 中展示了对多个不同领域数学表达式的转化效果。

比如,几何领域:

线性代数:

集合论:

ai里的形状生成工具怎么用 数学表达式一键变图,CMU开发实用工具Penrose,堪称图解界LaTeX

函数:

看了该研究团队给出的 demo 之后,有人称赞道,「这款工具可能变革科学和数学交流。」

还有人将其比作「科学图表界的 LaTex」:

那么,用户要怎么操作才能实现上述效果呢?

界面和基本功能

我们首先来看 的界面。

如下图所示,界面顶部是该工具的基本功能和选项。

左侧第一个下拉框:表示用户试图转化的数学公式所属的领域,上图示例显示的是「集合论」(set );

左侧第二个框:可供用户选择想要生成的图样式,上图选择的是维恩图(venn),用户可以点击该下拉框,选择自己喜欢的样式;

右侧「run」按钮:点击该按钮,等待几秒,即可得到左侧数学内容所对应的图。

只选择数学领域还不够,用户还需要在界面左侧填充数学内容。这里需要注意的是界面第二行的「sub」、「sty」、「dsl」按钮。

的语言框架包含三部分: (dsl)、 (sub)和 Style (sty)。

如下图所示,这三部分分别表示:

dsl:数学领域中可用的对象、关系和符号;

sub:填充数学内容;

sty:从数学表述到视觉表示。

用户可以逐个点击这些按钮,填充所需的数学内容,选择所需的视觉表示形式。

高阶优化操作

说完了基本功能,我们再来看「优化」操作。

右下方「」按钮:如果你对生成的图不满意,点击该按钮,即可重新生成图;

ai里的形状生成工具怎么用 数学表达式一键变图,CMU开发实用工具Penrose,堪称图解界LaTeX

「」按钮:实现图的自动生成,如果你想对图进行调整,只需禁用该功能即可。

UI 界面中的优化过程。

背后的技术

团队设计此工具的目标是:

以用户熟悉的方式表达数学对象;

系统不局限于固定的某些领域;

对相同的数学内容进行不同的可视化展示;

视觉复杂度方面不存在内在限制;

速度快,支持迭代工作流;

为制图所做的努力应该是可泛化和可重用的。

基于以上目标,该团队制定了以下组织原则:

通过从数学对象到视觉图标的映射来规定图;

通过解决相关的约束优化问题来合成图。

工作流程

下图展示了 的工作流程:

第一阶段:用编程语言指定数学对象和视觉表示

将数学内容与视觉表示分离开来,并使用 -based 来提供该分离所需的抽象。

如前所述, 为数学内容与视觉表示提供了两种不同的语言: 和 Style。

借助精确的断言()来诠释标准的数学表述,参见下图示例:

第二阶段:基于优化的合成

使用约束优化来合成与给定描述相对应的图。这个方法主要是受到手绘图的启发:将视觉图标放在画布上,不断地调整直到无需再改进。

此外, 用户界面提供了插件接口,方便调用 和 Style 中的外部代码,从而提供系统级的可扩展性。该插件系统可以帮助用户集成可用于解决逻辑或图难题的外部代码。

目前,该项目已发布在 。不过 团队表示,目前版本处于早期阶段,仍在持续开发中。

感兴趣的同学可以访问 网站,跟进更多信息。

网站地址:

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...