chatgpt润色会被判定为ai写作吗 科研随笔:瞒天过海?使用ChatGPT翻译润色会被反AI系统发现吗?

默认分类1年前 (2023)发布 admin
43 0
ChatGPT国内版

我是土豆,一枚经济学博士生。在前面分享的内容中,我们分别介绍了翻译、润色、与以及、stata和等内容的联动(可以点击标签阅读这个系列的内容)。内容发出后,反响还是不错,收到了很多朋友的私信,但是多数朋友都会问一个共同的问题:我用会不会被查出来呀。今天我就用反AI神器来回答这个关键问题。

简介

是一种分类模型,用于预测文档是否由大型语言模型编写,提供句子、段落和文档级别的预测。 接受了大量、多样化的人类书写和人工智能生成文本语料库的培训,重点是英语散文。

检测原理

分类器会呈现出一个得分,该得分为整个文档由 AI 生成的概率。当我们的分类器识别出 AI 生成的内容和人类编写的内容的混合时,应使用句子级分类(例如,突出显示的文本)。换句话说,当单个句子被突出显示为人工智能生成的时,这不应该被用来表明一篇文章是部分人工智能生成的。相反,当文档的大部分被识别为人工智能生成时,突出显示的句子将指示我们认为这是在文档中发生的那个位置。

总体而言,我们的分类器旨在用于标记可以开始对话的情况(例如,在教育工作者和学生之间),以推动进一步探究并传播对在书面作业中使用AI的风险的认识。

只检测 输出吗?

不, 在一系列 AI 语言模型中运行良好,包括但不限于 、GPT-3、GPT-2、LLaMA 和基于这些模型的 AI 服务。

分类器有哪些限制?

偶尔存在两种情况:AI 被识别为人类撰写,而人类撰写被识别为 AI。

但随着向模型提交更多文本,模型的准确性也会提高。因此,模型在文档级别分类的准确性将大于段落级别的准确性,段落级别的准确性大于句子级别的准确性。省流来说:字数越多,检测越准。

如何识别人类还是AI撰写?

困惑度——指的是 将与语言模型中的文本的外观进行比较的输入文本的随机性度量。这个分数越高,文本由人而非机器编写的可能性就越大。

突发性——指文本在文本中的分布。虽然 AI 生成的文本到处都是统一的长度,但人类编写的文本可能包括具有平滑模式的长句和短句。文本的 分数越高,它越有可能是由人写的。

为什么 优于其他检测模型?

是跨用例中最准确的 AI 探测器,经过多个独立来源的验证,包括 ,在测试了其他七个探测器后,它称我们为最好、最可靠的 AI 探测器。 构建并不断改进我们自己的技术。在我们的竞争对手分析中,我们发现 不仅性能更好,一些竞争对手的服务实际上只是转发免费开源模型的输出,而无需额外的培训。与许多其他模型相比, 针对学生写作和学术散文进行了微调。通过这样做,我们已经看到了此用例的准确性有了很大的改进。最后,我们的许多用户 – 特别是教育工作者 – 告诉我们他们信任,因为我们只有一个使命:为每个人提供检测和安全采用AI技术的工具。与许多最近将探测器作为补充业务发布的提供商不同,这一使命将始终是我们的首要任务。

chatgpt润色会被判定为ai写作吗 科研随笔:瞒天过海?使用ChatGPT翻译润色会被反AI系统发现吗?

上述内容都是官方的内容翻译,帮助各位小小了解一下~(这里不是打广告哈!!!)

怎么使用使用方法

直接给出简洁版本使用方案,小白绝对看得懂:

结果解读

上一步点击Get 之后。检测有四种结果:

上图我是随便找了一篇论文,导入之后的结果,可以看到这篇文章是由人类完成的。下图是这篇文章的得分情况。

这里需要注意的是,免费版本有一些的字数限制,当然对于我们来说,只选取需要检测的地方就好,不一定非要全文放进来!

准确度检验——结果模拟

前面我们理解了的原理和使用做法,但是貌似我们也没有解决最核心的问题:使用翻译润色会被发现吗?接下来,我们将进行模拟测算解决这个问题。

翻译润色测试

我们直接测试直接翻译润色的结果,看看是不是由AI撰写的。测试内容选择贴合实际,即小白初阶写法:先自己写中文,使用翻译润色英文。测试段落还是沿用以往的《经济学(季刊)》的中文段落(这肯定是人类写)的:

卡尔多事实指出,要素份额在长期基本保持不变,这也与发达国家第二次世界大战之后的实际情况吻合。20世纪90年代,西方学术界突然发现,发达国家的劳动收入份额从20世纪80年代开始下降(皮凯蒂,2014)。而且,这一现象也相继在发展中国家出现( and ,2013)。在金融危机之前,我国的劳动收入份额自20世纪90年代中期以来不断下降也已成为学术界的共识(李稻葵等,2009;白重恩和钱震杰,2009)。 and (2013)测算了自1975年以来全球59个国家劳动收入份额的(每10年)平均增长率,发现包括中国、美国、日本等在内的46个国家的劳动收入份额处于下降趋势,8个最大的经济体中只有英国的劳动收入份额存在小幅上涨。由此可见,劳动收入份额在金融危机之前的下降趋势不仅存在于我国,其已经成为一种全球现象。

翻译润色方法采用上一期文章:我们使用3.5和4.0的内容进行检测。

.5翻译润色结果

chatgpt润色会被判定为ai写作吗 科研随笔:瞒天过海?使用ChatGPT翻译润色会被反AI系统发现吗?

首先,我们来看看3.5的结果,结果真的是大跌眼镜!!!万万没想到竟然是AI写的。看到这很多人慌了,先别急,更有趣的在后面~我们看看4.0的结果~

4.0却变成了人类写的!!!看来反AI神器确实有点误差,为了降低这种误差,我们继续进行稳健性检验,使用有道和deepl翻译中文内容,此外我们对3.5使用deepl write修正一下语法等问题(为何用deepl write参见这期推文:)

稳健性检验

直接说结果,也是让我意想不到:第一张图为有道翻译的结果,结果判定为部分AI撰写。

第二张图为deepl翻译,结果判定为人类撰写。

第三张图为上一段被判定为AI撰写的.5的内容加上deepl write的结果,结果依然还是AI撰写。

第四张图为.0的内容加上deepl write的结果,结果依然还是人类撰写。

上述这些内容各位可以点击本文篇尾阅读原文即可下载,各位可以测试看看。

使用建议

我想很多小伙伴看到这里肯定慌了,4.0确实优于3.5,毕竟是付费用户!但是,并不是3.5和deepl write的组合完全失效,这里可能是有段落较短的影响,而且我自己也以word传了一部分我要投稿的文章内容,结果显示是人类撰写。所以,目前来说,反AI软件目前尚有一丝不严谨的地方。如果各位感觉很慌,我这里给出几个使用建议可以规避上面的问题:

结束语

AI和反AI都在不断发展完善之中,尽管看完上面的内容各位尚有些许慌张。但是你只用工具作为润色改善语法,我认为是完全不需要担心的。毕竟我自己扔了好几个我写的文章进去了,检测都是人类撰写(毕竟我只润色一下)。所以各位不必太慌,但是我还是诚心希望各位借着工具提高自己的写作水平,即使用GPT润色完了也一定要自己修改一下,保证安全。如果各位很担心,那就用试试,反正有字数限制,把文章一部分扔进去试试就好!

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...