chatgpt润色会被判定为ai写作吗科研随笔：瞒天过海？使用ChatGPT翻译润色会被反AI系统发现吗？

默认分类2年前 (2023)发布 admin

113 0 0

我是土豆，一枚经济学博士生。在前面分享的内容中，我们分别介绍了翻译、润色、与以及、stata和等内容的联动（可以点击标签阅读这个系列的内容）。内容发出后，反响还是不错，收到了很多朋友的私信，但是多数朋友都会问一个共同的问题：我用会不会被查出来呀。今天我就用反AI神器来回答这个关键问题。

简介

是一种分类模型，用于预测文档是否由大型语言模型编写，提供句子、段落和文档级别的预测。接受了大量、多样化的人类书写和人工智能生成文本语料库的培训，重点是英语散文。

检测原理

分类器会呈现出一个得分，该得分为整个文档由 AI 生成的概率。当我们的分类器识别出 AI 生成的内容和人类编写的内容的混合时，应使用句子级分类（例如，突出显示的文本）。换句话说，当单个句子被突出显示为人工智能生成的时，这不应该被用来表明一篇文章是部分人工智能生成的。相反，当文档的大部分被识别为人工智能生成时，突出显示的句子将指示我们认为这是在文档中发生的那个位置。

总体而言，我们的分类器旨在用于标记可以开始对话的情况（例如，在教育工作者和学生之间），以推动进一步探究并传播对在书面作业中使用AI的风险的认识。

只检测输出吗？

不，在一系列 AI 语言模型中运行良好，包括但不限于、GPT-3、GPT-2、LLaMA 和基于这些模型的 AI 服务。

分类器有哪些限制？

偶尔存在两种情况：AI 被识别为人类撰写，而人类撰写被识别为 AI。

但随着向模型提交更多文本，模型的准确性也会提高。因此，模型在文档级别分类的准确性将大于段落级别的准确性，段落级别的准确性大于句子级别的准确性。省流来说：字数越多，检测越准。

如何识别人类还是AI撰写？

困惑度——指的是将与语言模型中的文本的外观进行比较的输入文本的随机性度量。这个分数越高，文本由人而非机器编写的可能性就越大。

突发性——指文本在文本中的分布。虽然 AI 生成的文本到处都是统一的长度，但人类编写的文本可能包括具有平滑模式的长句和短句。文本的分数越高，它越有可能是由人写的。

为什么优于其他检测模型？

是跨用例中最准确的 AI 探测器，经过多个独立来源的验证，包括，在测试了其他七个探测器后，它称我们为最好、最可靠的 AI 探测器。构建并不断改进我们自己的技术。在我们的竞争对手分析中，我们发现不仅性能更好，一些竞争对手的服务实际上只是转发免费开源模型的输出，而无需额外的培训。与许多其他模型相比，针对学生写作和学术散文进行了微调。通过这样做，我们已经看到了此用例的准确性有了很大的改进。最后，我们的许多用户 – 特别是教育工作者 – 告诉我们他们信任，因为我们只有一个使命：为每个人提供检测和安全采用AI技术的工具。与许多最近将探测器作为补充业务发布的提供商不同，这一使命将始终是我们的首要任务。