8种检测AI生成文本的方法
你是否曾经使用人工智能来起草学习资料、你网站的内容,甚至是工作报告,却担心结果看起来像是由AI生成的,或者可能会被检测工具标记出来?或者,你正处于另一方,需要检查某人的写作或某份文件是否有AI痕迹,但却不知道如何开始?
这一切都很容易解决,因此在本文中,我们将为你介绍一些方法,教你如何检测由AI生成的文本。你将了解到在审核文本时需要注意哪些方面,以及哪些工具可以帮助你快速识别AI生成的文本。
AI文本生成器是如何工作的,以及为什么我们仍然能识别出AI写作?
现在几乎每个人都听说过ChatGPT或Google Gemini——很有可能你甚至已经用过其中之一来起草邮件、列大纲报告,或者只是玩一玩。归根结底,这些工具都是在大量文本的基础上训练出来的,并且依靠预测下一个最有可能出现的词语。这就是它们能够生成流畅、结构清晰的语言的原因。事实上,有时生成的内容看起来比大多数人第一次写出来的还要整洁。它生成得又快又精致,乍一看,甚至能让人以为是手写的内容。
但是,如果AI是从人类语言中学习的,为什么我们仍然能识别出AI生成的文本?原因在于预测会留下某些模式。机器生成的文本往往很保守,采用常见的表达方式、平衡的语气和重复的句子结构。相比之下,人类会犯小错误,带入个性,在段落中途改变风格,并引用真实的生活经历。这些不完美就像真实性的指纹一样。
通常对比看起来是这样的:
| 🙋🏻♂️ 人类写作特征 | 🤖 机器(AI)写作特征 |
| 个人语气、情感、主观偏见 | 中性、精致、过于平衡 |
| 拼写错误、措辞突兀、风格变化 | 结构一致,流程重复 |
| 创意跃迁、幽默、不可预测 | 安全词选择、公式化模式 |
| 对真实事件或经历的引用 | 可能的“幻觉”或虚假细节 |
是否有可能让识别AI生成文本变得更难
在我们进入实际检测 AI 写作的方法之前,值得先停下来问另一个问题:你能让 AI 写作更难被识别吗?答案其实很简单——是的,你可以。有一些技巧可以让文本听起来不那么机械,更接近人类写作,而不是看起来像生成器直接输出的内容。
第一个选项是重写AI给你的内容。没错,字面意思——拿到草稿后,像自己写的一样对其进行修改。如果你花时间制定了一个有力的提示词,而不是只输入“帮我写一篇毕业论文”,那么AI生成的内容就可以作为一个不错的起点。之后你可以按照自己的风格进行调整,无论是你的博客风格、大学论文,还是公司报告的语气。当然,这需要更多的努力和思考,但确实有效。
如果重写不是你的选择,还有另一个选项: AI人性化工具. 这些是为执行相反工作而构建的工具——它们 调整机器文本以使其听起来更像人类,修正典型的 AI 模式和用词。此类应用程序在线上有很多,每个都有不同的使用条款,但原理是相同的。我们最近测试过并可以推荐的一个是 Clever AI Humanizer (同一位开发者以Disk Drill和Clever Cleaner闻名)。它是免费的,没有广告或隐藏的付费墙,更重要的是,它确实有助于绕过人工审核和自动检测器(我们将在下文中讨论)。
以下是使用方法:
- 在你的浏览器中搜索 Clever AI Humanizer 或点击 这个链接.

- 将你用AI生成的文本复制并粘贴到输入框中。

- 点击绿色的将 AI 人性化按钮,稍等几秒钟。

- 您的修改文本将显示在下方——请将其复制回您的文档,然后按照我们稍后在本文中介绍的方法进行AI检测。


8种判断某物是否由AI生成的方法
好的,我们继续讲如何判断一篇文章是否由AI生成。你可能会以为有很多种方法,毕竟AI领域正在蓬勃发展,几乎每天都有新工具问世。事实上,方法主要分为两类:手动检查文本中的某些事实,或者使用专门的AI检测工具,这一点我们上面已经简单提过。那么,让我们开始吧。
方法 1:与作品的作者交谈
没有什么能胜过真实的交流。如果你怀疑一项作品是借助人工智能完成的,最直接的方法之一就是与其作者交谈。可以是面对面的会面,一个简短的电话,甚至是几句电子邮件或聊天消息的交流。形式并不重要——重要的是问足够多的问题,以判断他们是否真正了解这个主题。
如果作者确实是自己写的这篇作品,回答这些问题不会有问题。他们能够解释细节、回忆来源,并描述自己的写作过程。但如果作品主要是由人工智能生成的,那么答案很可能会显得模糊、不一致或流于表面。
很明显,这种方法主要适用于与作者有直接接触的评审、经理或教师。如果你不属于这种情况,也不用担心,直接看下一种方法即可。
方法 2:观察书面作品的一般风格
你还可以做的一件事是注意文本的整体风格。当一份草稿还没有被反复打磨,或者最终版本没有经过润色时,写作通常会显得生硬和机械化。表面上看起来读起来很流畅,但总觉得有点不对劲——几乎就像这段文字是从莫尔斯电码解码过来的,而不是由人写出来的。
很难用语言解释这一点,所以我们在下面加一个例子。
🤖 类似AI的风格:
这个工具对许多任务都很有用。它有助于组织信息。它还能帮助节省时间。总的来说,它是一个对工作很有帮助的工具。
🙋🏻♂️ 类人风格:
这个工具帮助你保持有序,当你想要整齐地排列物品时非常有用。它可以帮助你快速完成常规工作,让你的工作日更加顺利。
如你所见,AI示例总是围绕同一个点打转,重复用词,缺乏生气。人工版本则以更自然的方式说明同样的想法,表达更有变化和流畅感。这种语气上的差别通常足以区分两者。
方法 3:曲解事实
即使所有知名的AI生成器都进行了更新,事实扭曲的问题依然没有消失。是的,情况有所改善,但AI仍然经常混淆或错误陈述那些可以通过快速搜索核查的内容。你可能已经见过 新闻 关于GPT如何会说错美国总统的名字——同样的问题也会出现在更长的文本中。现在想象一下,这种失真在技术或精确科学领域会造成多大的危害,在这些领域中,精确性至关重要。
这就是为什么作者和审稿人都应该仔细阅读并自行进行事实核查。仅依赖未经验证的AI文本是有风险的,并且可能破坏整个作品的可信度。
方法 4:过度使用典型的AI词汇
识别AI写作最有效的方法之一是分析文本中所谓的“停用词”。这些是在机器生成的草稿中反复出现的词和短语。典型的例子包括 确保, 关键, 深入探究,还有一整套类似的表达方式,听起来很精致但已经被过度使用。在Reddit上你甚至可以找到 长时间的讨论 用户可以收集并分享这些词语的完整列表。如果你想更仔细地研究这种模式,值得去查看那些帖子。

在大多数情况下,当一个人独自写作时,他们会自然而然地变换词汇。作者会选择同义词、换种说法,或者根据语境调整措辞。相比之下,人工智能往往会反复使用其算法首次生成的词语。这就是为什么由人工智能生成的草稿可能会在全文中重复十次或更多同一个词的原因。
方法 5:注意标点符号
标点符号是另一个线索,当你想检查某些内容是否由AI生成时。乍一听可能觉得很傻,对吧?但其实不是。人们会犯小错误,漏掉逗号,多打一个句号,或者跳过引号(这都是正常的,除非你在处理法律或高度技术性的写作)。AI喜欢让一切看起来“完美无缺”。事实上,它经常做得太过了。AI生成的文本通常看起来过于整洁。逗号恰到好处地出现,句子排列得过于工整,你还会注意到多出来的破折号其实没有什么实际意义。结果看起来不自然,反而像是标点被用过头了。

方法 6:查看列表的结构(如果有的话)
AI生成器通常以一种奇特、公式化的方式生成列表。如果你不回去编辑它们,通常很容易被发现。结构往往遵循一定的模式—— 一个概括性的词:然后是一个简短的解释,通常重复同样的意思. 例如:

你可以看到问题在于,解释只是绕回标题,并没有增加真正的内容。更奇怪的是,即使你在提示中要求更详细的输出,AI有时也不会纠正这种风格。这就是为什么最好自己审查这些列表,扩展要点,使它们更自然。
方法 7:检查技术(以及不仅仅是技术)细节
我们已经谈过事实的歪曲,那么作品中的细节呢?AI生成器无法处理细节,除非你亲自写出来。这适用于任何主题,无论是历史、化学、物理等。用纯文本时,这一点很容易被忽视,然而,如果作品中包含一些说明、指南或你自己的经验描述,某些操作、函数或按钮的名称有90%的概率会被描述错误。
我们很难在这里举出一个每个人都能理解的例子,但以下是我们如何测试GPT为使用Shortcuts程序在iPhone上查找大型视频文件编写说明的方法。

正如你所见,GPT建议选择文件大小过滤器,但程序根本没有这个选项。因此,它提出的其他所有步骤也都变得毫无意义。

这只是我们的一个例子,但在其他情况下和领域也是一样的。所以,如果你想知道某样东西是不是由AI写的,就去检查细节。如果你不想让别人知道你用了AI,那就要把一切都彻底完善。
方法 8:使用在线检测器检测 AI 写作
另一种检查某物是否由人工智能生成的方法,比人工识别更简单,是使用专门的在线检测工具。这些工具基于机器学习和统计模型,通过大量文本进行学习,包括人类写作和人工智能生成的文本。它们利用复杂的算法,捕捉文本来自人工智能的线索,比如句子过于相似、常见的用词选择,或重复出现的连接词。
另一个限制是,这些检测器通常很容易被欺骗,只需付出相对较小的努力。例如,如果你将原始的 AI 输出通过一个 AI 人性化工具处理,结果往往可以绕过许多流行的检测器。进行一些编辑,替换同义词,或者仅仅是重组句子,有时就足以让算法困惑。
为了展示这一点,我们将下面截图中的示例文本进行了处理 ZeroGPT. 结果清楚地突出显示了AI生成的部分。这支持了我们已经手动发现的内容:文本中存在重复、停用词、破折号和通用描述。

为了进一步推进测试,我们决定进行一个实验,并将同样的文本传递给 Clever AI Humanizer. 结果从ZeroGPT时几乎100%的AI概率显著下降到仅13%。我们认为如果有更多的文本样本,这一数字还会更小。

最终想法
好了,现在你知道了无论你是作者还是审稿人,都可以检查某些内容是否由AI生成。这些方法够用吗?绰绰有余。不过,即使把所有方法都结合使用,也永远无法给你100%的保证。这是因为AI生成器和AI检测器都在不断地以人类作品为训练对象,并不断自我提升。这个循环让界限变得如此模糊,以至于即使是完全由人类写的文本有时也会被标记为AI生成。
哪种方法最好?说实话,没人知道。当然,最快的方法是使用在线AI检测器,但你需要信任这个工具。其中有些检测器非常不稳定,甚至把宪法标记为100% AI生成,所以你要注意这一点。另一方面,如果你有经验且眼光敏锐,简单地重新阅读文本往往就足够了。当一篇文章不是作者直接写的(或者至少没有经过修订,而是直接由生成器生成的),AI的痕迹通常很明显。
我们希望这能帮助您更清晰地了解这个话题。如果您是作者,请不要过度使用 AI 工具——它们无法替代您的个人风格。如果您是审稿人,仅仅因为发现一个“ensure”或一个破折号(—),也不要急于认定这是一篇由 AI 生成的文本。