8种检测AI生成文本的方法

你是否曾经使用人工智能来起草学习资料、你网站的内容,甚至是工作报告,却担心结果看起来像是由AI生成的,或者可能会被检测工具标记出来?或者,你正处于另一方,需要检查某人的写作或某份文件是否有AI痕迹,但却不知道如何开始?

这一切都很容易解决,因此在本文中,我们将为你介绍一些方法,教你如何检测由AI生成的文本。你将了解到在审核文本时需要注意哪些方面,以及哪些工具可以帮助你快速识别AI生成的文本。

作为一支由编辑和博客作者组成的团队,我们深知识别AI生成文本的重要性,因此这些方法都已在真实场景中进行过测试,您可以相信我们分享的方法确实有效。

AI文本生成器是如何工作的,以及为什么我们仍然能识别出AI写作?

现在几乎每个人都听说过ChatGPT或Google Gemini——很有可能你甚至已经用过其中之一来起草邮件、列大纲报告,或者只是玩一玩。归根结底,这些工具都是在大量文本的基础上训练出来的,并且依靠预测下一个最有可能出现的词语。这就是它们能够生成流畅、结构清晰的语言的原因。事实上,有时生成的内容看起来比大多数人第一次写出来的还要整洁。它生成得又快又精致,乍一看,甚至能让人以为是手写的内容。

但是,如果AI是从人类语言中学习的,为什么我们仍然能识别出AI生成的文本?原因在于预测会留下某些模式。机器生成的文本往往很保守,采用常见的表达方式、平衡的语气和重复的句子结构。相比之下,人类会犯小错误,带入个性,在段落中途改变风格,并引用真实的生活经历。这些不完美就像真实性的指纹一样。

通常对比看起来是这样的:

🙋🏻‍♂️ 人类写作特征 🤖 机器(AI)写作特征
个人语气、情感、主观偏见 中性、精致、过于平衡
拼写错误、措辞突兀、风格变化 结构一致,流程重复
创意跃迁、幽默、不可预测 安全词选择、公式化模式
对真实事件或经历的引用 可能的“幻觉”或虚假细节

是否有可能让识别AI生成文本变得更难

在我们进入实际检测 AI 写作的方法之前,值得先停下来问另一个问题:你能让 AI 写作更难被识别吗?答案其实很简单——是的,你可以。有一些技巧可以让文本听起来不那么机械,更接近人类写作,而不是看起来像生成器直接输出的内容。

🙂 也就是说,这一部分更多是为那些想让自己的AI生成作品看起来不那么明显的读者准备的。如果你是想检查别人的写作并抓住他们有点AI“作弊”行为的一方,可以直接跳到检测方法部分。

第一个选项是重写AI给你的内容。没错,字面意思——拿到草稿后,像自己写的一样对其进行修改。如果你花时间制定了一个有力的提示词,而不是只输入“帮我写一篇毕业论文”,那么AI生成的内容就可以作为一个不错的起点。之后你可以按照自己的风格进行调整,无论是你的博客风格、大学论文,还是公司报告的语气。当然,这需要更多的努力和思考,但确实有效。

如果重写不是你的选择,还有另一个选项: AI人性化工具. 这些是为执行相反工作而构建的工具——它们 调整机器文本以使其听起来更像人类,修正典型的 AI 模式和用词。此类应用程序在线上有很多,每个都有不同的使用条款,但原理是相同的。我们最近测试过并可以推荐的一个是 Clever AI Humanizer (同一位开发者以Disk Drill和Clever Cleaner闻名)。它是免费的,没有广告或隐藏的付费墙,更重要的是,它确实有助于绕过人工审核和自动检测器(我们将在下文中讨论)。

以下是使用方法:

  1. 在你的浏览器中搜索 Clever AI Humanizer 或点击 这个链接.打开智能AI人工化工具
  2. 将你用AI生成的文本复制并粘贴到输入框中。粘贴你的AI文本
  3. 点击绿色的将 AI 人性化按钮,稍等几秒钟。运行人性化处理
  4. 您的修改文本将显示在下方——请将其复制回您的文档,然后按照我们稍后在本文中介绍的方法进行AI检测。复制人性化文本
📌 请记住,即使经过人工优化,也没有任何工具可以保证100%绕过检测。每个AI检测器的工作方式都不同,有些检测器甚至极其不稳定,可能会将完全由人类撰写的文本标记为AI文本。请将人性化工具视为辅助工具,而不是万能的解决方案,并始终做好接受混合结果的准备。zerogpt中的文本比较

8种判断某物是否由AI生成的方法

好的,我们继续讲如何判断一篇文章是否由AI生成。你可能会以为有很多种方法,毕竟AI领域正在蓬勃发展,几乎每天都有新工具问世。事实上,方法主要分为两类:手动检查文本中的某些事实,或者使用专门的AI检测工具,这一点我们上面已经简单提过。那么,让我们开始吧。

方法 1:与作品的作者交谈

没有什么能胜过真实的交流。如果你怀疑一项作品是借助人工智能完成的,最直接的方法之一就是与其作者交谈。可以是面对面的会面,一个简短的电话,甚至是几句电子邮件或聊天消息的交流。形式并不重要——重要的是问足够多的问题,以判断他们是否真正了解这个主题。

如果作者确实是自己写的这篇作品,回答这些问题不会有问题。他们能够解释细节、回忆来源,并描述自己的写作过程。但如果作品主要是由人工智能生成的,那么答案很可能会显得模糊、不一致或流于表面。

很明显,这种方法主要适用于与作者有直接接触的评审、经理或教师。如果你不属于这种情况,也不用担心,直接看下一种方法即可。

方法 2:观察书面作品的一般风格

你还可以做的一件事是注意文本的整体风格。当一份草稿还没有被反复打磨,或者最终版本没有经过润色时,写作通常会显得生硬和机械化。表面上看起来读起来很流畅,但总觉得有点不对劲——几乎就像这段文字是从莫尔斯电码解码过来的,而不是由人写出来的。

很难用语言解释这一点,所以我们在下面加一个例子。

🤖 类似AI的风格:

这个工具对许多任务都很有用。它有助于组织信息。它还能帮助节省时间。总的来说,它是一个对工作很有帮助的工具。

🙋🏻‍♂️ 类人风格:

这个工具帮助你保持有序,当你想要整齐地排列物品时非常有用。它可以帮助你快速完成常规工作,让你的工作日更加顺利。

如你所见,AI示例总是围绕同一个点打转,重复用词,缺乏生气。人工版本则以更自然的方式说明同样的想法,表达更有变化和流畅感。这种语气上的差别通常足以区分两者。

方法 3:曲解事实

即使所有知名的AI生成器都进行了更新,事实扭曲的问题依然没有消失。是的,情况有所改善,但AI仍然经常混淆或错误陈述那些可以通过快速搜索核查的内容。你可能已经见过 新闻 关于GPT如何会说错美国总统的名字——同样的问题也会出现在更长的文本中。现在想象一下,这种失真在技术或精确科学领域会造成多大的危害,在这些领域中,精确性至关重要。

这就是为什么作者和审稿人都应该仔细阅读并自行进行事实核查。仅依赖未经验证的AI文本是有风险的,并且可能破坏整个作品的可信度。

方法 4:过度使用典型的AI词汇

识别AI写作最有效的方法之一是分析文本中所谓的“停用词”。这些是在机器生成的草稿中反复出现的词和短语。典型的例子包括 确保, 关键, 深入探究,还有一整套类似的表达方式,听起来很精致但已经被过度使用。在Reddit上你甚至可以找到 长时间的讨论 用户可以收集并分享这些词语的完整列表。如果你想更仔细地研究这种模式,值得去查看那些帖子。

包含停用词的AI文本

在大多数情况下,当一个人独自写作时,他们会自然而然地变换词汇。作者会选择同义词、换种说法,或者根据语境调整措辞。相比之下,人工智能往往会反复使用其算法首次生成的词语。这就是为什么由人工智能生成的草稿可能会在全文中重复十次或更多同一个词的原因。

请注意,仅仅发现其中的几个词并不能自动证明一段文字是由AI生成的。人们也会使用这些词。区别在于其模式:在AI写作中,这些词语系统性地出现,几乎像指纹一样,而在人类写作中,它们通常是零星出现的。

方法 5:注意标点符号

标点符号是另一个线索,当你想检查某些内容是否由AI生成时。乍一听可能觉得很傻,对吧?但其实不是。人们会犯小错误,漏掉逗号,多打一个句号,或者跳过引号(这都是正常的,除非你在处理法律或高度技术性的写作)。AI喜欢让一切看起来“完美无缺”。事实上,它经常做得太过了。AI生成的文本通常看起来过于整洁。逗号恰到好处地出现,句子排列得过于工整,你还会注意到多出来的破折号其实没有什么实际意义。结果看起来不自然,反而像是标点被用过头了。

AI文本中的破折号

为了明确一点,请不要仅仅因为作者用了正规长破折号(—)而不是简单连字符(-)就称某作品为AI创作。那是正常的标点符号,不是机器创作的证据。

方法 6:查看列表的结构(如果有的话)

AI生成器通常以一种奇特、公式化的方式生成列表。如果你不回去编辑它们,通常很容易被发现。结构往往遵循一定的模式—— 一个概括性的词:然后是一个简短的解释,通常重复同样的意思. 例如:

ai文本中的列表

你可以看到问题在于,解释只是绕回标题,并没有增加真正的内容。更奇怪的是,即使你在提示中要求更详细的输出,AI有时也不会纠正这种风格。这就是为什么最好自己审查这些列表,扩展要点,使它们更自然。

方法 7:检查技术(以及不仅仅是技术)细节

我们已经谈过事实的歪曲,那么作品中的细节呢?AI生成器无法处理细节,除非你亲自写出来。这适用于任何主题,无论是历史、化学、物理等。用纯文本时,这一点很容易被忽视,然而,如果作品中包含一些说明、指南或你自己的经验描述,某些操作、函数或按钮的名称有90%的概率会被描述错误。

我们很难在这里举出一个每个人都能理解的例子,但以下是我们如何测试GPT为使用Shortcuts程序在iPhone上查找大型视频文件编写说明的方法。

在 chatGPT 中生成的说明

正如你所见,GPT建议选择文件大小过滤器,但程序根本没有这个选项。因此,它提出的其他所有步骤也都变得毫无意义。

快捷方式中缺失的功能

这只是我们的一个例子,但在其他情况下和领域也是一样的。所以,如果你想知道某样东西是不是由AI写的,就去检查细节。如果你不想让别人知道你用了AI,那就要把一切都彻底完善。

方法 8:使用在线检测器检测 AI 写作

另一种检查某物是否由人工智能生成的方法,比人工识别更简单,是使用专门的在线检测工具。这些工具基于机器学习和统计模型,通过大量文本进行学习,包括人类写作和人工智能生成的文本。它们利用复杂的算法,捕捉文本来自人工智能的线索,比如句子过于相似、常见的用词选择,或重复出现的连接词。

也就是说,没有任何工具是完美的。如果检测工具将某段文字标记为 AI 生成,这并不意味着可以百分之百确定它不是人类写的。每项服务都有识别错误率。有时候,学生、博主或记者写的一些文字也可能因为“看起来”过于一致而被标记出来。牢记这一点很重要,因为如果把这些工具当作最终权威,可能会导致误报。

另一个限制是,这些检测器通常很容易被欺骗,只需付出相对较小的努力。例如,如果你将原始的 AI 输出通过一个 AI 人性化工具处理,结果往往可以绕过许多流行的检测器。进行一些编辑,替换同义词,或者仅仅是重组句子,有时就足以让算法困惑。

为了展示这一点,我们将下面截图中的示例文本进行了处理 ZeroGPT. 结果清楚地突出显示了AI生成的部分。这支持了我们已经手动发现的内容:文本中存在重复、停用词、破折号和通用描述。

zerogpt中的ai文本

为了进一步推进测试,我们决定进行一个实验,并将同样的文本传递给 Clever AI Humanizer. 结果从ZeroGPT时几乎100%的AI概率显著下降到仅13%。我们认为如果有更多的文本样本,这一数字还会更小。

zerogpt中的humanizer后的文本

最终想法

好了,现在你知道了无论你是作者还是审稿人,都可以检查某些内容是否由AI生成。这些方法够用吗?绰绰有余。不过,即使把所有方法都结合使用,也永远无法给你100%的保证。这是因为AI生成器和AI检测器都在不断地以人类作品为训练对象,并不断自我提升。这个循环让界限变得如此模糊,以至于即使是完全由人类写的文本有时也会被标记为AI生成。

哪种方法最好?说实话,没人知道。当然,最快的方法是使用在线AI检测器,但你需要信任这个工具。其中有些检测器非常不稳定,甚至把宪法标记为100% AI生成,所以你要注意这一点。另一方面,如果你有经验且眼光敏锐,简单地重新阅读文本往往就足够了。当一篇文章不是作者直接写的(或者至少没有经过修订,而是直接由生成器生成的),AI的痕迹通常很明显。

我们希望这能帮助您更清晰地了解这个话题。如果您是作者,请不要过度使用 AI 工具——它们无法替代您的个人风格。如果您是审稿人,仅仅因为发现一个“ensure”或一个破折号(—),也不要急于认定这是一篇由 AI 生成的文本。

常见问题

不,你不能百分之百确定,除非你自己写了这段文字并且知道它的来源。即使是最好的方法,也只能以很高的概率判断这篇文章显示出一些AI写作的特征,比如重复、停用词、通用性指令,或者结构过于精致。但这些特征都不能提供绝对的证据。
现在有许多此类服务,但在社会上获得最多认可的两个是 ZeroGPT 和 QuillBot 的 AI 检测器。学生、教师、编辑和营销人员都广泛使用它们来检测内容是否由 AI 生成。同时,它们的检测结果应作为参考指标,而非绝对真理,因为可能会出现误判和漏判的情况。
是的。这可以通过两种方式实现。第一,手动编辑文本以去除明显的 AI 痕迹(例如,打破重复结构或添加真实细节)。第二,使用诸如 Clever AI Humanizer 之类的专用工具,这些工具可以自动重写机器化的文本,使其看起来更自然。在这两种情况下,检测工具中的检测分数都可能大幅下降。
不总是。一个很好的例子是这个 Reddit讨论,用户尝试识别哪些内容是由AI生成的。有些参与者能正确识别出AI生成的段落,但也有人认为即使是人类写的文本也是机器生成的。这表明,尽管经验有帮助,但人类读者并非万无一失,并且经常会对什么“感觉像AI”产生分歧。
最实用的方法是结合人工观察和自动化工具。人工方面,你可以查找结构重复、过度使用停用词、指令模糊或者缺乏细节的类似事实陈述,这些都是常见的AI写作模式。在技术层面,像ZeroGPT或QuillBot的AI检测器等服务可以帮助你找出可疑段落。不过,这些方法都无法提供绝对的确定性,只能在判断某内容是否由AI撰写时提高你的信心。
Jeff Cochin 在数据管理、数据恢复和数据仓储领域拥有超过十年的实操经验,是一位杰出的专家。他的专业领域涵盖数据云、故障切换 (failover)、SaaS,以及为高速增长的初创企业制定数字营销策略。他对 Mac 电脑、Apple 生态系统以及 iPhone 技术拥有深入的了解,使其在这些领域享有值得信赖的权威地位。 近五年来,Jeff 一直担任专职技术撰稿人,深入研究并评测新的应用和服务,尤其是与 Apple 和 Mac 技术相关的内容。当他不在为 Mac 和 iPhone 环境撰写文章、排查问题或编写脚本时,他会享受户外活动。作为一名热爱骑行、皮划艇和徒步的运动爱好者,他经常与志同道合的朋友一起探索新的户外路线。
回到顶部