8 методів виявлення тексту, згенерованого ШІ

Зміст

Ви використовували ШІ для створення навчальних матеріалів, контенту для свого вебсайту чи навіть робочих звітів і хвилюєтеся, що результат виглядає як написаний ШІ або може бути виявлений детекторами? Або ви з іншого боку, де потрібно перевірити чийсь текст чи документ на наявність слідів ШІ, але не знаєте, з чого почати?

Це все легко вирішується, тому в цій статті ми розповімо вам про деякі методи виявлення тексту, згенерованого штучним інтелектом. Ви дізнаєтесь, на що саме звертати увагу під час перегляду тексту, а також які інструменти допоможуть вам швидко розпізнати текст, створений ШІ.

Як команда редакторів і авторів блогу, ми знаємо з власного досвіду, наскільки важливо виявляти текст, згенерований ШІ, тому всі ці методи були протестовані в реальних сценаріях, і ви можете бути впевнені, що підходи, якими ми ділимося, дійсно працюють.

Як працюють генератори тексту на основі ШІ і чому ми все ще можемо впізнати текст, створений ШІ?

Кожен вже чув про ChatGPT або Google Gemini — ймовірно, ви навіть спробували один із них для чернетки електронного листа, складання плану звіту чи просто для розваги. В основі цих інструментів лежить навчання на величезних масивах тексту та здатність прогнозувати, яке слово найімовірніше буде наступним. Саме так вони створюють мову, що читається плавно та виглядає організовано. Насправді іноді результати виглядають навіть охайніше, ніж те, що більшість людей написали б із першої спроби. Це швидко, презентабельно, і на перший погляд може видатися рукописним текстом.

Але якщо ШІ навчається на людській мові, чому ми все ще можемо розпізнати текст, згенерований ШІ? Причина в тому, що передбачення залишає певні шаблони. Текст, написаний машиною, зазвичай грає на безпеці, дотримуючись звичних фраз, збалансованого тону та повторюваних структур речень. Люди ж, навпаки, роблять дрібні помилки, додають особистість, змінюють стиль у середині абзацу й посилаються на власний досвід. Ці недосконалості слугують відбитками справжності.

Ось як зазвичай виглядає контраст:

🙋🏻‍♂️ Ознаки людського письма 🤖 Риси письма машини (ШІ)
Особистий тон, емоція, суб’єктивна упередженість Нейтральний, відшліфований, надмірно врівноважений
Опечатки, уривчасті формулювання, зміни стилю Послідовна структура, повторюваний потік
Креативні стрибки, гумор, непередбачуваність Безпечний вибір слів, формульні шаблони
Посилання на реальні події чи досвід Можливі “галюцинації” або фейкові деталі

Чи можливо ускладнити виявлення тексту, згенерованого ШІ

Перш ніж переходити до фактичних методів виявлення AI-тексту, варто зупинитися на хвилину і поставити ще одне запитання: чи можна зробити AI-текст менш впізнаваним? Відповідь досить проста — так, можна. Є способи, які допомагають зробити текст менш механічним і більш схожим на написаний людиною, а не на той, що був згенерований автоматично.

🙂 Тобто, цей розділ більше для тих читачів, які потрапили сюди, бо хочуть зробити свою роботу, створену ШІ, менш очевидною. Якщо ж ви з тих, хто перевіряє чужі тексти й хоче упіймати когось на невеличкому “шахрайстві” із ШІ, можете сміливо переходити до методів виявлення.

Перший варіант — переписати те, що дав вам ШІ. Так, буквально — взяти чорновик і переробити його так, як ви написали б самі. Якщо ви витратили час на створення сильного запиту, а не просто ввели “напиши мені диплом,” результат може стати добрим стартом. Далі ви можете адаптувати його під свій особистий стиль — чи то для блогу, університетської роботи, чи для звіту компанії. Звісно, це потребує більше зусиль і роздумів, але це працює.

Якщо переписування — це не ваш шлях, є інший варіант: Людськознавці ШІ. Це інструменти, створені для виконання зворотної задачі — вони відредагувати машинний текст, щоб він звучав більш по-людськи, виправлення типових шаблонів і вибору слів ШІ. В інтернеті є безліч таких додатків, кожен з різними умовами використання, але принцип залишається той самий. Один із тих, що ми нещодавно протестували і можемо рекомендувати, це Clever AI Humanizer (той самий розробник, відомий за Disk Drill та Clever Cleaner). Це безкоштовно, не містить реклами чи прихованих платних функцій, і найголовніше — справді допомагає обходити як ручні перевірки, так і автоматизовані детектори (про які ми поговоримо нижче).

Ось як це використовувати:

  1. Пошук Clever AI Humanizer у вашому браузері або натисніть це посилання.відкрити clever ai humanizer
  2. Скопіюйте й вставте ваш згенерований ШІ текст у поле введення.вставте свій AI-текст
  3. Натисніть зелену кнопку Humanize AI і зачекайте кілька секунд.запустити процес humanize
  4. Ваш доопрацьований текст з’явиться нижче — скопіюйте його назад у свій документ, а потім перевірте за допомогою AI тими методами, які ми розглянемо далі в цій статті.копіювати гуманізований текст
📌 Будь ласка, пам’ятайте, що навіть після людянізації жоден інструмент не може гарантувати 100% обходу. Кожен детектор ШІ працює по-різному, і деякі настільки непередбачувані, що можуть навіть позначити тексти, повністю написані людиною, як створені ШІ. Сприймайте людянізатори як корисні інструменти, а не як чарівне рішення, і завжди будьте готові до змішаних результатів.порівняння тексту в zerogpt

8 методів, як визначити, чи щось створено штучним інтелектом

Гаразд, давайте перейдемо до методів, як визначити, чи текст створений штучним інтелектом. Можна було б очікувати десятків варіантів, особливо зважаючи на те, що сфера ШІ стрімко розвивається і нові інструменти з’являються майже щодня. Насправді все зводиться до двох підходів: перевірка певних фактів у тексті вручну або використання спеціалізованих детекторів ШІ, про які ми вже коротко згадували вище. Тож почнемо.

Метод 1: Поговоріть з автором твору

Ніщо не зрівняється з живим спілкуванням. Якщо ви підозрюєте, що якусь роботу написано за допомогою ШІ, одним із найпростіших способів перевірки є просто поговорити з її автором. Це може бути особиста зустріч, короткий телефонний дзвінок або навіть коротке листування електронною поштою чи в месенджері. Формат не надто важливий — головне поставити достатньо запитань, щоб з’ясувати, чи дійсно людина розуміє тему.

Якщо автор справді написав твір самостійно, відповісти на ці запитання не буде проблемою. Він зможе пояснити деталі, згадати джерела та описати свій процес. Але якщо роботу здебільшого згенерував штучний інтелект, відповіді, ймовірно, звучатимуть нечітко, непослідовно або поверхнево.

Очевидно, цей метод головним чином корисний для рецензентів, менеджерів або викладачів, які мають прямий контакт з автором. Якщо це не ваш випадок, не хвилюйтеся, просто переходьте до наступного методу.

Метод 2: Подивіться на загальний стиль письмової роботи

Ще одна річ, на яку ви можете звернути увагу, — це загальний стиль тексту. Коли над чернеткою ще не працювали або фінальна версія не була відредагована, письмо часто здається сухим і механічним. На перший погляд текст читається плавно, але щось у ньому не так — наче текст був не написаний людиною, а розшифрований із азбуки Морзе.

Важко пояснити це словами, тож давайте додамо приклад нижче.

🤖 Стиль, схожий на ШІ:

Цей інструмент корисний для багатьох завдань. Він допомагає організовувати інформацію. Він також допомагає економити час. Загалом, це корисний інструмент для роботи.

🙋🏻‍♂️ Людський стиль:

Цей інструмент допомагає вам залишатися організованим, він корисний, коли ви хочете акуратно розмістити речі. Він допомагає швидко виконувати регулярні завдання, тож ваш робочий день проходить гладко.

Як ви можете бачити, приклад штучного інтелекту крутиться навколо однієї й тієї ж думки, повторює слова та здається бездушним. Версія людини пояснює ту ж ідею більш природно, з різноманітністю та плавністю. Цієї різниці в інтонації зазвичай достатньо, щоб відрізнити ці два варіанти.

Метод 3: Викривлення фактів

Навіть після оновлень усіх відомих генераторів ШІ проблема викривлення фактів не зникла. Так, ситуація трохи покращилася, але ШІ досі часто плутає або неправильно подає те, що можна перевірити швидким пошуком. Ви, напевно, бачили новини про те, як GPT може назвати неправильного президента Сполучених Штатів — ця ж проблема проявляється і в довших текстах. Тепер уявіть, якої шкоди таке спотворення може завдати в технічних або точних науках, де найбільше важить точність.

Саме тому і автор, і рецензент повинні уважно читати і проводити власну перевірку фактів. Покладатися на текст, створений ШІ, без перевірки ризиковано і може підірвати довіру до всієї роботи.

Метод 4: Надмірне використання типових AI слів

Один із найефективніших способів розпізнати текст, написаний штучним інтелектом, — це проаналізувати його на наявність так званих “ стоп-слів. ” Це слова й фрази, які знову й знову трапляються у текстах, згенерованих машиною. Типові приклади включають забезпечити, важливий, глибоке занурення в, і ціла низка схожих виразів, які звучать вишукано, але занадто заїжджено. На Reddit можна навіть знайти довгі обговорення де користувачі збирають і діляться цілими списками таких слів. Якщо ви хочете детальніше вивчити цю закономірність, варто переглянути ці теми.

ai текст зі стоп-словами

У більшості випадків, коли людина пише самостійно, вона природно варіює словниковий запас. Автори підбирають синоніми, перефразовують або змінюють формулювання залежно від контексту. Штучний інтелект, навпаки, схильний повторювати перший термін, який видав його алгоритм. Тому чорновик, створений ШІ, може містити десять і більше повторів одного й того ж слова, розкиданих по всьому тексту.

Зверніть увагу, однак, що виявлення декількох з цих слів не є автоматичним доказом того, що текст згенерований штучним інтелектом. Люди теж їх використовують. Різниця у закономірності: у текстах ШІ ці слова з’являються систематично, майже як відбиток пальця, а у людських текстах зазвичай трапляються більш випадково.

Метод 5: Звертайте увагу на пунктуацію

Пунктуація — це ще одна підказка, коли ви хочете перевірити, чи згенеровано щось штучним інтелектом. Звучить спочатку дивно, правда? Але це не так. Люди роблять дрібні помилки, пропускають кому, додають зайву крапку або забувають лапки (і це нормально, якщо ви не маєте справи з юридичними чи дуже технічними текстами). ШІ любить робити все “ідеально.” Насправді він часто перегинає палицю. Текст, згенерований ШІ, часто виглядає надто акуратно. Кому ставлять саме там, де треба, речення вирівняні занадто чітко, і ви помітите зайві тире, додані без жодної причини. У результаті текст не виглядає природно, більше схоже на надмірно використану пунктуацію.

дефіси в AI-тексті

І щоб було зрозуміло, будь ласка, не називайте текст штучним інтелектом лише тому, що автор використав правильне довге тире (—) замість простого дефісу (-). Це нормальна пунктуація, а не доказ роботи машини.

Метод 6: Подивіться на структуру списків, якщо вони є

Генератори ШІ часто створюють списки у своєрідний, шаблонний спосіб. Якщо їх не редагувати, зазвичай їх досить легко впізнати. Структура, як правило, слідує певному шаблону — Узагальнююче слово: потім коротке пояснення, яке часто повторює ту саму ідею. Наприклад:

список у тексті штучного інтелекту

Ви можете помітити проблему в тому, що пояснення просто повертається до заголовка, не додаючи реальної суті. Ще дивніше те, що ШІ іноді не виправляє цей стиль, навіть якщо ви вимагаєте більш детальні відповіді в запиті. Ось чому завжди найкраще самостійно переглядати списки, розширювати пункти та робити їх більш природними.

Метод 7: Перевірте технічні (і не лише) деталі

Ми вже говорили про спотворення фактів, а як щодо деталей у роботі? Генератори ШІ не можуть працювати з деталями, якщо ви їх самі не пропишете. Це стосується будь-якої теми, чи то історія, хімія, фізика тощо. У звичайному тексті це легко не помітити, проте якщо у роботі містяться якісь інструкції, гайди або опис власного досвіду, певні дії, назви функцій чи кнопок будуть описані неправильно з імовірністю 90%.

Нам важко навести тут приклад, який буде зрозумілий усім, але ось як ми тестували GPT на складання інструкцій для використання програми Shortcuts для пошуку великих відеофайлів на iPhone.

інструкції, згенеровані в chatGPT

Як ви можете бачити, GPT запропонував вибрати фільтр за розміром файлу, але у програмі навіть немає такої опції. Відповідно, всі інші кроки, які він запропонував, вже були безглуздими.

відсутні-функції-в-ярликах

І це лише наш приклад, але в інших випадках і сферах буде так само. Тож якщо ви хочете дізнатися, чи написано щось ШІ, перевіряйте деталі. Якщо ви не хочете, щоб хтось дізнався, що ви використали ШІ, ретельно все опрацьовуйте.

Метод 8: Виявлення тексту, написаного ШІ, за допомогою онлайн-чекера

Інший спосіб перевірити, чи щось було створено штучним інтелектом, який є простішим за ручну ідентифікацію, — це використання спеціалізованого онлайн-чекера. Ці інструменти побудовані на машинному навчанні та статистичних моделях, які навчаються на великій кількості текстів, включаючи тексти, написані людьми, а також тексти, створені ШІ. Вони використовують складні алгоритми, щоб знаходити підказки про те, що текст створений штучним інтелектом, наприклад, надто схожі речення, типовий вибір слів або повторювані сполучні слова.

Тим не менш, жоден інструмент не є ідеальним. Якщо перевірка визначає текст як створений штучним інтелектом, це не означає зі 100% впевненістю, що його не написала людина. Кожний сервіс має певний рівень похибки при ідентифікації. Іноді робота студента, блогера чи журналіста може “здаватися” надто послідовною і бути помилково позначеною. Це важливо пам’ятати, адже сприйняття таких інструментів як остаточної інстанції може призвести до хибних висновків.

Ще одне обмеження полягає в тому, що такі детектори часто можна обдурити з відносно невеликими зусиллями. Наприклад, якщо пропустити сирий вихід штучного інтелекту через AI humanizer, результат може обійти багато популярних перевірок. Декілька правок, заміна синонімів або просте переформулювання речень іноді достатньо, щоб збити алгоритми з пантелику.

Щоб показати це в дії, ми пропустили зразковий текст (скріншот нижче) через ZeroGPT. Результат чітко виділив розділи як згенеровані ШІ. Це підтверджує те, що ми вже виявили вручну: текст містить повторення, службові слова, тире та загальні описи.

ai текст у zerogpt

Щоб далі просунути тест, ми вирішили провести експеримент і пропустили той самий текст через Clever AI Humanizer. Результат значно знизився з майже 100% ймовірності ШІ у ZeroGPT до лише 13%. Ми вважаємо, що це число було б ще меншим при більшій вибірці тексту.

текст у zerogpt після humanizer

Остаточні думки

Тепер ви знаєте, як перевірити, чи згенеровано щось ШІ, незалежно від того, на чиєму ви боці — автора чи рецензента. Чи достатньо для цього методів? Більш ніж достатньо. Проте навіть використання всіх їх разом ніколи не дасть вам 100% гарантії. Це тому, що і генератори ШІ, і детектори ШІ продовжують навчатися на роботах людей і постійно вдосконалюються самі на собі. Такий цикл настільки розмиває межу, що навіть текст, написаний повністю людиною, іноді може бути позначений як створений ШІ.

Який метод найкращий? Чесно кажучи, ніхто не знає. Найшвидший підхід — це, звичайно, використання онлайн перевірок на ШІ, але потрібно довіряти інструменту. Деякі з них настільки непослідовні, що помічали навіть конституції як 100% ШІ, тож майте це на увазі. З іншого боку, якщо у вас є досвід і гостре око, достатньо просто перечитати текст. Коли твір написаний не безпосередньо автором (або принаймні не відредагований ним і скинутий сирим з генератора), сліди ШІ зазвичай очевидні.

Ми сподіваємося, що це допомогло вам краще зрозуміти тему. Якщо ви автор, не зловживайте інструментами ШІ — вони не замінять ваш власний стиль. А якщо ви рецензент, не поспішайте називати текст створеним ШІ лише тому, що ви помітили одне “ensure” або один дефіс (—).

ЧаПи

Ні, ви не можете бути на 100% впевнені, якщо тільки ви самі не написали цей текст і не знаєте його походження. Навіть найкращі методи можуть лише з великою ймовірністю визначити, що в тексті є ознаки ШІ, такі як повторення, стоп-слова, загальні інструкції або надто відполірована структура. Але жоден із цих показників не може бути абсолютним доказом.
Зараз існує багато сервісів, але два, які здобули найбільшу легітимність у суспільстві, це ZeroGPT і QuillBot’s AI Detector. Обидва широко використовуються студентами, викладачами, редакторами та маркетологами для перевірки, чи є текст створеним штучним інтелектом. Водночас їх результати слід сприймати як індикатори, а не як остаточну істину, оскільки можливі як хибнопозитивні, так і хибнонегативні результати.
Так. Це може статися двома способами. По-перше, шляхом ручного редагування тексту для усунення очевидних ознак ШІ (наприклад, розбивання повторюваних структур або додавання реальних деталей). По-друге, за допомогою спеціальних інструментів, таких як Clever AI Humanizer, які автоматично переписують машиноподібний текст, щоб він виглядав природніше. В обох випадках результати перевірки детекторів можуть різко знижуватися.
Не завжди. Гарний приклад — це Обговорення на Reddit, де користувачі намагалися визначити, які частини контенту були згенеровані ШІ. Деякі учасники правильно визначили фрагменти, створені ШІ, але інші вважали навіть тексти, написані людьми, продуктом машини. Це показує, що хоча досвід допомагає, люди не є безпомилковими і часто не погоджуються щодо того, що “відчувається як ШІ.”
Найпрактичніший спосіб — поєднати як ручне спостереження, так і автоматизовані інструменти. Вручну ви можете звертати увагу на структурну повторюваність, надмірне використання стоп-слів, розмиті інструкції або фактоподібні твердження без деталей. Це типові патерни ШІ. З технічного боку сервіси на кшталт ZeroGPT або QuillBot’s AI Detector можуть допомогти виділити підозрілі уривки. Втім, жоден із цих методів не дає абсолютної впевненості — вони лише підвищують вашу впевненість у визначенні, чи написано щось ШІ.
Джефф Кочин — визнаний експерт у сфері керування даними, їх відновлення та зберігання, з понад десятьма роками практичного досвіду. Його експертиза охоплює хмарні технології, системи відновлення після збоїв (failovers), SaaS, а також розробку стратегій цифрового маркетингу для стартапів з високими темпами зростання. Він має глибокі знання комп’ютерів Mac, екосистеми Apple та технологій iPhone, що робить його авторитетним фахівцем у цих галузях. Протягом майже п’яти років Джефф працює як технічний автор, займаючись глибокими дослідженнями та оглядом нових застосунків і сервісів, особливо пов’язаних з технологіями Apple і Mac. Коли він не пише, не усуває неполадки чи не створює скрипти для Mac та iPhone, йому подобаються пригоди на природі. Він захоплюється велоспортом, каякінгом і пішим туризмом, і часто досліджує нові маршрути з друзями, які поділяють його любов до природи.
До початку сторінки