8 Phương pháp để Phát hiện Văn bản do AI tạo ra
Bạn đã từng sử dụng AI để soạn thảo tài liệu học tập, nội dung cho trang web hoặc thậm chí là báo cáo công việc, và lo lắng rằng kết quả trông giống AI hoặc có thể bị các công cụ phát hiện đánh dấu? Hoặc bạn ở phía ngược lại, cần kiểm tra bài viết hoặc tài liệu của ai đó để phát hiện dấu vết của AI nhưng không biết bắt đầu từ đâu?
Điều này đều có thể giải quyết dễ dàng, vì vậy trong bài viết này, chúng tôi sẽ hướng dẫn bạn một số phương pháp giúp nhận biết văn bản do AI tạo ra. Bạn sẽ biết chính xác những gì cần chú ý khi xem xét văn bản, cũng như các công cụ có thể giúp bạn phát hiện văn bản do AI tạo ra một cách nhanh chóng.
Cách các Trình tạo Văn bản AI hoạt động và Tại sao Chúng ta vẫn có thể Nhận ra Văn bản do AI viết?
Giờ đây, ai cũng đã nghe nói về ChatGPT hoặc Google Gemini — rất có thể bạn còn từng thử dùng một trong hai công cụ này để soạn email, phác thảo báo cáo hoặc đơn giản là thử khám phá. Về cơ bản, các công cụ này được huấn luyện trên những tập dữ liệu văn bản khổng lồ và dựa vào việc dự đoán từ nào có khả năng xuất hiện tiếp theo. Đó là lý do chúng có thể tạo ra ngôn ngữ mượt mà và gọn gàng. Thậm chí, đôi khi kết quả đầu ra còn trông sạch sẽ hơn những gì hầu hết mọi người có thể viết ở lần thử đầu tiên. Nó nhanh, được trau chuốt, và thoạt nhìn, có thể giống như một tác phẩm do con người viết ra.
Nhưng nếu AI học từ ngôn ngữ của con người, tại sao chúng ta vẫn có thể nhận ra văn bản do AI tạo ra? Lý do là việc dự đoán để lại một số khuôn mẫu nhất định. Văn bản do máy viết thường an toàn, bám vào các cách diễn đạt phổ biến, giọng điệu cân bằng và cấu trúc câu lặp đi lặp lại. Trong khi đó, con người lại mắc những lỗi nhỏ, thêm cá tính, thay đổi phong cách giữa đoạn và nhắc đến những trải nghiệm thực tế. Những điểm không hoàn hảo đó giống như dấu vân tay của sự chân thật.
Đây là cách mà sự tương phản thường trông như thế này:
| 🙋🏻♂️ Đặc điểm Viết của Con người | 🤖 Đặc điểm viết của Máy (AI) |
| Giọng điệu cá nhân, cảm xúc, thiên vị chủ quan | Trung lập, trau chuốt, quá cân bằng |
| Lỗi chính tả, cách diễn đạt đột ngột, thay đổi phong cách | Cấu trúc nhất quán, dòng chảy lặp lại |
| Những bước nhảy sáng tạo, hài hước, khó lường | Lựa chọn từ an toàn, các mẫu giống như công thức |
| Các tham chiếu đến các sự kiện hoặc trải nghiệm thực tế | Có thể “ảo giác” hoặc chi tiết giả |
Có thể làm cho việc nhận diện văn bản do AI tạo ra trở nên khó khăn hơn không
Trước khi chúng ta đi vào các phương pháp thực sự để phát hiện văn bản do AI viết, đáng để dừng lại một chút và đặt ra một câu hỏi khác: bạn có thể làm cho văn bản AI khó nhận ra hơn không? Câu trả lời khá đơn giản — có, bạn có thể. Có những mẹo giúp văn bản nghe bớt máy móc và gần giống với những gì một người thực sự viết hơn, thay vì trông giống như được tạo ra trực tiếp từ một trình tạo văn bản.
Lựa chọn đầu tiên là viết lại những gì AI đã cung cấp cho bạn. Đúng vậy, nghĩa đen — hãy lấy bản nháp đó và chỉnh sửa lại như thể bạn tự viết nó. Nếu bạn đã dành thời gian để tạo ra một prompt mạnh thay vì chỉ gõ “viết cho tôi một luận văn,” thì kết quả có thể là một điểm khởi đầu khá tốt. Sau đó bạn có thể điều chỉnh theo phong cách cá nhân của mình, dù đó là giọng văn của blog, bài báo đại học hay báo cáo công ty. Tất nhiên, cách này đòi hỏi nhiều công sức và suy nghĩ hơn, nhưng nó hiệu quả.
Nếu việc viết lại không phải là con đường của bạn, thì vẫn còn một lựa chọn khác: Trình nhân bản AI. Đây là các công cụ được tạo ra để làm công việc ngược lại — chúng điều chỉnh văn bản máy để nghe tự nhiên hơn, sửa các kiểu mẫu AI điển hình và lựa chọn từ ngữ. Có rất nhiều ứng dụng như vậy trên mạng, mỗi ứng dụng có các điều khoản sử dụng khác nhau, nhưng nguyên tắc thì giống nhau. Một ứng dụng mà chúng tôi vừa thử nghiệm và có thể đề xuất là Clever AI Humanizer (cùng nhà phát triển nổi tiếng với Disk Drill và Clever Cleaner). Ứng dụng này miễn phí, không có quảng cáo hay trả phí ẩn, và quan trọng nhất là nó thực sự giúp vượt qua cả kiểm tra thủ công lẫn bộ phát hiện tự động (chúng tôi sẽ bàn thêm bên dưới).
Đây là cách sử dụng nó:
- Tìm kiếm Clever AI Humanizer trên trình duyệt của bạn hoặc nhấp vào liên kết này.

- Sao chép và dán văn bản do AI tạo ra vào ô nhập.

- Nhấp vào nút màu xanh lá Humanize AI và chờ vài giây.

- Văn bản đã được bạn chỉnh sửa sẽ xuất hiện bên dưới — sao chép lại vào tài liệu của bạn và sau đó kiểm tra AI bằng các phương pháp mà chúng tôi sẽ đề cập sau trong bài viết này.


8 phương pháp để nhận biết liệu một thứ gì đó có phải do AI tạo ra hay không
Được rồi, hãy chuyển sang các phương pháp để nhận biết bài viết có phải do AI tạo ra hay không. Bạn có thể nghĩ rằng sẽ có hàng tá lựa chọn, đặc biệt là khi lĩnh vực AI đang bùng nổ và các công cụ mới dường như xuất hiện mỗi ngày. Trên thực tế, tất cả đều chỉ xoay quanh hai cách tiếp cận: kiểm tra thủ công một số thông tin cụ thể trong văn bản hoặc sử dụng các trình kiểm tra AI chuyên dụng, như chúng ta đã đề cập ngắn gọn ở trên. Vậy hãy bắt đầu nào.
Phương Thức 1: Nói chuyện với Tác giả của Tác phẩm
Không gì vượt qua được giao tiếp thực sự. Nếu bạn nghi ngờ một tác phẩm nào đó được viết với sự trợ giúp của AI, một trong những cách trực tiếp nhất để kiểm tra là đơn giản nói chuyện với tác giả. Điều này có thể là một cuộc gặp mặt trực tiếp, một cuộc gọi nhanh, hoặc thậm chí là một vài trao đổi ngắn qua email hay tin nhắn. Hình thức không quan trọng lắm — điều quan trọng là đặt đủ câu hỏi để xem liệu họ thực sự hiểu về chủ đề đó hay không.
Nếu tác giả thực sự tự viết tác phẩm đó, việc trả lời những câu hỏi này sẽ không thành vấn đề. Họ sẽ có thể giải thích chi tiết, nhớ lại các nguồn và mô tả quy trình của mình. Nhưng nếu tác phẩm chủ yếu được tạo ra bởi AI, các câu trả lời có thể sẽ nghe mơ hồ, thiếu nhất quán hoặc hời hợt.
Rõ ràng, phương pháp này chủ yếu hữu ích cho những người đánh giá, quản lý hoặc giáo viên có tiếp xúc trực tiếp với tác giả. Nếu bạn không thuộc trường hợp này, đừng lo, chỉ cần chuyển sang phương pháp tiếp theo.
Phương Thức 2: Hãy xem xét phong cách chung của bài viết
Một điều nữa bạn có thể làm là chú ý đến phong cách tổng thể của đoạn văn bản. Khi một bản nháp chưa được chỉnh sửa hoặc phiên bản cuối cùng chưa được trau chuốt, bài viết thường trở nên cứng nhắc và máy móc. Nó có vẻ trôi chảy ở bề mặt, nhưng có điều gì đó không ổn — gần như thể đoạn văn đã được giải mã từ mã Morse thay vì được viết bởi một con người.
Thật khó để giải thích điều này bằng lời, vì vậy hãy thêm một ví dụ bên dưới.
🤖 Phong cách giống AI:
Công cụ này hữu ích cho nhiều nhiệm vụ. Nó giúp tổ chức thông tin. Nó cũng giúp tiết kiệm thời gian. Nhìn chung, đây là một công cụ hữu ích cho công việc.
🙋🏻♂️ Phong cách giống con người:
Công cụ này giúp bạn giữ mọi thứ ngăn nắp, rất hữu ích khi bạn muốn sắp xếp các vật dụng gọn gàng. Nó giúp bạn hoàn thành các công việc thường ngày nhanh chóng, nhờ đó ngày làm việc của bạn trở nên suôn sẻ hơn.
Như bạn có thể thấy, ví dụ AI lặp lại cùng một ý, lặp lại từ ngữ và thiếu sức sống. Phiên bản do con người viết giải thích cùng một ý tưởng một cách tự nhiên hơn, có sự đa dạng và liền mạch. Sự khác biệt về giọng điệu đó thường đủ để phân biệt hai phiên bản.
Phương Thức 3: Bóp méo sự thật
Ngay cả với các bản cập nhật cho tất cả các trình tạo AI nổi tiếng, vấn đề bóp méo sự thật vẫn chưa biến mất. Đúng là nó đã tốt hơn một chút, nhưng AI vẫn thường xuyên nhầm lẫn hoặc phát biểu sai về những điều có thể kiểm tra nhanh bằng một lượt tìm kiếm. Có lẽ bạn đã thấy tin tức về việc GPT có thể nêu tên sai Tổng thống Hoa Kỳ — vấn đề tương tự cũng xuất hiện trong các văn bản dài hơn. Giờ hãy tưởng tượng mức độ thiệt hại mà kiểu bóp méo như vậy có thể gây ra trong các ngành khoa học kỹ thuật hoặc chính xác, nơi mà sự chính xác là quan trọng nhất.
Đó là lý do cả tác giả và người đánh giá đều nên đọc kỹ và tự kiểm tra tính xác thực. Dựa vào văn bản AI mà không xác minh là điều rủi ro và có thể làm suy giảm độ tin cậy của toàn bộ tác phẩm.
Phương Thức 4: Sử dụng quá nhiều từ ngữ AI điển hình
Một trong những cách hiệu quả nhất để nhận diện văn bản do AI viết là phân tích văn bản để tìm các “từ dừng.” Đây là những từ và cụm từ xuất hiện lặp đi lặp lại trong các bản nháp do máy tạo ra. Các ví dụ điển hình bao gồm đảm bảo, quan trọng, đào sâu vào, và cả một loạt các biểu hiện tương tự nghe có vẻ trau chuốt nhưng bị lạm dụng quá mức. Trên Reddit bạn thậm chí còn có thể tìm thấy những cuộc thảo luận dài nơi người dùng thu thập và chia sẻ toàn bộ danh sách các từ này. Nếu bạn muốn nghiên cứu kỹ hơn về mô hình này, thì nên xem qua các chủ đề đó.

Trong hầu hết các trường hợp, khi một người tự viết, họ tự nhiên thay đổi vốn từ vựng. Tác giả sẽ chọn từ đồng nghĩa, diễn đạt lại hoặc điều chỉnh cách diễn đạt tùy vào ngữ cảnh. Trong khi đó, AI lại có xu hướng lặp lại từ đầu tiên mà thuật toán của nó tạo ra. Đó là lý do tại sao một bản nháp được tạo ra bởi AI có thể có mười lần lặp lại hoặc nhiều hơn của cùng một từ rải rác khắp văn bản.
Phương Thức 5: Hãy chú ý đến dấu câu
Dấu câu là một manh mối khác khi bạn muốn kiểm tra xem nội dung có phải do AI tạo ra hay không. Lúc đầu nghe có vẻ ngớ ngẩn, đúng không? Nhưng thực ra không phải vậy. Con người thường mắc những lỗi nhỏ, như quên dấu phẩy, thêm dấu chấm dư, hoặc bỏ qua dấu ngoặc kép (và điều đó là bình thường, trừ khi bạn làm việc với các văn bản pháp lý hoặc kỹ thuật cao). AI rất thích làm cho mọi thứ trông “hoàn hảo.” Thực tế, nó thường đi quá xa. Văn bản do AI tạo ra thường trông quá chỉnh tề. Dấu phẩy luôn đặt đúng chỗ, các câu thẳng hàng đều tăm tắp, và bạn sẽ nhận thấy có những dấu gạch ngang xuất hiện thêm mà không có lý do thực sự. Kết quả là cảm giác không tự nhiên, giống như dấu câu bị lạm dụng quá mức.

Phương Thức 6: Xem xét cấu trúc của các danh sách, nếu có
Các trình tạo AI thường tạo ra các danh sách theo một cách kỳ lạ, rập khuôn. Nếu bạn không quay lại và chỉnh sửa, thường rất dễ nhận ra. Cấu trúc thường theo một mô hình — Một từ khái quát: sau đó là một lời giải thích ngắn thường lặp lại ý tưởng đó. Ví dụ:

Bạn có thể thấy vấn đề là phần giải thích chỉ lặp lại tiêu đề mà không bổ sung nội dung thực sự. Thậm chí còn kỳ lạ hơn khi đôi khi AI không sửa phong cách này ngay cả khi bạn yêu cầu câu trả lời chi tiết hơn trong prompt. Đó là lý do tại sao bạn luôn nên tự kiểm tra lại các danh sách, mở rộng các ý chính và làm cho chúng tự nhiên hơn.
Phương Thức 7: Kiểm tra các chi tiết kỹ thuật (và không chỉ kỹ thuật)
Chúng ta đã nói về việc bóp méo sự thật, vậy còn các chi tiết trong bài làm thì sao? Các trình tạo AI không thể làm việc với các chi tiết trừ khi bạn tự viết chúng. Điều này áp dụng cho bất kỳ chủ đề nào, dù là lịch sử, hóa học, vật lý, v.v. Trong văn bản thuần túy, điều này rất dễ bị bỏ qua, tuy nhiên, nếu bài làm chứa một số hướng dẫn, chỉ dẫn hoặc mô tả về trải nghiệm cá nhân của bạn, thì các hành động nhất định, tên chức năng hoặc nút bấm sẽ bị mô tả sai với xác suất 90%.
Chúng tôi khó có thể đưa ra một ví dụ ở đây mà mọi người đều có thể hiểu, nhưng đây là cách chúng tôi đã kiểm tra GPT trong việc viết hướng dẫn sử dụng chương trình Shortcuds để tìm các tệp video lớn trên iPhone.

Như bạn có thể thấy, GPT đã đề xuất chọn một bộ lọc kích thước tệp, nhưng chương trình thậm chí còn không có tùy chọn đó. Theo đó, tất cả các bước khác mà nó đề xuất đều đã trở nên vô nghĩa.

Và đây chỉ là ví dụ của chúng tôi, nhưng trong các trường hợp và lĩnh vực khác, nó cũng sẽ như vậy. Vì vậy, nếu bạn muốn biết cách nhận ra điều gì đó được viết bởi AI, hãy kiểm tra các chi tiết. Nếu bạn không muốn ai biết rằng bạn đã sử dụng AI, thì hãy chỉnh sửa mọi thứ thật kỹ lưỡng.
Phương pháp 8: Phát hiện văn bản do AI viết bằng công cụ kiểm tra trực tuyến
Một cách khác để kiểm tra liệu một thứ gì đó có được tạo ra bởi trí tuệ nhân tạo hay không, đơn giản hơn so với việc xác định thủ công, là sử dụng một công cụ kiểm tra trực tuyến chuyên dụng. Những công cụ này được xây dựng dựa trên học máy và các mô hình thống kê, chúng học từ rất nhiều văn bản, bao gồm cả các bài viết của con người lẫn bài viết được tạo ra bởi AI. Chúng sử dụng các thuật toán phức tạp để phát hiện những manh mối cho thấy văn bản đến từ trí tuệ nhân tạo, chẳng hạn như các câu quá giống nhau, lựa chọn từ ngữ phổ biến hoặc các từ nối được lặp lại.
Một hạn chế khác là những bộ phát hiện này thường có thể bị đánh lừa với tương đối ít nỗ lực. Ví dụ, nếu bạn đưa kết quả AI thô qua một công cụ làm cho AI giống người, kết quả có thể vượt qua nhiều trình kiểm tra phổ biến. Một vài chỉnh sửa, thay đổi từ đồng nghĩa, hoặc đơn giản là cấu trúc lại câu cũng đôi khi đủ để làm các thuật toán bối rối.
Để minh họa điều này, chúng tôi đã chạy đoạn văn bản mẫu (ảnh chụp màn hình bên dưới) thông qua ZeroGPT. Kết quả đã làm nổi bật rõ ràng các phần do AI tạo ra. Điều này hỗ trợ cho những gì chúng tôi đã phát hiện thủ công: văn bản thể hiện sự lặp lại, từ chặn, dấu gạch ngang và các mô tả chung chung.

Để thử nghiệm sâu hơn, chúng tôi quyết định tiến hành một thí nghiệm và truyền cùng một đoạn văn bản qua Clever AI Humanizer. Kết quả đã giảm đáng kể từ gần 100% xác suất AI trong ZeroGPT xuống chỉ còn 13%. Chúng tôi nghĩ rằng con số này sẽ còn nhỏ hơn nữa nếu có mẫu văn bản lớn hơn.

Những Suy Nghĩ Cuối Cùng
Vậy là bây giờ bạn đã biết cách kiểm tra xem một thứ gì đó có do AI tạo ra hay không, dù bạn là tác giả hay người kiểm duyệt. Những phương pháp này có đủ không? Hơn cả đủ. Tuy vậy, ngay cả khi sử dụng tất cả các cách này cùng lúc thì bạn cũng sẽ không bao giờ có được sự đảm bảo 100%. Đó là vì cả các trình tạo AI và công cụ phát hiện AI đều liên tục được huấn luyện dựa trên tác phẩm của con người và sau đó tự cải tiến. Chu trình này làm ranh giới trở nên mờ đến mức đôi khi một văn bản hoàn toàn do con người viết cũng có thể bị đánh dấu là do AI tạo ra.
Phương pháp nào là tốt nhất? Thật lòng mà nói, không ai biết chắc. Cách nhanh nhất tất nhiên là sử dụng các công cụ kiểm tra AI trực tuyến, nhưng bạn cần phải tin tưởng vào công cụ đó. Một số trong số chúng không nhất quán đến mức đã đánh dấu hiến pháp là 100% do AI, vì vậy bạn hãy lưu ý điều này. Ngược lại, nếu bạn có kinh nghiệm và con mắt tinh tường, chỉ cần đọc lại văn bản cũng có thể đủ. Khi một tác phẩm không được tác giả trực tiếp viết ra (hoặc ít nhất là chỉnh sửa và được lấy thô từ công cụ tạo nội dung), dấu vết AI thường rất rõ ràng.
Chúng tôi hy vọng điều này đã giúp bạn có cái nhìn rõ ràng hơn về chủ đề này. Nếu bạn là một tác giả, đừng lạm dụng các công cụ AI — chúng không thể thay thế cho phong cách riêng của bạn. Và nếu bạn là một người đánh giá, đừng vội cho rằng một văn bản được tạo ra bởi AI chỉ vì bạn nhìn thấy một từ ‘“ensure”’ hoặc một dấu gạch ngang (—).