Hàng trăm ngàn bài báo khoa học bị phát hiện do AI viết

Một nghiên cứu mới công bố đã khiến giới học thuật chấn động khi tiết lộ rằng có thể đã có tới hàng trăm ngàn bài báo khoa học được viết toàn bộ hoặc một phần bằng AI.

bài báo khoa học - Ảnh 1.

Hàng trăm nghìn bài báo khoa học mỗi năm bị phát hiện có sử dụng AI, dù là trong một phần hay toàn bộ nghiên cứu - Ảnh: NREL

Nghiên cứu được thực hiện bởi các nhà nghiên cứu từ Đại học Tübingen (Đức) và công bố trên tạp chí Science Advances đã xác định có khoảng 454 từ ngữ thường được các mô hình ngôn ngữ lớn (LLM) như ChatGPT sử dụng, chẳng hạn như "garnered" (thu được), "encompassing" (bao trùm), "burgeoning" (nở rộ)…

Khi áp dụng phân tích này vào cơ sở dữ liệu PubMed - nơi lưu trữ khoảng 1,5 triệu bài báo khoa học mỗi năm - họ ước tính có từ 13,5% đến 40% phần tóm tắt (abstract) của các bài viết có khả năng do trí tuệ nhân tạo (AI) tạo ra.

Con số này tương đương ít nhất 200.000 bài viết mỗi năm có dấu vết của AI, theo báo New York Times. Tờ báo cũng lưu ý đây có thể là một ước tính sơ bộ, chưa kể đến các trường hợp người viết đã chỉnh sửa để che giấu nguồn gốc AI.

Trong khi một số tác giả cố gắng che đậy việc mình sử dụng AI, thì một số khác lại chẳng mấy bận tâm điều này.

Nhà khoa học máy tính Subbarao Kambhampati từ Đại học Bang Arizona đã chia sẻ trên mạng xã hội X một bài báo kém chất lượng trong ngành chẩn đoán hình ảnh (radiology), trong đó các "tác giả" để nguyên phần thú nhận rằng bài viết được chatbot tạo ra.

"Tôi rất xin lỗi, nhưng tôi không có quyền truy cập thông tin theo thời gian thực hay dữ liệu bệnh nhân cụ thể vì tôi là một mô hình ngôn ngữ AI", trích dẫn trong bài viết nêu rõ.

Các lỗi tinh vi hơn - như cụm từ "regenerate response" (được ChatGPT sử dụng khi tạo lại câu trả lời) - cũng đã len lỏi vào nhiều tạp chí uy tín. Một số bài thậm chí chứa các tài liệu tham khảo hoàn toàn bịa đặt hoặc hình ảnh vô lý do AI tạo ra.

Trước thực trạng này, nhiều nhà nghiên cứu đang điều chỉnh cách viết để tránh bị nghi ngờ dùng AI, chẳng hạn như loại bỏ những từ ngữ dễ bị gắn mác "AI viết". Khi việc che giấu này trở nên tinh vi hơn, hệ lụy để lại sẽ là vô cùng to lớn.

Theo nhóm nghiên cứu, nếu tình trạng này tiếp diễn mà không được kiểm soát, nó có thể gây ra "tác động chưa từng có tiền lệ đến việc viết lách khoa học trong lĩnh vực nghiên cứu y sinh, thậm chí còn vượt qua cả ảnh hưởng của đại dịch COVID-19".

"Tôi nghĩ rằng đối với việc quan trọng như viết phần tóm tắt của nghiên cứu, bạn không nên để AI làm thay mình", đồng tác giả bài nghiên cứu trên tạp chí Science Advances Dmitry Kobak nhận định.

Hàng trăm nghìn bài báo khoa học bị phát hiện do AI viết - Ảnh 3.Vì sao những video chó mèo tạo bằng AI thu hút cả trăm triệu view?

Những video chó mèo được AI nhân hóa theo mô típ ngôn tình và kịch tính đang gây sốt trên mạng xã hội Trung Quốc, có video đạt gần 150 triệu lượt xem.

Trở thành người đầu tiên tặng sao cho bài viết 0 0 0

Tuổi Trẻ Online Newsletters

Đăng ký ngay để nhận gói tin tức mới

Tuổi Trẻ Online sẽ gởi đến bạn những tin tức nổi bật nhất

Bình luận (0)
thông tin tài khoản
Được quan tâm nhất Mới nhất Tặng sao cho thành viên