OpenAI đóng cửa máy dò AI do độ chính xác thấp
OpenAI đã lặng lẽ rút phích cắm trên Trình phân loại AI của mình, nhằm mục đích giúp giáo viên, giáo sư và những người khác phân biệt giữa văn bản do con người viết và AI viết
Cường quốc trí tuệ nhân tạo OpenAI đã kín đáo rút chốt trên phần mềm phát hiện AI của mình, với lý do tỷ lệ chính xác thấp.
Trình phân loại AI do OpenAI phát triển được ra mắt lần đầu tiên vào ngày 31 tháng 1 và nhằm mục đích hỗ trợ người dùng, chẳng hạn như giáo viên và giáo sư, trong việc phân biệt văn bản do con người viết với văn bản do AI tạo ra.
Tuy nhiên, theo bài đăng trên blog ban đầu thông báo ra mắt công cụ, bộ phân loại AI đã ngừng hoạt động kể từ ngày 20 tháng 7:
“Kể từ ngày 20 tháng 7 năm 2023, bộ phân loại AI không còn khả dụng do tỷ lệ chính xác thấp.”
Liên kết đến công cụ không còn hoạt động, trong khi ghi chú chỉ đưa ra lý do đơn giản về lý do tại sao công cụ bị tắt. Tuy nhiên, công ty giải thích rằng họ đang xem xét các cách mới, hiệu quả hơn để xác định nội dung do AI tạo ra.
“Chúng tôi đang làm việc để kết hợp phản hồi và hiện đang nghiên cứu các kỹ thuật xuất xứ hiệu quả hơn cho văn bản, đồng thời cam kết phát triển và triển khai các cơ chế cho phép người dùng hiểu liệu nội dung âm thanh hoặc hình ảnh có phải do AI tạo ra hay không,” ghi chú viết.
Ngay từ đầu, OpenAI đã nói rõ rằng công cụ phát hiện dễ bị lỗi và không thể được coi là “hoàn toàn đáng tin cậy”.
Công ty cho biết những hạn chế của công cụ phát hiện AI của họ bao gồm “rất không chính xác” khi xác minh văn bản có ít hơn 1.000 ký tự và có thể “tự tin” gắn nhãn văn bản do con người viết là do AI tạo ra.
Bộ phân loại là sản phẩm mới nhất của OpenAI được xem xét kỹ lưỡng.
Vào ngày 18 tháng 7, các nhà nghiên cứu từ Stanford và UC Berkeley đã công bố một nghiên cứu chỉ ra rằng sản phẩm chủ lực của OpenAI là ChatGPT đang trở nên tồi tệ hơn đáng kể theo tuổi tác .
We evaluated #ChatGPT's behavior over time and found substantial diffs in its responses to the *same questions* between the June version of GPT4 and GPT3.5 and the March versions. The newer versions got worse on some tasks. w/ Lingjiao Chen @matei_zaharia https://t.co/TGeN4T18Fd https://t.co/36mjnejERy pic.twitter.com/FEiqrUVbg6
— James Zou (@james_y_zou) July 19, 2023
Các nhà nghiên cứu nhận thấy rằng trong vài tháng qua, khả năng xác định chính xác các số nguyên tố của ChatGPT-4 đã giảm mạnh từ 97,6% xuống chỉ còn 2,4%. Ngoài ra, cả ChatGPT-3.5 và ChatGPT-4 đều chứng kiến sự sụt giảm đáng kể về khả năng tạo các dòng mã mới.