Sarah Silverman kiện Meta và OpenAI vì vi phạm bản quyền
Tác giả Sarah Silverman và hai người khác đã khởi kiện OpenAI và Meta vì đã sử dụng tác phẩm có bản quyền để đào tạo hệ thống AI của họ mà không được phép.
Diễn viên hài và tác giả người Mỹ Sarah Silverman, cùng với hai tác giả khác, Richard Kadrey và Christopher Golden, đã đệ đơn kiện LLaMa của Meta Platforms và ChatGPT của OpenAI về vi phạm bản quyền.
Meta và OpenAI bị cáo buộc đã sử dụng nội dung của nguyên đơn để đào tạo hệ thống trí tuệ nhân tạo (AI) tương ứng của họ mà không được phép trước.
Theo các tài liệu tòa án chống lại Meta, nhiều cuốn sách có bản quyền của nguyên đơn xuất hiện trong tập dữ liệu mà “Meta đã thừa nhận sử dụng để đào tạo LLaMA.”
Tương tự, trong trường hợp chống lại OpenAI, vụ kiện cáo buộc rằng khi ChatGPT tạo ra các bản tóm tắt về công việc của nguyên đơn, nó chỉ ra việc đào tạo thông qua nội dung có bản quyền.
“Các bản tóm tắt có một số chi tiết sai. Điều này được mong đợi vì một mô hình ngôn ngữ lớn trộn lẫn các tài liệu biểu cảm có nguồn gốc từ nhiều nguồn. Tuy nhiên, phần còn lại của bản tóm tắt là chính xác…”
Để có được dữ liệu này, các vụ kiện tuyên bố rằng các công ty đã lấy dữ liệu có bản quyền từ cái được gọi là “thư viện bóng tối”, chẳng hạn như Bibliotik, Library Genesis, Z-Library và những người khác.
Đơn kiện cho biết những thư viện bóng tối này là những trang web sử dụng hệ thống torrent để cung cấp sách “với số lượng lớn”. Các trang web như vậy là bất hợp pháp và không giống như dữ liệu nguồn mở đến từ các cơ sở dữ liệu như Gutenberg, nơi thu thập những cuốn sách đã hết bản quyền.
“Những thư viện bóng tối này từ lâu đã được cộng đồng đào tạo AI quan tâm vì số lượng lớn tài liệu có bản quyền mà chúng lưu trữ.”
Cùng với các khiếu nại về vi phạm bản quyền đối với tác phẩm cá nhân của họ, các tác giả đã gửi khiếu nại thay mặt cho một nhóm chủ sở hữu bản quyền trên khắp Hoa Kỳ có tác phẩm cũng bị cáo buộc vi phạm.
Vào tháng 5, các nhà văn trên khắp Hoa Kỳ là thành viên của Hiệp hội Nhà văn Hoa Kỳ đã xuống đường trong một cuộc đình công được phép — cuộc đình công đầu tiên sau 15 năm — nêu bật nhiều vấn đề mà ngành phải đối mặt, bao gồm cả việc sử dụng AI.