OpenAI và Microsoft bị cáo buộc đánh cắp dữ liệu để huấn luyện ChatGPT trong vụ kiện tập thể mới
Vụ kiện cáo buộc rằng lợi nhuận của OpenAI là kết quả của việc sử dụng dữ liệu được thu thập bất hợp pháp để đào tạo các mô hình của nó.
OpenAI và Microsoft đã được chỉ định là bị cáo trong một vụ kiện tập thể khác về việc họ bị cáo buộc sử dụng kỹ thuật quét web để lấy dữ liệu được cho là riêng tư nhằm mục đích đào tạo ChatGPT và các mô hình trí tuệ nhân tạo (AI) liên quan khác.
Vụ kiện tập thể gần đây nhất được đệ trình vào ngày 5 tháng 9 tại San Francisco bởi một công ty luật đại diện cho một cặp kỹ sư giấu tên.
Theo hồ sơ đăng ký với Tòa án Quận Hoa Kỳ cho Quận Bắc California:
“Vụ kiện tập thể này phát sinh từ hành vi bất hợp pháp và có hại của Bị cáo trong việc phát triển, tiếp thị và vận hành các sản phẩm AI của họ, bao gồm ChatGPT-3.5, ChatGPT-4.0, Dall-E và Vall-E (“Sản phẩm”), sử dụng thông tin cá nhân bị đánh cắp, bao gồm cả thông tin nhận dạng cá nhân, từ hàng trăm triệu người dùng internet, bao gồm cả trẻ em ở mọi lứa tuổi mà không có sự đồng ý hoặc hiểu biết của họ.”
Vụ kiện tiếp tục phàn nàn rằng OpenAI “đã tăng cường chiến lược bí mật thu thập lượng lớn dữ liệu cá nhân từ Internet” sau khi tái cơ cấu vào năm 2019.
Nguyên đơn viết: “Nếu không có hành vi trộm cắp thông tin cá nhân và có bản quyền chưa từng có này thuộc về người thật,” các nguyên đơn viết, “các sản phẩm,” đề cập đến các mô hình khác của ChatGPT, DALL-E và OpenAI, “sẽ không phải là ngành kinh doanh trị giá hàng tỷ đô la”. Hôm nay.”
Theo hồ sơ, các nguyên đơn đang yêu cầu tòa án bồi thường thiệt hại cho nguyên đơn và bất kỳ thành viên nào của các nhóm được đề xuất – có thể hình dung bao gồm bất kỳ ai có thông tin được cho là đã bị thu thập.
Vụ kiện cũng yêu cầu tòa án ra lệnh cho các bị cáo tiến hành “phân chia không theo quy định” số lợi nhuận kiếm được do bị cáo buộc thu thập dữ liệu bất hợp pháp.
Quét là phương pháp sử dụng bot tự động, thường được gọi là “trình thu thập dữ liệu” để thu thập dữ liệu từ internet. Vụ kiện gần đây nhất này cáo buộc rằng OpenAI và Microsoft cố tình tham gia vào hoạt động quét “bất hợp pháp”.
Một vụ kiện tập thể trước đó đưa ra các tuyên bố gần như giống hệt nhau chống lại OpenAI và Microsoft đã được đệ trình tại cùng một khu tòa án vào ngày 28 tháng 6. Hiện tại vẫn chưa rõ liệu tòa án hoặc các bị cáo trong các vụ kiện riêng biệt có xem xét việc kết hợp các vụ kiện hay không.
Đây không phải là lần đầu tiên Microsoft dính vào một vụ kiện về cáo buộc thu thập dữ liệu. Công ty Redmond, Washington đã ban hành lệnh ngừng thay mặt cho thương hiệu LinkedIn của mình cho công ty phân tích dữ liệu HiQ vào năm 2019 về các hoạt động thu thập dữ liệu được thừa nhận.
Trong trường hợp đó, Microsoft và LinkedIn cáo buộc HiQ đã vi phạm các điều khoản của thỏa thuận dịch vụ cần thiết để đăng nhập vào trang web LinkedIn và do đó có quyền truy cập vào dữ liệu người dùng. Ban đầu, tòa án lưu động ra phán quyết có lợi cho HiQ, nhưng sau khi Microsoft kháng cáo, Tòa án tối cao đã hủy bỏ phán quyết.
Vụ việc sau đó được đưa trở lại tòa án lưu động, nơi Microsoft nhận thấy mình đang ở bên thắng kiện. HiQ đã đồng ý dàn xếp với Microsoft với số tiền không được tiết lộ và được lệnh ngừng các hoạt động thu thập dữ liệu của mình.
Microsoft và OpenAI đã không trả lời ngay lập tức các yêu cầu bình luận.