Theịcáobuộcđánhcắpdữliệungườidùngđểhuấnluyệncáccôngcụkq cruz azulo nội nội dung đơn kiện kéo dài 157 trang gửi lên tòa án liên bang ở quận phía bắc California hôm 28/6, Công ty Clarkson tại bang California, Mỹ đã đại diện tập thể cáo buộc OpenAI vi phạm các luật về bản quyền và quyền riêng tư bằng cách thu thập bí mật 300 tỉ từ trên internet, bao gồm "sách, bài viết, trang web, bài đăng, thông tin cá nhân mà không có sự cho phép", để huấn luyện mô hình ngôn ngữ lớn của mình. Vụ kiện cũng nhằm mục đích 'kiểm tra lý thuyết' pháp lý mới bằng việc đề cập tới vấn đề OpenAI đã vi phạm quyền của hàng triệu người dùng internet khi sử dụng các bình luận trên mạng xã hội, bài đăng trên blog, bài viết trên Wikipedia và công thức nấu ăn gia đình của họ... Vụ kiện cũng tập trung khai thác vấn đề chưa được giải quyết liên quan đến sự gia tăng các công cụ generative AI như chatbot và trình tạo hình ảnh. Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu hoặc học máy trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn nhờ vào việc học tập từ những dữ liệu đã có sẵn trước đó. Trước đó, Công ty luật Clarkson cũng từng thực hiện một số vụ kiện tập thể quy mô lớn liên quan tới các vấn đề từ vi phạm dữ liệu đến quảng cáo sai sự thật. Do đó, Clarkson muốn đại diện cho “những người thực sự có thông tin bị đánh cắp và sử dụng sai mục đích thương mại để tạo ra công nghệ rất mạnh mẽ này”, theo Ryan Clarkson - thành viên quản lý của công ty luật. Công ty mẹ của ứng dụng chatbot ChatGPT bị cáo buộc thu thập và sử dụng trái phép dữ liệu cá nhân của hàng triệu người từ internet. Ảnh minh họa |