88Point88Point

【kết quả giai ngoai hang anh】Người dùng cần ngăn chặn ChatGPT đánh cắp nội dung và lưu lượng truy cập

Cách ChatGPT lấy dữ liệu đào tạo

TheườidùngcầnngănchặnChatGPTđánhcắpnộidungvàlưulượngtruycậkết quả giai ngoai hang anho một nghiên cứu của OpenAI đã công bố, ChatGPT3 đã được đào tạo trên một số bộ dữ liệu như: Common Crawl, WebText2, Book1 và Book2 hay Wikipedia. Lượng dữ liệu đào tạo lớn nhất đến từ Common Crawl, cung cấp quyền truy cập vào thông tin web thông qua kho lưu trữ thu thập dữ liệu web mở. Bot Common Crawl, còn được gọi là CCBot, tận dụng Apache Nutch để cho phép các nhà phát triển xây dựng các trình thu thập thông tin quy mô lớn.

Phiên bản mới nhất của CCBot thu thập dữ liệu từ Amazon AWS và tự nhận dạng nó bằng User agent “CCBot/2.0”. Các doanh nghiệp nếu muốn cho phép sử dụng CCBot không nên chỉ dựa vào User agent để nhận dạng nó, bởi vì nhiều bot xấu giả mạo User agent của họ để ngụy trang thành bot tốt và tránh bị chặn. Để cho phép sử dụng CCBot trên trang web của mình, người dùng cần sử dụng các thuộc tính như dải IP hoặc DNS Reverse. Để chặn ChatGPT, tối thiểu trang web của người dùng phải chặn lưu lượng truy cập từ CCBot.

Áp dụng bảo mật cho các ứng dụng AI

Netskope Threat Labs – Công ty Phần mềm chuyên cung cấp nền tảng bảo mật máy tính tại Mỹ chia sẻ, hiện đang theo dõi các proxy ChatGPT với hơn 1.000 URL và các tên miền độc hại từ những kẻ tấn công đang tìm cách lợi dụng AI, bao gồm nhiều chiến dịch lừa đảo, các chiến dịch phát tán phần mềm độc hại cũng như các trang web spam và lừa đảo. Chặn quyền truy cập vào nội dung liên quan đến AI và các ứng dụng AI là một giải pháp ngắn hạn để giảm thiểu rủi ro nhưng phải đạt được những lợi ích tiềm năng mà các ứng dụng AI mang lại để bổ sung cho sự đổi mới của công ty và năng suất lao động.

ChatGPT3 đã được đào tạo trên một số bộ dữ liệu như: Common Crawl, WebText2, Book1 và Book2 hay Wikipedia. Ảnh minh họa

赞(7)
未经允许不得转载:>88Point » 【kết quả giai ngoai hang anh】Người dùng cần ngăn chặn ChatGPT đánh cắp nội dung và lưu lượng truy cập