Cloudflare, công ty hàng đầu trong lĩnh vực đám mây kết nối, đã chính thức tuyên bố là nhà cung cấp hạ tầng Internet đầu tiên thực hiện việc chặn các trình thu thập dữ liệu AI (AI crawler) truy cập nội dung trang web mà không có sự cho phép hoặc thanh toán. Cùng với động thái này, Cloudflare thiết lập một mô hình mới dựa trên sự đồng ý, mang lại quyền quyết định cho các nhà xuất bản đối với việc sử dụng nội dung của mình.

Trong khi trước đây, nhiều trang web bị trình thu thập dữ liệu AI quét nội dung để huấn luyện mô hình ngôn ngữ, Cloudflare cho biết giờ đây các website sẽ được lựa chọn có cho phép hay không. Nếu không đồng ý, trình thu thập AI sẽ bị tự động chặn truy cập. Các bot AI cũng buộc phải khai báo rõ ràng mục đích thu thập dữ liệu: dùng để huấn luyện, suy luận hay tìm kiếm, từ đó giúc nhà xuất bản quyết định việc cấp quyền.

Cloudflare, công ty hàng đầu trong lĩnh vực đám mây kết nối, đã chính thức tuyên bố là nhà cung cấp hạ tầng Internet đầu tiên thực hiện việc chặn các trình thu thập dữ liệu AI
Cloudflare, công ty hàng đầu trong lĩnh vực đám mây kết nối, đã chính thức tuyên bố là nhà cung cấp hạ tầng Internet đầu tiên thực hiện việc chặn các trình thu thập dữ liệu AI

Matthew Prince, đồng sáng lập và CEO Cloudflare, nhấn mạnh rằng Internet trong kỷ nguyên AI cần được tái thiết kế để đảm bảo sự công bằng cho nhà sáng tạo nội dung. Trong môi trường mà nội dung gốc bị AI sử dụng nhưng không trả lại lưu lượng truy cập hay doanh thu, động lực sáng tạo bị bóp nghẹt. Cloudflare muốn đảm bảo rằng các nhà sáng tạo được quyền quyết định ai được sử dụng nội dung của họ và trong điều kiện nào.

Các nhà xuất bản lớn như Condé Nast, Dotdash Meredith, USA TODAY, Pinterest, Reddit đều hoan nghênh quyết định này, xem đây là bước đi quan trọng nhằm bảo vệ quyền sở hữu trí tuệ, tăng minh bạch trong thu thập dữ liệu, đồng thời tạo ra môi trường AI có trách nhiệm. CEO Reddit nhắc lại tầm quan trọng của việc khai báo danh tính và mục đích của bot, còn Pinterest nhấn mạnh tầm quan trọng của hạ tầng đám mây minh bạch trong kỷ nguyên AI.

Mô hình mới của Cloudflare được xây dựng dựa trên sự đồng ý: trình thu thập AI buộc phải xin phép trước khi truy cập dữ liệu. Các tên miền mới khi đăng ký với Cloudflare sẽ được hỏi rõ có cho phép bot AI truy cập hay không. Cài đặt mặc định sẽ là không cho phép, trừ khi chủ trang thay đổi cấu hình. Các bot AI cũng được khuyến khích tự xác thực danh tính, tuyên bố rõ loại bot, mục đích thu thập và cung cấp thông tin minh bạch đến các website.

Tính đến hiện tại, hàng loạt đối tác lớn đã đồng hành với Cloudflare trong việc triển khai mô hình dựa trên sự đồng ý, trong đó có TIME, Fortune, BuzzFeed, ADWEEK, Quora, Universal Music Group, Stack Overflow, Digital Content Next, The Associated Press, Atlas Obscura... Tất cả đều nhấn mạnh vai trò thiết yếu của việc chia sẻ giá trị hợp lý giữa nhà sáng tạo và các nền tảng AI.

Ngoài việc chặn bot, Cloudflare còn phát triển giao thức mới cho phép bot AI tự nhận diện minh bạch, giúc website dễ dàng phân biệt và quyết định có cho truy cập hay không. Cloudflare đặt tham vọng xây dựng một hệ sinh thái công bằng, nơi mà AI có trách nhiệm và nhà sáng tạo được tôn trọng.

Với vai trò làm hạ tầng cho 20% trang web toàn cầu, Cloudflare đang tỡ ra hướng đi mới về minh bạch, quyền riêng tư và giá trị công bằng trong kỷ nguyên AI. Mô hình dựa trên sự đồng ý của Cloudflare được đánh giá là công cụ hiệu quả, linh hoạt và dễ tiếp cận cho cả nhà xuất bản lẫn doanh nghiệp AI.

Phương Thảo