CloudFlare Google vừa công bố báo cáo thường niên lần thứ sáu, cung cấp cái nhìn chi tiết về tình trạng internet, an ninh mạng và thế giới trí tuệ nhân tạo (AI) đang bùng nổ. Báo cáo nêu bật sự chênh lệch lớn trong hoạt động thu thập dữ liệu web. Theo dữ liệu, Googlebot đã thu thập dữ liệu nhiều trang web hơn đáng kể so với các đối thủ AI khác. Cụ thể, bot của Google đã truy cập nhiều trang hơn PerplexityBot tới 200 lần.
Toàn diện này Đánh giá Cloudflare Dữ liệu được thu thập từ một mạng lưới khổng lồ trải rộng trên hơn 330 thành phố tại 125 quốc gia. Kết quả cho thấy Googlebot đã tiếp cận được 11.6% các trang web độc nhất vào cuối năm 2025. Để so sánh, GPTBot của OpenAI Googlebot chỉ đạt được 3.6%, trong khi PerplexityBot chỉ thu thập được 0.06%. Báo cáo cho thấy sự thống trị này tồn tại là do Google sử dụng phương pháp hai mục đích. Googlebot thu thập dữ liệu cho cả việc lập chỉ mục công cụ tìm kiếm và huấn luyện mô hình AI. Do đó, các nhà xuất bản web không thể chặn quá trình huấn luyện AI của Google mà không đồng thời xóa trang web của họ khỏi hệ thống. Kết quả tìm kiếm của Google.
Đánh giá Cloudflare: Những phát hiện chính từ báo cáo năm 2025

Ngoài việc thu thập dữ liệu bằng AI, báo cáo còn cung cấp các dữ liệu thiết yếu liên quan đến kết nối toàn cầu và các mối đe dọa an ninh. Dưới đây là những điểm nổi bật cụ thể:
- Tăng trưởng lưu lượng truy cập: Lưu lượng truy cập Internet toàn cầu tăng 19% so với cùng kỳ năm ngoái, với sự tăng tốc đáng kể sau giữa tháng 8.
- Ca trực an ninh: Lần đầu tiên, các tổ chức xã hội dân sự và phi lợi nhuận trở thành đối tượng bị tấn công nhiều nhất, chiếm 23.2% tổng số vụ tấn công tính đến tháng 7.
- Các xu hướng bị chặn: Các nhà xuất bản thường chặn các bot chuyên dụng về trí tuệ nhân tạo như GPTBot thông qua các tệp robots.txt, trong khi Googlebot và Bingbot chủ yếu phải chịu các hạn chế một phần để bảo vệ các trang đăng nhập.
- Tỷ lệ thu thập dữ liệu so với số lượt tham chiếu: Anthropic cho thấy tỷ lệ thu thập dữ liệu so với số lượng người dùng quay lại trang web nguồn cao nhất, nghĩa là nó quét nội dung rất nhiều nhưng chỉ gửi rất ít người dùng quay lại các trang web nguồn.
- Thu thập dữ liệu hành động người dùng: Các bot hoạt động thay mặt người dùng (như ChatGPT trả lời một câu hỏi cụ thể) đã tăng hơn 15 lần trong suốt năm qua.
Bạn có thể đọc: Thống kê Podcast: Tăng trưởng thị trường, xu hướng và chiến lược thành công
Báo cáo cũng ghi nhận sự thay đổi trong cơ cấu lưu lượng truy cập. Mặc dù lưu lượng truy cập do con người tạo ra vẫn chiếm ưu thế, nhưng lưu lượng truy cập từ các bot không phải AI cũng bám sát phía sau. Đến tháng 12, con người tạo ra 47% yêu cầu so với 44% từ bot. Khi các công cụ AI tiếp tục phát triển, điều này Đánh giá Cloudflare Đây là cơ sở dữ liệu quan trọng để hiểu cách các tác nhân tự động này tương tác với mạng internet mở.
Đọc thêm tin tức: Quan hệ đối tác AI giữa các nhà xuất bản: Google tăng cường mối quan hệ.
Các tác nhân AI đang thay đổi SEO: Marie Haynes kêu gọi hành động