Cập nhật vào 23/02
Gần đây, Matt Cutts, người đứng đầu nhóm tìm kiếm spam của Google, đã trả lời một câu hỏi liên quan đến các mã trạng thái (status codes) trên website thông qua video trợ giúp mới nhất của mình khi người dùng đưa ra câu hỏi:
Google có thực hiện bất cứ điều gì khác biệt khi phải đối mặt với tình trạng lỗi 404 và 410 trên website hay không?
Trước hết, Matt giải thích lỗi 404 là gì và 410 là gì. Đây là những mã trạng thái HTTP; bất cứ khi nào trình duyệt hoặc Googlebot yêu cầu một trang web, website sẽ hồi đáp bằng cách gửi lại một mã trạng thái tương ứng.
Ví dụ, mã trạng thái 200 có nghĩa là mọi thứ đều tốt, trong khi đó mã trạng thái 404 lại mang ý nghĩa trang web được yêu cầu không tìm thấy. Mã 410 có nghĩa là trang web đã biến mất hoàn toàn.
Matt nói rằng Google đối xử với mã 404 và 410 có đôi chút khác biệt, nhưng hầu như bạn không cần phải lo lắng về vấn đề này.
Matt tiếp tục giải thích vấn đề các loại mã trạng thái này được đối xử như thế nào khi chúng được Googlebot thu thập. Nếu Google thu thập một trang web và thấy báo lỗi 404, nó sẽ bảo vệ trang trong 24 giờ trong hệ thống thu thập dữ liệu đề phòng trường hợp lỗi 404 xảy ra do nguyên nhân vô tình, không phải do chủ ý.
Nếu Google gặp mã trạng thái 410 khi đang thu thập nội dung trên trang, nó sẽ cho rằng mã trạng thái này là do có chủ ý vì webmaster đã thực hiện và nhập mã 410 bằng phương pháp thủ công để chỉ ra trang web không còn tồn tại. Thay vì bảo vệ trang bằng mã 410, nó lại được coi như một sai sót.
Matt cho biết Google vẫn có thể quay trở lại trang web đã thực sự không còn tồn tại, nhưng trong hầu hết các trường hợp, nếu bạn biết trang web đó đã biến mất hoàn toàn, sử dụng mã 410 là hành động hợp lý. Nếu một trang web đã biến mất, nhưng nó có thể xuất hiện trở lại, lúc này chúng ta sẽ sử dụng mã 404.
Trên đây là những khác biệt cơ bản giữa 2 mã trạng thái 404 và 410. Matt liên tục nhấn mạnh người dùng không cần phải quá lo lắng về vấn đề này.