Nếu website của bạn đang gặp vấn đề về nội dung trùng lặp ngắn hạn, làm cách nào bạn có thể tránh bộ lọc nội dung của Google phát hiện? Đây chính là chủ đề của video hướng dẫn Webmaster gần đây nhất được Matt Cutts đề cập đến.
Video này không tập trung vào những nội dung trùng lặp quan trọng thông thường như khi ai đó ăn cắp nội dung trên toàn bộ website, hay bài viết của các nhà xuất bản tồn tại trên hàng trăm website khác. Loại nội dung trùng lặp được thảo luận trong video này thuộc trường hợp lý do chính đáng khi nội dung giống hệt hoặc tương tự với nội dung đã xuất hiện trên một trang khác của cùng website.
Matt Cutts đã phát biểu như sau: “Giả sử bạn là một nhà xuất bản mới có uy tín, chuyên sử dụng kỹ thuật white-hat, tuy nhiên trên website của bạn lại tồn tại nội dung trùng lặp ngắn hạn mà bản thân bạn không thực sự mong muốn, đó có thể thuộc dạng thông tin nóng hổi cần chia sẻ. Vậy thì hãy sử dụng thẻ rel=canonical bởi vì dù bạn có nhiều bản sao của cùng một câu chuyện ngắn gọn, PageRank của website vẫn sẽ bị chia đều cho các nội dung trùng lặp đó. Nếu tất cả đều thuộc cùng một chủ đề, hoặc tất cả nội dung đều cùng đề cập đến một sự việc y hệt nhau, rất giống với nội dung trùng lặp, lúc này hãy sử dụng thẻ rel=canonical để hướng công cụ tìm kiếm về URL chính.”
Sử dụng thẻ rel=canonical trong trường hợp này sẽ giúp người dùng có thể đọc được những câu chuyện riêng lẻ với nội dung gần tương tự nhau nhưng vẫn chứa yếu tố mới mẻ và được cập nhật nhiều lần trên ngày do hiện nay ngày càng nhiều các tin tức nóng hổi được nhà xuất bản public đến với đông đảo bạn đọc.
Trong tương lai khi ai đó tìm kiếm nội dung này, bạn mong muốn họ có thể tìm thấy một trang web cung cấp thông tin tổng quan tốt nhất về toàn bộ câu chuyện đó, thay vì chỉ là những liên kết đến hàng tá các trang web khác có nội dung tương tự. Trong trường hợp này, hãy đảm bảo thẻ rel=canonical trên website sẽ hướng công cụ tìm kiếm đến trang web phù hợp nhất.
Ngoài ra, Matt Cutts cũng gợi ý sử dụng thẻ này không chỉ trong các trường hợp về nội dung trùng lặp mà ta còn có thể sử dụng khi nội dung gần tương tự nhau, thậm chí cả khi nội dung không hề giống hệt nhau. Điều này có chút thay đổi so với nội dung trùng lặp nhưng lại được xem như giống hệt trên tổng thể bài viết hoặc trên các mục, các đoạn của một trang web.
Vì vậy nếu bạn lo lắng về vấn đề nội dung trùng lặp, hãy sử dụng thẻ rel=canonical, chúng sẽ giúp website của bạn tránh được những hình phạt không đáng có của Google. Độc giả có thể xem thêm bài viết lời khuyên của Matt cutts về việc sử dụng tên thật khi đưa ra bình luận trên Blog có tác dụng như thế nào trong SEO đối với gã khổng lồ Google.
Video Marr Cutts nói về điều này.
_