SEO audit - Phát hiện : 4 vấn đề kỹ thuật tiềm ẩn phát đi tín hiệu nguy hiểm đến công cụ tìm kiếm

Đăng ngày: 03 Tháng 9 2013
Đánh giá bài này
(1 Bình chọn)

Tôi đã thực hiện khá nhiều công đoạn SEO audit trên quy mô lớn, chúng thường ẩn chứa rất nhiều các vấn đề SEO. Trên các website có hàng triệu trang được đánh chỉ mục, đôi khi các vấn đề kỹ thuật có thể mang đến những kết quả thảm khốc

Thậm chí nếu một vấn đề thực sự là kết quả của một sai sót, tín hiệu SEO nguy hiểm có thể được gửi đến hàng loạt các công cụ. Và không có gì tồi tệ hơn khi bạn nhận ra mình đang vi phạm các nguyên tắc quản trị website, mặc dù bạn không hề muốn vi phạm chúng.

Để chiến lược seo của quý khách hiệu quả,quý khách nên sử dụng dịch vụ seo audit của LMT

Sau đây là một số ví dụ để giúp bạn hiểu rõ hơn làm thế nào các vấn đề kỹ thuật lại có thể gửi các tín hiệu khủng khiếp đến các công cụ tìm kiếm. Và có thể có một số bạn sau khi đọc bài viết này cũng sẽ tìm thấy những vấn đề tiềm ẩn tương tự trên website của mình. Nếu có trường hợp đó, thì có thể bài viết này sẽ giúp bạn xác định được nguyên nhân để bạn có thể tự sửa chữa chúng.

Hãy nhớ rằng, Google và Bing không thể xác định được bạn có phải là người tạo ra các vấn đề đó hay không, hay nó chỉ là một sai sót. Do đó, các phân nhánh có thể chỉ nghiêm trọng, ngay cả khi bạn không định cấu trúc website theo cách hiện tại.

1. Bạn giỏi sử dụng kỹ thuật che đậy

Khi thực hiện công việc này, tôi sử dụng một số công cụ để thu thập dữ liệu website. Khi phân tích những dữ liệu này, tôi luôn luôn kiểm tra các trang có nhiều liên kết. Bạn sẽ phải ngạc nhiên về những gì bạn có thể tìm thấy.

Đôi khi các phân tích của tôi cho thấy một lượng lớn các liên kết anchor text (ký tự liên kết) khớp hoàn toàn từ những trang nhất định hoặc từ các mục không dễ dàng nhìn thấy trên trang. Tệ hơn, nó hiện thị toàn bộ trên trang web (trong mã, nhưng không hiển thị cho người dùng).

Nếu trang web cung cấp cho công cụ tìm kiếm một bộ các liên kết anchor text khớp lệnh hoàn toàn, nhưng không cung cấp nội dung cho người dùng, nó có nghĩa là trang web đó đang sử dụng kỹ thuật che đậy (cung cấp những nội dung khác nhau cho công cụ tìm kiếm và cho người sử dụng). Và hành vi che đậy đó vi phạm nguyên tắc quản trị website của Google.

Hiện tại, nó chỉ là một vấn đề nhỏ nếu công ty biết webstie đang trong tình trạng này, nhưng tôi đã gặp rất nhiều các tình huống mà các nhóm tôi giúp không biết họ đang sử dụng kỹ thuật che đậy. Trong những tình huống đó, các vấn đề kỹ thuật là nguyên nhân gây ra tình trạng che đậy tiềm ẩn.

Khi tiết lộ vấn đề này với các nhà phát triển web, thông thường không lâu sau đó họ sẽ theo dõi quá trình mã hóa – nguyên nhân gây ra tình trạng ẩn nội dung với người sử dụng. Họ chỉ đơn giản là không biết điều này đã xảy ra trên các trang, trong các mục nhất định.

Ví dụ, trong một cuộc kiểm tra gần đây, tôi nhận thấy hầu hết các mục của thanh subnavigation không hoạt động khi rê chuột lên danh mục cấp cao của nó. Thanh navigation chính đúng ra phải tạo một trình đơn thứ cấp với các liên kết đến các phần cụ thể của trang web (sử dụng nhiều các anchor text). Thay vào đó, không có gì xảy ra khi bạn di chuyển chuột trên menu. Do đó, trang web đã cung cấp một số lượng tương đối lớn các liên kết rich anchor text cho công cụ tìm kiếm, nhưng người dùng không bao giờ nhìn thấy nội dung đó. Và điều này đã xảy ra ở trên 10.000 trang web.

Một ví dụ khác mà tôi đã tình cờ phát hiện ra đó là thanh điều hướng của website (breadcrumb trail) bị lỗi, nó không hiển thị rõ ràng, nhưng vẫn nằm trong dãy mã. Vì vậy, trên 2 triệu trang trên website có liên kết anchor text trong mã phù hợp hoàn toàn cho các công cụ thu thập, nhưng người sử dụng không thể nhìn thấy hoặc truy cập được vào các trang đó. Chủ sở hữu trang web không cố gắng sử dụng kỹ thuật che đậy mà nó do các vấn đề kỹ thuật gây ra.

Và sau đó là do lỗi của con người. Tôi đã từng kiểm tra một website có toàn bộ thanh chuyển hướng navigation trong mã, nhưng người sử dụng không thể truy cập nội dung. Sau khi hỏi khách hàng về những lỗi tôi đã tìm thấy, họ tiết lộ rằng họ đã quyết định để ẩn nội dung cho mục đích khả dụng của website. Họ chỉ đơn giản là không biết giấu nội dung trong khi vẫn hiển thị nó trên công cụ tìm kiếm là một hành động xấu.

Như những gì ví dụ đã minh họa, sử dụng kỹ thuật bán che đậy có thể do nhiều lý do.

Khuyến nghị: Giám sát website của bạn thường xuyên, hoặc nhờ các nhà làm SEO giúp bạn thực hiện. Kiểm tra thông qua phân tích thủ công và thu thập dữ liệu cần được tiến hành đều đặn. Ngoài ra, kiểm tra toàn diện những thay đổi trước khi đăng lên website là việc làm cực kỳ quan trọng. Điều đó có thể giúp bạn tìm ra các vấn đề kỹ thuật trên một website (và tìm ra lỗi của con người). Đừng sử dụng kỹ thuật che đậy chỉ vì do so sai sót. Điều này dễ thực hiện hơn so với những gi bạn nghĩ.

2. Điều chỉnh dòng mã rel=canonical trở thành rel=catastrophical (rel=thảm khốc)

Rel=canonical là một dòng mã đơn giản, nhưng có thể tạo ra tác động mạnh khá tiêu cực khi không được xử lý chính xác, đặc biệt đối với các website quy mô lớn có hàng trăm ngàn hoặc hàng triệu trang được lập chỉ mục. Cung cấp chiến lược rel = canonical sai có thể gửi các tín hiệu xấu đến tất cả công cụ tìm kiếm, và điều này có thể phá hủy thứ hạng cũng như lưu lượng tìm kiếm tự nhiên.

Rel=canonical được sử dụng trên các trang bản sao (có chứa nội dung gần hoặc tương tự với một trang khác), trang bản sao này có thể giúp các công cụ củng cố thuộc tính lập chỉ mục đến URL chính xác (URL tiêu chuẩn). Trong quá trình kiểm tra, tôi đã nhìn thấy thẻ URL tiêu chuẩn bị sai rất nhiều lần đến nỗi tôi thậm chí không nhớ con số chính xác là bao nhiêu. Và trong tổng hợp, chiến lược rel=canonical yếu kém có thể bắn hàng triệu tín hiệu SEO xấu đến các công cụ tìm kiếm và có thể ảnh hưởng nghiêm trọng đến thứ hạng tìm kiếm và lưu lượng truy cập.

Tôi đã từng kiểm tra một website lớn (với 10 triệu trang được lập chỉ mục) đã thực hiện rel=canonical không chính xác trong quá trình làm mới website. Tất cả các trang sản phẩm đột nhiên chỉ bao gồm rel=canonical trong kết quả tìm kiếm nội bộ. Sau đó các trang kết quả tìm kiếm nội bộ cũng chứa thẻ robot meta sử dụng thẻ meta ngăn lập chỉ mục (noindex), và thẻ nofollow. Không cần phải nói, việc này đã gây ra các vấn đề SEO toàn diện cho website. Lưu lượng truy cập từ tìm kiếm hữu cơ giảm mạnh gần như ngay lập tức.

Sau khi tìm ra vấn đề và thực hiện sửa chữa, lưu lượng truy cập bắt đầu hồi phục tương đối nhanh chóng. Đó là một ví dụ tuyệt vời về cách một dòng mã có thể phá hủy SEO.

Khuyến nghị: Nếu bạn không chắc chắn làm thế nào để thực hiện rel=canonical một cách tốt nhất thì bạn đường làm gì cả. Và nếu bạn muốn thực hiện thẻ URL tiêu chuẩn (nếu cần thiết), bạn hãy vạch ra một chiến lược mạnh mẽ với sự giúp đỡ của một chuyên gia SEO có kinh nghiệm. Hãy chắc chắn rằng bạn đang sử dụng rel=canonical trên các trang trùng lặp, và không cố gắng sử dụng nó thay cho chuyển hướng 301. Hãy đảm bảo bạn đang vượt qua kho tìm kiếm để đến đúng trang với việc thực hiện một số kỹ thuật rel=canonical sâu rộng như đã giải thích ở trên. Hãy nhớ, nó chỉ là một dòng mã đơn giản, nhưng nó có thể có những ảnh hưởng dữ dội.

3. Chuyển hướng 301 không chuyển hướng

Hãy tưởng tượng bạn đã làm bài tập về nhà khi thiết kế lại hoặc chuyển đổi website của bạn. Bạn vạch ra một kế hoạch chuyển hướng 301 mạnh mẽ, làm việc với các nhà phát triển về việc thực hiện kế hoạch, và kiểm tra kỹ càng trước khi bắt tay vào làm.

Nhưng một tháng sau đó thứ hạng tìm kiếm và lưu lượng truy cập bắt đầu rớt xuống. Vậy điều gì đã xảy ra?

Trong quá trình kiểm tra, đặc biệt sau khi thực hiện thiết kế lại và chuyển đổi website, đôi lần tôi nhận thấy tất cả các chuyển hướng 301 được triển khai đột nhiên ngừng hoạt động. Khi thử nghiệm và thu thập các trang đích hàng đầu từ website cũ, thì đó là do lỗi 404 (Không tìm thấy trang).

Nguyên nhân có thể do một số vấn đề kỹ thuật, bao gồm cả việc thay đổi mã hóa chuyển hướng trở lại, bảng cơ sở dữ liệu bị mất, thay đổi mã hóa ngăn các chuyển hướng 301 hoạt động, v..v. Tôi đã tiến hành một số cuộc kiểm tra dựa trên thiết kế lại và sự thay đổi website để tìm ra vấn đề này.

Thật không may, quá trình thay đổi website không kết thúc khi website mới đi vào hoạt động. Bạn cần phải đảm bảo những thay đổi bạn đã thực hiện theo sát với website mới theo thời gian. Nếu không, bạn có nguy cơ mất kho tìm kiếm, và điều này có thể ảnh hưởng đến thứ hạng và lưu lượng tìm kiếm hữu cơ.

Khuyến nghị: Kiểm tra triệt để chuyển hướng 301 trước khi đăng lên website. Hãy chắc chắn những thay đổi mã mới sẽ không quay trở lại chuyển hướng, hoặc ảnh hưởng đến quá trình chuyển hướng 301. Lưu giữ file của các trang đích hàng đầu từ website cũ và thu thập thông tin URL theo định kỳ. Điều này sẽ đảm bảo chuyển hướng 301 vẫn là chuyển hướng 301. Hãy nhớ rằng, bạn không nên lãng phí bất kỳ một liên kết nào, và chuyển hướng 301 hỏng về cơ bản có thể phá hủy hàng nhiều năm xây dựng liên kết tự nhiên.

4. Sitemap nhiễm bẩn

Khi trình bày bản đồ XML của website, điều cuối cùng bạn cần làm là chăm sóc các URL xấu. Ví dụ như URL 404, 302, 500, vv.

Sơ đồ trang web chứa URL xấu được gọi là "sitemap nhiễm bẩn", chúng có thể làm mất độ tin tưởng của  các công cụ tìm kiếm vào website. Duane Forrester từ Bing giải thích rằng họ ít khi chấp nhận các website có sitemap nhiễm bẩn.

Sau đây là câu trích dẫn từ bài phỏng vấn với Eric Enge:

Sơ đồ trang web cần phải được làm sạch. Chúng tôi cho phép mức độ nhiễm bẩn của một Sitemap trong phạm vi 1%. Ví dụ nếu chúng tôi click vào một URL và thấy xảy ra chuyển hướng, có thể đó là URL mã 404 hoặc 500. Nếu chúng tôi phát hiện ra trên 1% sitemap bị nhiễm bẩn, chúng tôi sẽ bắt đầu mất độ tin tưởng vào website đó.

Không cần phải nói, bạn chỉ cần cung cấp URL tiêu chuẩn trong sitemap XML (URL không trùng lặp đưa vào một mã 200).

Trong quá trình kiểm tra, tôi thâm nhập vào báo cáo sitemap XML trong công cụ Google Webmaster Tools, cũng như cùng lúc thu thập các sitemap. Suốt quá trình này, tôi đã tìm thấy các URL không nên có trong sitemap XML.

Khi làm việc với các nhà phát triển của khách hàng, quy trình kỹ thuật tạo ra sitemap bị hỏng rất nhiều lần. Điều đó có nghĩa là mỗi khi sitemap được tạo ra, chúng sẽ được thêm vào các URL xấu tiềm ẩn.

Ví dụ, một sitemap XML tôi đã thu thập cung cấp hàng ngàn URL dựa trên địa chỉ IP (so với việc sử dụng tên miền). Từ quan điểm tiêu chuẩn, website của bạn không nên giải quyết thông qua địa chỉ IP, hoặc bạn có thể chạy một nội dung trùng lặp lớn. Bây giờ, các công cụ quản trị mạng sẽ đánh dấu lỗi này, vì bạn không thể đưa ra các trang nằm ngoài các miền đã được công nhận, nhưng việc phát hiện ra vấn đề này đã giúp khách hàng của tôi trên nhiều cấp độ.

Đầu tiên, chúng tôi biết rằng trục trặc mã hóa đang sử dụng địa chỉ IP với tên miền, và các URL giúp chúng tôi theo dõi vấn đề này. Thứ hai, khách hàng của tôi đang chăm sóc các công cụ sitemap nhiễm bẩn, mà theo như Forrester giải thích, nó có thể dẫn đến mất độ tin tưởng website. Thứ ba, chúng tôi có thể xem xét lại chiến lược sitemap XML và thiết lập một kế hoạch mạnh mẽ hơn để xử lý hàng triệu các URL trên website.

Khuyến nghị: Tránh để sitemap nhiễm bẩn bằng mọi giá. Không gửi các công cụ tìm kiếm URL không thực hiện chính xác. Chỉ cung cấp các URL tiêu chuẩn trong sitemap XML. Tôi khuyên bạn nên có một quá trình kiểm tra báo cáo sitemap XML thường xuyên trong các công cụ quản trị mạng, ngoài ra bạn cũng nên thu thập sitemap theo định kỳ. Thực hiện quá trình này có thể giúp bạn nắm bắt các vấn đề kỹ thuật trước khi chúng gây ra vấn đề lớn hơn.

Tóm tắt: Những tín hiệu xấu dẫn đến SEO kém hiệu quả

Bốn tình huống này là những ví dụ tuyệt vời về cách các vấn đề kỹ thuật tiềm ẩn có thể dẫn đến tín hiệu SEO nguy hiểm gửi đến các công cụ tìm kiếm. Và trừ khi bạn phát hiện ra những vấn đề đó, nếu không thì chúng có thể diễn ra trong thời gian dài, gây tác động tiêu cực đến thứ hạng và lưu lượng tìm kiếm hữu cơ của một website.

Khuyến nghị cuối cùng của tôi đó là hãy đảm bảo bạn vẫn tiếp tục phân tích website đứng trên quan điểm lập trường của SEO chỉ bởi vì bạn đã thực hiện thay đổi cách đây bốn tháng trước không có nghĩa là nó vẫn còn hoạt động chính xác vào thời điểm hiện tại.

Cố gắng lưu giữ các vấn đề kỹ thuật trên máy chủ thử nghiệm để chúng không thể gây tổn hại đến bất cứ người dùng nào hay bất cứ vấn đề nào khác. Và đó là một chặng đường dài để tiếp tục duy trì thứ hạng và lưu lượng truy cập vào website của bạn.

Xuân Trung

Gửi bình luận

Hãy nhập đầy đủ các thông tin yêu cầu trong ô có dấu (*). Không được phép sử dụng mã HTML.

LIKE để ủng hộ bạn nhé!

 

Tham gia diễn đàn seo hàng đầu Việt Nam

Has no content to show!