Cách thức phát hiện Passive Link trên website

Đăng ngày: 18 Tháng 3 2014
Đánh giá bài này
(0 bình chọn)
Cách thức phát hiện Passive Link trên website Cách thức phát hiện Passive Link trên website

Thiết lập trình thu thập để thăm dò website của người khác là việc làm phi đạo đức và không thân thiện. Chỉ vì bạn muốn biết ai đang liên kết đến website của mình mà làm lãng phí băng thông và các nguồn tài nguyên máy chủ của người khác là hành động ích kỷ, vụ lợi riêng. Bài viết này sẽ cung cấp cho bạn một số phương pháp để phát hiện ra những trang web đang liên kết đến trang của mình.

Phương pháp 1: Tìm kiếm các thông báo RPC (Remote Procedure Call) trong tập tin Server Log

Bất kể bạn sử dụng cách thức nào trên website của mình, bất kỳ website nào cố gắng để Pingback trang web của bạn về vấn đề Trackback đều sẽ để lại dấu vết trong tập tin server log. Ví dụ, một thông báo RPC điển hình từ quá trình cài đặt WordPress sẽ nhìn giống như thế này:

YOUR-DOMAIN – - [DATE+TIME] “HEAD /path-to-post HTTP/1.0″ 200 – “-” “WordPress/[version] THEIR-DOMAIN”

Bạn cần nỗ lực theo dõi loại dữ liệu này để POST “xmlrpc.php” lên website của mình. Mã trạng thái trang web trả về phụ thuộc vào việc liệu bạn có một tập tin như thế hoặc hạn chế truy cập đến nó hay không, nhưng log entry sẽ tương tự như thế này:

THEIR-IP – - [DATE+TIME] “POST /xmlrpc.php HTTP/1.0″ STATUS BYTES “-” “The Incutio XML-RPC PHP Library — WordPress/[version]”

Bạn có thể thấy đường kẻ thứ ba giống chính xác như đường kẻ đầu tiên.

Bằng cách tìm kiếm các loại thông báo này trong tập tin server log, bạn có thể nhìn thấy những blog nào đang cố gắng để báo hiệu cho trang web của mình rằng họ đã liên kết với trang của bạn từ bài viết của họ. Tất nhiên, loại phân tích này cũng chứa nhiều điểm hạn chế, đó là:

-         Các công cụ giả mạo lưu lượng truy cập có thể ping website của bạn ngay cả khi không có bất kỳ liên kết nào.

-         Không phải mọi blog đều được thiết lập để gửi thông báo.

-         Nhiều website không hề sử dụng thông báo RPC.

Vì vậy, dù những phân tích logfile này thật sự hữu dụng và có ích, nhưng nó sẽ không nói cho bạn biết về tất cả các trang đang liên kết đến website của mình.

*. Trackback: được thiết kế để cung cấp một cách thức giao tiếp giữa các website.

*. Pingback: được thiết kế để giải quyết một số vấn đề với trackback.

Phương pháp 2: Tìm kiếm lưu lượng Referral trong Analytics

Hiện nay, hầu hết mọi người đều biết cách nhìn vào dữ liệu lưu lượng referral trong Google analytics. Do vậy, chúng ta không cần đào sâu quá nhiều vào phương pháp này, ngoại trừ việc bạn nên biên soạn một danh sách quản lý dữ liệu referrers là các công cụ tìm kiếm thực sự. Điều này đặc biệt quan trọng nếu bạn phụ thuộc vào Google Analytics để lấy dữ liệu dựa referral, bởi vì nó là một công cụ phân tích rất đáng tin cậy.

Bạn có thể lọc riêng lưu lượng referral tìm kiếm với lưu lượng phi tìm kiếm. Một số website có thể thu được rất nhiều lượng dữ liệu này nếu tất cả chúng không đều xuất phát từ các trang tìm kiếm nhỏ. Hiểu được lưu lượng referral đến từ đâu là việc làm quan trọng nếu bạn đang theo dõi inbound links.

Phương pháp 3: Tìm kiếm tiêu đề bài viết trên web

Nếu bạn định tối ưu website cho công cụ tìm kiếm, hãy sử dụng những tiêu đề bài viết thật sự độc đáo. Mặc dù bạn không thể đảm bảo bất kỳ tiêu đề bài viết nào cũng là duy nhất, bạn không nên viết theo kiểu công thức như “Làm thế nào để ...”. Nếu đó là cách bạn đang xây dựng cho những tiêu đề bài viết của mình, hãy dừng biện pháp này lại ngay từ bây giờ.

Hãy tìm kiếm tiêu đề bài viết cùng với tên website của bạn. Kết quả của quá trình sẽ cung cấp cho bạn danh sách ngắn gọn các website tổng hợp (nhiều người thường gọi là “scraper sites”, đây là cách gọi không chính xác) đang sử dụng RSS (RSS feed) để liên kết trang của họ với nội dung của bạn.

Các website tổng hợp chủ yếu là lành tính nhưng bạn cũng có thể nhìn thấy chúng trong lưu lượng referral phi tìm kiếm. Nếu bạn dự định đưa ra yêu cầu gỡ bỏ với các trang web tổng hợp như này, hãy giới hạn trên những website đang xuất bản những bài viết đầy đủ chứ không chỉ có riêng phần tóm tắt. Bất kỳ website tổng hợp nào được đánh giá là tốt cũng chỉ xuất bản một phần trích từ nội dung của bài viết bất kể nội dung được hiển thị dài như nào đi chăng nữa.

Bạn không phải chạy scripts cả ngày trên Bing và Google thông qua máy chủ proxy nhằm tìm ra những trang web đang liên kết với mình. Bạn có thể thực hiện nghiên cứu này bằng phương pháp thủ công một hoặc hai lần mỗi tuần, tùy thuộc vào tần suất xuất bản nội dung của bạn.

Phương pháp 4: Tìm kiếm URL bài viết

Một số website sẽ không sử dụng tiêu đề bài viết của bạn làm anchor text. Họ có thể chỉ liên kết đến trang  của bạn bằng cách sử dụng các URL cho bài viết. Trường hợp này tương đối phổ biến trên nhiều diễn đàn hiện nay. Vì vậy, nếu bạn có thể tìm thấy các URL bài viết của mình trên những website khác nhau, đó là dấu hiệu cho thấy nội dung bạn viết đang được mọi người chia sẻ, ngay cả khi bạn không nhìn thấy lượng click xuất phát từ những trang web đó.

Một số website tổng hợp chỉ cung cấp các thuộc tính thông qua tên website hoặc URL bài viết không liên kết. Điều này thể hiện sự thiếu quan tâm, chu đáo, nhưng ít nhất bạn vẫn có được sự tin tưởng.

Phương pháp 5: Tìm kiếm câu đầu tiên trong mỗi bài viết

Nếu xuất bản những nội dung tốt, bạn có thể tìm thấy câu mở đầu độc đáo của bài viết mình đã tạo ra trên nhiều trang web khi chúng được mọi người trích dẫn. Các trang web tổng hợp sẽ thực hiện điều này nhưng mọi người cũng sẽ làm vậy, họ sẽ copy paste đoạn văn mở đầu trong bài viết của bạn.

Các phương pháp cũ: Cảnh báo và các báo cáo trong Webmaster Tool

Các công cụ tìm kiếm sẽ nói cho bạn biết về những liên kết chúng tìm thấy trên website của bạn. Do đó, bạn cần thiết lập cảnh báo tên miền và download các báo cáo backlink từ tài khoản trên Webmaster Tool. Các công cụ tìm kiếm chủ chốt ít nhất cũng sẽ gửi lưu lượng truy cập đến website của bạn, trong khi các dịch vụ SEO tool chỉ thu thập dữ liệu mà chúng bán lại cho khách hàng của mình mà thôi.

Lợi ích của việc tìm kiếm các liên kết bị động

Cộng đồng SEO có lẽ sẽ không ngừng sử dụng các công cụ khảo sát liên kết bị động trong tương lai gần tới đây. Tuy nhiên, những công cụ này cũng chứa nhiều điểm hạn chế, chúng không thể cung cấp báo cáo đầy đủ về vị trí xuất hiện của các liên kết mới. Vì vậy, đây chính là yêu cầu cần thiết đối với những nhà cung cấp SEO tool, hy vọng rằng dịch vụ của họ có thể kết hợp trung tâm dữ liệu khổng lồ của Bing và Google cho quá trình thu thập và index trên web. Các nhà cung cấp SEO tool đã bỏ lỡ khá nhiều liên kết.

Tìm kiếm dữ liệu trong analytics, file log, và tìm kiếm web cá nhân có thể phát hiện ra những liên kết mà bạn không nhận ra trong các báo cáo SEO tool; những liên kết này có thể không xuất hiện trong các cảnh cáo hoặc báo cáo trên Webmaster Tool.

Không có hệ thống nào là hoàn hảo tuyệt đối, tôi hy vọng thông qua bài viết này mọi người có thể khám phá thêm những phương pháp khác để phát hiện liên kết trên website của mình, bởi vì chỉ chạy báo cáo backlink từ các nhà cung cấp dịch vụ thông thường không đủ để đảm bảo bạn có thể thu được tất cả mọi thông tin mình cần tìm kiếm. Đừng phạm phải sai lầm khi ưu tiên một nguồn thông tin nào đó mà mình thích hơn nhé.

Xuân Trung

Gửi bình luận

Hãy nhập đầy đủ các thông tin yêu cầu trong ô có dấu (*). Không được phép sử dụng mã HTML.

LIKE để ủng hộ bạn nhé!

 

Tham gia diễn đàn seo hàng đầu Việt Nam

Has no content to show!