Bản sao trang joomla : Nguyên nhân và giải pháp

Đăng ngày: 16 Tháng 6 2013
Đánh giá bài này
(0 bình chọn)
Bản sao trang joomla : Nguyên nhân và giải pháp Bản sao trang joomla : Nguyên nhân và giải pháp

Nếu bạn đang sở hữu một website sử dụng nền tảng CMS joomla sớm hay muộn cũng phải đối mặt với các vấn đề trùng lặp trang. Vì lý do đó chúng ta nên có một cái nhìn nhận vấn đề này từ bên trong cốt lõi của vấn đề, chúng tôi sẽ nêu ra thế nào là trùng lặp trang, làm thế nào trước phản ứng của công cụ tìm kiếm trong trường hợp trùng lặp, và làm thế nào để thoát khỏi những cặp trùng lặp nhau đó.

Bản sao trang joomla : Nguyên nhân và giải pháp

Bản sao trang là văn bản giống hệt nhau trên trang web của bạn và có sẵn thông qua các url khác nhau. Trên thực tế bản sao trang web là những điểm yếu của hầu hết các CMS không chỉ của joomla. Tất cả các trang này là vô hại cho đến khi được index  bởi công cụ tìm kiếm thu thập thông tin. Điều chỉnh để công cụ tìm kiếm index và nhanh chóng hành động để loại bỏ các trang từ các kết quả, nó rất tốt để suy nghĩ về cấu trúc trước và tránh những tình huống này.

Lý do của bản sao xuất hiện là do cấu trúc website bị sai. Trước hết bạn cần phải suy nghĩ về hệ thống phân cấp các thư mục và các mục menu. Nếu bạn tạo thư mục hệ thống trước có thể ngăn chặn các trang trùng lặp xuất hiện trong tương lai.

Chúng ta hãy có một cái nhìn trước hầu hết các sai lầm phổ biến. Giả sử bạn có thư mục cha là "Đồ họa" và có một số thư mục con  " photoshop", "illustrator ", "Flash ".. tất cả các tài liệu bạn liên kết trực tiếp đến thư mục con nếu bạn tạo trình đơn chỉ có thu mục con như "photoshop", các liên kết có thể là như sau :

http://lmt.com.vn/home/for-designer.html

http://lmt.com.vn/home/for-designer/adobe-photoshop.html

http://lmt.com.vn/home/for-designer/adobe-illustrator.html

http://lmt.com.vn/home/for-designer/adobe-flash.html

Khi bạn bắt đầu xây dựng một website bạn cần phải suy nghĩ về cấu trúc của nó và xác định các thự mục chính và thư mục con cho từ chủ đề và thể loại. Với sự phát triển của mã nguồn mở bạn không cần phải thay đổi cấu trúc hiện có, chỉ cần thêm một số bổ sung cần thiết. Cơ cấu lại trang web của bạn đang trong sự phát triển là một vấn đề lớn, có thể mất nhiều tháng. Trong thực tế, một số trang( hoặc tất cả) sẽ thay đổi địa chỉ của họ, mà dẫn đến giảm thứ hạng các vị trí trong kết quả tìm kiếm và tham dự.

Công cụ tìm kiếm tìm những trang trùng lặp như thế nào ?

Nguyên nhân phổ biết nhất là các thành phần mở rộng và dữ liệu mẫu mà nhà phát triển cài đặt vào trang web joomla. Ví dụ : module tin tức trên trang chủ

có thể cung cấp địa chỉ khác nhau. Đôi khi những bản sao trang có thể được nhìn thấy ngay cả trong sơ đồ website khi bạn cài đặt Xmap.

Nếu website của bạn đã được index, nhưng không phải là khó để tìm những nội dung trùng lặp. Chỉ cần sao chép vài dịch vụ duy nhất từ trang và chèn các tài liệu này trong dấu ngoặc kép trong tìm kiếm của google. Nếu trang của bạn không được index, bạn có thể thử XENU ( trong trường hợp trang web của bạn còn nhỏ), nó sẽ tìm kiếm tất cả các cách tới trang web của bạn.

Tại sao chúng ta cần thoát khỏi trùng lặp trang ?

Công cụ tìm kiếm " không thích" và cố gắng không để index website có số lượng lớn các trang giống hệt nhau gây ra sự tìm kiếm không cần thiết. Trong khi tối ưu hóa trang cho các từ khóa nhất định, các trang phù hợp nhất được lựa chọn và nội dung được tối ưu hóa. Nếu trang có bản sao, trong khi công cụ tìm kiếm cập nhật có thể thay đổi các trang có liên quan tới trang của họ (điều này đi kèm với sự tụt giảm mạnh các vị trí thứ hạng của từ khóa)

Có 6 cách để thoát khỏi trùng lặp trang

Trước nhất bạn nên bật SEF(Search Engine Friendly URLs) và chuyển hướng URL trong cài đặt chung của joomla thì những bước làm sau mới hiệu quả và hợp lệ.

1. Plugin styleware content canonical

Plugin này giải quyết vấn đề URL của trang, làm cho url đơn giản hơn. nếu bạn có 1 url component/content/article/32-something.html và một url something.html cả hai sẽ được index từ một URL(something.html). Đó là điều tuyệt vời mà plugin này làm được.

2. Robots.txt cho joomla

Các tập tin được đưa vào gói tiêu chuẩn của joomla, được đưa vào thư mục gốc và có sẵn thông qua các liên kết domainwebsite.com/robots.txt. Nó hướng dẫn công cụ tìm kiếm làm thế nào để index được website của bạn. Ngoài ra bạn có thể sử dụng hướng dẫn sau đây để các dữ liệu mặc định trong các tập tin:

Disallow: /*? #each links that contains this sign will not be indexed *

chỉ cần 1 dòng giúp bạn tiết kiệm được từ lưu trữ số lượng lớn các đoạn như :

- page materials for printing;

- link to rss feed;

- the search results page on the site;

- will also close the page pagination;

- there may be other options, depending on the extensions used.

Chú ý: cho dù sử dụng dòng này hay không là tùy thuộc vào bạn, tập tin robots quá lớn vẫn được cho phép và dòng này không như sơ đồ website, do đó bạn chỉ có thể thêm dòng  Allow: /site_map.

3. Chuyển hướng 301 (Redirect 301)

Chuyển hướng 301 là những chuyển hướng khi bạn đã thay đổi URL, nhưng tất cả các bài viết vẫn còn tồn tại. Trong trường hợp này, muốn chỉ tới liên kết thích hợp bạn cần phải sử dụng chuyển hướng 301 trong tập tin .htaccess. Công cụ tìm kiếm biết rằng các bài viết đã được chuyển tới địa chỉ mới. Phương pháp này cho phép bạn tiết kiệm cả hiệu suất trang web và PR trang của bạn.

Chuyển hướng 301 cũng có thể được sử dụng cho những trang tăng gấp đôi. ví dụ bản sao được biết đến rộng rãi của một trang web joomla là /index.php và alias là của menu home.

ví dụ :/home hoặc /homepage, các địa chỉ này có thể được sửa khá dễ dàng  bằng cách mở tập tin .htaccess của bạn và nhập:

 redirect301/index.php

" ?php

if($_SERVER['REQUEST_URI'] == '/index.php') {

header("Location: /",TRUE,301);

exit();

}

?>

"

 Đây là một ví dụ quan trọng của một địa chỉ trang web và không có www.

RewriteEngine On

RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]

RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]

Thay tên miền website của bạn vào example.com

 4. Meta tag robots

Một trong nhiều cách làm để ngăn chặn index bản sao đó là sử dụng thẻ meta robots

Hiện nay tùy chọn này tốt hơn là cách sử dụng file robots.txt. Ví dụ để đóng phiên bản trang để in bạn cần phải có địa chỉ, bạn có thể mở các tập tin component.php của thư mục gốc trong template mà bạn nhập vào từ khóa"  ?tmpl = component in " đóng cửa các trang kết quả tìm kiếm bạn có thể sử dụng com_search vào file index.php trong template bạn chỉ cần thêm dòng code sau đây

 

5.Xóa các URL từ bảng điều khiển của webmaster's

Một trong nhiều cách để loại bỏ các bản sao là xóa chúng bằng tay từ bẳng điều khiển của quản trị trang web.

 https://www.google.com/webmasters/tools/home?hl=en

6. X-Robots-Tag Titles

Google khuyến cáo sử dụng X-Robots-Tag Titles thay thế cho phương pháp 4th trong roundup

Như bạn thấy có rất nhiều cách làm thế nào để loại bỏ các bản sao, mặc dù bạn cần phải hiểu hoạt động của từng tiện ích để áp dụng phù hợp nhất cho website của bạn. chúc bạn thành công.

Xuân Trung

1 bình luận

  • harovn
    đăng bởi harovn
    Thứ tư, 26 Tháng 3 2014 13:03

    Mình có 1 hệ thống website là joomla... Vậy là có nhiều việc để làm đây. Thanks bài viết của ban nha!

    Cảnh báo

Gửi bình luận

Hãy nhập đầy đủ các thông tin yêu cầu trong ô có dấu (*). Không được phép sử dụng mã HTML.

LIKE để ủng hộ bạn nhé!

 

Tham gia diễn đàn seo hàng đầu Việt Nam

Has no content to show!