Đối phó với các vấn đề nội dung trùng lặp trong Onsite

Thảo luận trong 'Seo Onpage' bắt đầu bởi vnseosem, 5/11/14.

Đã xem: 2,683

  1. vnseosem Quản Trị Viên

    Vấn đề nội dung trùng lặp xảy ra khi có nhiều hơn một trang được index bởi công cụ tìm kiếm. Việc trùng lặp có thể xảy ra với cả hai trang web Onsite và Offsite: trùng lặp onsite là khi cùng một nội dung được xuất hiện trên nhiều trang trên cùng một website và trùng lặp offsite là khi nội dung trên trang web của bạn cũng tương tự như trên một số trang web khác.

    [​IMG]

    Nội dung trùng lặp trên cùng một trang web làm cho công cụ tìm kiếm khó khăn hơn khi đưa ra quyết định xếp hạng trang web. Dưới đây là một số vấn đề về nội dung trùng lặp onsite phổ biến nhất và cách giải quyết chúng:

    Các vấn đề nội dung trùng lặp

    - Vấn đề nội dung trùng lặp có thể dẫn đến sự sụt giảm về tỷ lệ thu thập dữ liệu - điều này xảy ra bởi Googlebot đang bận thu thập dữ liệu từ các trang tương tự không cần thiết.
    - Thứ hạng của các trang sai dẫn đến trải nghiệm người dùng kém
    - Các trang web mới có thể phải đối mặt với sự chậm trễ trong bảng xếp hạng.
    - Công cụ tìm kiếm không biết trang nào được index
    - Công cụ tìm kiếm không xác định được trang nào được xếp hạng cho một truy vấn tìm kiếm.

    Nguyên nhân của vấn đề nội dung trùng lặp

    Các thông số URL như theo dõi nhấp chuột và phân tích code có thể gây ra các vấn đề nội dung trùng lặp. Google cung cấp lời khuyên đối với URL có chứa các tham số cụ thể.

    Phiên bản nội dung Printer-friendly cũng có thể gây ra các vấn đề nội dung trùng lặp khi các phiên bản khác nhau của một trang được index.

    Mô tả sản phẩm giống hệt nhau cho các sản phẩm tương tự trên trang web của bạn hoặc trên nhiều trang web bán các sản phẩm tương tự là một vấn đề chủ yếu mà các trang web thương mại điện tử phải đối mặt khi họ sử dụng các mô tả sản phẩm chung chung, ví dụ như copy nhà cung cấp sản phẩm.

    Một yếu tố khác gây ra các vấn đề nội dung trùng lặp là do ID session. Vấn đề sẽ phát sinh khi người dùng truy cập vào một trang web được gán session ID khác nhau.

    Sử dụng các URL khác nhau hoặc các tên miền khác nhau cho các phiên bản di động của trang web khác nhau cũng có thể gây ra vấn đề trùng lặp nội dung.

    Nội dung trùng lặp cũng có thể phát sinh trên cả hai phiên bản www và non-www của một trang có sẵn và cùng một nội dung trên cả hai trang.

    Nguyên nhân khác của trùng lặp nội dung còn có cả scrap và content syndication, trang chủ và trang lưu trữ hoăc kiến trúc trang web, trong đó có nhiều đường dẫn đến cùng một trang.

    Matt Cutts đưa ra một số lời khuyên dành cho các trang web thương mại điện tử để ngăn chặn các vấn đề trùng lặp nội dung tại video này.


    Giải quyết các vấn đề trùng lặp nội dung

    - Chuyển hướng nội dung trùng lặp: thiết lập chuyển hướng 301 từ các trang với nội dung sao chép làm một. Đảm bảo rằng bạn chuyển hướng tất cả các URL trùng lặp nội dung cũ sang URL canonical phù hợp.

    - Sử dụng thẻ "rel=canonical": sử dụng thẻ "rel=canonical" để nói cho công cụ tìm kiếm biết phiên bản của trang mà bạn muốn công cụ tìm kiếm hiển thị trong kết quả tìm kiếm. Thẻ canonical được tìm thấy trong tiêu đề của một trang web.

    - Sử dụng thẻ meta: sử dụng thẻ meta để nói cho công cụ tìm kiếm các trang mà bạn không muốn index.

    - Sử dụng Syndicate content một cách cẩn thận: trong trường hợp bạn sử dụng Syndicate content trên các trang web khác, bạn hãy cẩn thận với nó. Đảm bảo rằng mỗi trang web mà nội dung của bạn được Syndicate liên kết đến trang web của bạn. Bạn cũng có thể yêu cầu sử dụng "no follow". Nếu bạn có nhiều trang tương tự, hãy mở rộng các trang chứa nội dung duy nhất hoặc chuyển chúng thành một trang duy nhất.

    - Sử dụng cùng URL cho các trang web di động: để giải quyết các vấn đề trùng lặp nội dung trong trường hợp phiên bản di động của trang web, bạn hãy sử dụng thiết kế responsive hoặc sử dụng cùng URL để giải quyết vấn đề này.

    - Kiểm tra Guest Posts: trước khi bạn chấp nhận Guest Posts, bạn hãy kiểm tra xem nó có trùng lặp hay không. Việc ăn cắp có thể gây ra các hình phạt nghiệm trọng ảnh hưởng đến các trang web uy tín.

    - Làm thế nào để Google index trang web của bạn: Google cho phép bạn quyết định trang được thu thập và trang không được thu thập. Bạn cũng có thể thông báo cho Google biết cách bạn muốn index trang web của bạn.

    - Thống nhất chiến lược liên kết internal: chỉ cần gán nó vào một định dạng đặc biết để tránh nhầm lẫn.

    Công cụ

    - Google Webmaster Tools: sử dụng Google Webmaster Tools để theo dõi nội dung trùng lặp trong meta description và title description. Nếu bạn đang sử dụng Google Webmaster Tools, bạn hãy đăng nhập vào tài khoản của bạn, click vào Diagnostics, tiếp theo là "HTML Suggestions". Bạn sẽ nhìn thấy một bảng hiển thị các thẻ tiêu đề và thẻ mô tả bị trùng lặp. Click vào bất kỳ liên kết nào nó cũng sẽ cho bạn thấy URL trùng lặp.

    - Siteliner: sử dụng Siteliner để kiểm tra nội dung trùng lặp và các liên kết bị hỏng bằng cách nhập URL và click vào "Go". Siteliner sẽ tạo ra một báo cáo đầy đủ về nội dung trùng lặp, các liên kết bị hỏng và bỏ qua các trang. Click vào "Duplicate Content" trong phần Site Details để có được cái nhìn tổng quan về các URL, tiêu đề, các từ phù hợp, tỷ lệ phần trăm các trang được coi là hợp lệ.

    - ScreamingFrog: ScreamingFrog sẽ thu thập dữ liệu lên đến 500 trang miễn phí cho các vấn đề trong đó có nội dung trùng lặp. Click vào Page Titles và chọn "Duplicate" trong phần "Filter". Bạn sẽ nhận được một danh sách các URL đã sao chép nội dung. Sau đó bạn hãy phân tích và sửa chữa chúng.

    - Virante Duplicate Content Checker: submit tên miền của bạn và Virante sẽ quét trang web của bạn để xem có xảy ra vấn đề trùng lặp nội dung hay không. Nó sẽ tiến hành kiểm tra Google cache, kiểm tra 404 và www với non-www bằng cách kiểm tra các tiêu đề được trả về bởi cả hai phiên bản của URL, sự phân tán PR và các trang bổ sung trong chỉ mục của Google.

    - Xenu: Xenu kiểm tra các liên kết hỏng. Nó sẽ kiểm tra các tiêu đề giống nhau. Bạn khởi động Xenu và vào File, sau đó click vào Check URL. Ngay sau khi bạn cick vào OK, Xenu sẽ bắt đầu thu thập dữ liệu URL. Sau đó, bạn hãy lưu tập tin và export nó vào MS Excel. Sau đó, bạn có thể phân tích các vấn đề nội dung trùng lặp.

    - SmallSeoTools: để kiểm tra việc ăn cắp, copy và paste bài viết blog, công cụ này sẽ nói cho bạn biết đâu là nội dung ban đầu. Sao chép nội dung mà bạn muốn kiểm tra và dán nó vào hộp màu vàng trên công cụ này. Gõ vào mã captcha và click vào "Check for Plagiarism". Những cụm từ đó đã được gỡ bỏ và được đánh dấu màu đỏ. Bạn có thể click vào văn bản đánh dấu để xem mã nguồn.

    Các vấn đề nội dung trùng lặp không phải là không khắc phục được. Thay thế nội dung trùng lặp bằng nội dung độc đáo và mang nhiều thông tin có giá trị cho người dùng và công cụ tìm kiếm sẽ cung cấp một sự thúc đẩy cần thiết cho trang web của bạn.

    Nếu bạn nghĩ chúng tôi bỏ lỡ một số công cụ quan trọng để phát hiện nội dung trùng lặp, bạn hãy cho chúng tôi biết trong các bình luận dưới đây. Ngoài ra, bạn cũng có thể gửi cho chúng tôi thông tin phản hồi nếu bạn có một số thông tin bổ sung hoặc lời khuyên để giải quyết vấn đề nội dung trùng lặp.

    Ghi nguồn www.thegioiseo.com khi đăng tải lại bài viết này.​
     
    Đang tải...
    nam lim xanh

    Bình Luận Bằng Facebook

  2. tamhuyen Thành Viên Đồng

    Số bài viết: 484
    Đã được thích: 14
    Điểm thành tích: 18
    Chung quy lai là viết bài mới vẫn tốt nhất :v
     
  3. lelong Moderator

    Số bài viết: 35
    Đã được thích: 9
    Điểm thành tích: 8
    Mới, độc, lạ nữa mới đẩy đủ chứ :D