Cách chúng tôi tấn công bảng xếp hạng tìm kiếm của Google

Thảo luận trong 'Thảo luận – Hỏi đáp – Trợ giúp SEO' bắt đầu bởi cuongno1, 8/3/17.

Đã xem: 367

  1. cuongno1 Thành Viên Kì Cựu

    Trong bài viết này tôi sẽ chia sẻ một thử nghiệm mà tôi đã chiếm được quyền kiểm soát thứ hạng. Bạn có thể theo dõi tiến trình của tôi trong bài viết dưới đây:

    [​IMG]

    Tôi muốn chia sẻ một vài ghi chú về một thử nghiệm mà tổ chức của tôi đã thực hiện trong thời gian gần đây và kết quả là Google tin rằng trang web của chúng tôi là phiên bản chuẩn PDF về hướng dẫn SEO cho người mới bắt đầu - và thứ hạng của chúng tôi đã thay đổi.

    Chúng tôi cũng đã thực hiện nhiều bài kiểm tra nội bộ, cả phần mềm SEO Spider và cho khách hàng của chúng tôi. Thử nghiệm này nhằm mục đích làm nổi bật vấn đề chúng tôi đã phát hiện ra.

    [​IMG]
    Background

    Trước đây, chúng tôi đã liên hệ với Google sau khi nhìn thấy một số hành vi kỳ lạ trong kết quả của công cụ tìm kiếm. Mặc dù SEO starter guide PDF của họ đã được xếp hạng với các cụm từ có liên quan như “SEO” và “google SEO guide".

    [​IMG]
    Đối với các tìm kiếm chúng tôi đã thực hiện, starter guide PDF sẽ xuất hiện nhưng nó sẽ liên kết tới các trang web khác đã tải nó thay vì tới trang web của Google. Vì vậy, Google không xếp hạng trang web của riêng họ vì một số lý do; các trang web khác xuất hiện thay vì sử dụng nội dung của Google.

    Dưới đây là một vài trang web được xếp hạng tại Vương Quốc Anh. Mỗi một trang được xuất hiện đã thay đổi kết quả tìm kiếm của Google.

    [​IMG]

    Chúng tôi quyết định xem lý do tại sao trang của Google không được index và các trang khác dường như đang hiển thị ở vị trí của nó. Chúng tôi nhận thấy Google dường như đang sử dụng chuyển hưởng tạm thời 302 trên hướng dẫn của họ, chúng được lưu trữ trên một domain riêng.

    Chuyển hướng 302 có nghĩa là URL gốc trên google.com được index chứ không phải URL đích được lưu trữ trên static.googleusercontent.com.

    Tuy nhiên, URL không được index và chúng dường như đang phải vật lộn để hiểu canonical, nội dung gốc và URL của chúng. Google không sử dụng "noindex" cũng không bị chặn thông qua robots.txt, nội dung khác đã được index trên sub-domain và chúng dường như không có bất kỳ hướng dẫn nào mâu thuẫn với các canonical hay bất cứ điều gì khác trên trang hoặc bên trong HTTP header.

    Google đã nói rằng PageRank vẫn hoạt động như trước bất kể đó là chuyển hướng 302 hay chuyển hướng 301. Về lý thuyết, URL gốc phải được index và được xếp hạng nhưng không phải như vậy.

    [​IMG]
    Chúng tôi đã biết từ các thử nghiệm trước đó rằng nội dung giống nhau có thể bị tấn công nhưng thường là với các trang web có authority cao hơn. Hướng dẫn của Google có khoảng hơn 2.100 liên kết với các domain gốc đến các URL gốc và 485 mục tiêu chuyển hướng khác (giao thức HTTP/HTTPS được kết hợp), vì vậy đây là một trang rất mạnh với nhiều khả năng hiển thị.

    Rõ ràng, trang web Screaming Frog không có authority như Google nhưng các trang web có ít authority hơn đã thay thế chúng trước đây bởi những vấn đề được mô tả ở trên.

    Thử nghiệm

    Chúng tôi quyết định chạy thử nghiệm ngắn hạn và tải lên hướng dẫn SEO của Google vào domain của chúng tôi. Sau đó chúng tôi đã được index thông qua Google Search Console và quên nó.

    Một tuần sau, chúng tôi nhận thấy chúng tôi đã chiếm đoạt thứ hạng của Google vì thuật toán của họ dường như tin rằng chúng tôi là nguồn tài nguyên gốc. URL của chúng tôi sẽ trở lại với một thông tin: và cache: truy vấn cho một trong các URL của Google.

    [​IMG]

    Chúng tôi đã tấn công được những hacker và Google.

    [​IMG]

    Mặc dù chúng tôi là một trang web của nước Anh, chúng tôi đã nhảy lên vị trí thứ 4 với “search engine optimization” và top 10 với “SEO” ở Mỹ.

    [​IMG]
    PDF được xếp hạng với “Google SEO”, “Google SEO guide”, “www google com” và cụm từ khác mà nội dung của Google được hiển thị.

    [​IMG]

    PDF được xếp hạng với rất nhiều truy vấn thương hiệu khác ở Anh và Mỹ, chúng tôi có thể xem qua sự trợ giúp của SEMrush (đặc biệt là ở Mỹ).

    [​IMG]

    Và Sistrix đã làm nổi bật những từ khoá "mới" xuất hiện:

    [​IMG]
    Google Search Console ghi nhận gần 800k hiển thị với PDF trong 4 ngày.

    [​IMG]

    Thử nghiệm này đã nhận được rất nhiều sự chú ý khi chúng tôi tweet nó. Vì vậy, chúng tôi đã để ý đến nó trong những ngày sau để xem liệu Google có thực hiện bất kỳ thay đổi nào khi index, canonical và xếp hạng hay không. Khoảng 48 giờ sau, chúng tôi nhận thấy rằng hướng dẫn của Google bắt đầu được xếp hạng và được index (xuất hiện dưới một trang web:truy vấn), trước đây nó không trả về kết quả.

    [​IMG]
    Sau đó chúng tôi nhận thấy Google đã thêm một HTTP canonical đến PDF của họ, giúp nó được index.

    [​IMG]
    Tuy nhiên, chúng tôi vẫn xuất hiện dưới một thông tin:truy vấn và xếp hạng cho các truy vấn của họ. Điều này có nghĩa là cả 2 hướng dẫn được xếp hạng trong kết quả tìm kiếm, thường là với trang web của chúng tôi trên Google.

    [​IMG]

    Chúng tôi hy vọng điều này sẽ thay đổi - để Google trở thành canonical và trang của chúng tôi sẽ không còn trong bảng xếp hạng nữa. Đến 5 ngày sau, chúng tôi vẫn ở đó, bên cạnh Google trong kết quả tìm kiếm với hàng nghìn truy vấn tìm kiếm. Sau đó, tập tin PDF của chúng tôi đã biến mất khỏi kết quả tìm kiếm và chúng tôi đã kết thúc thử nghiệm một cách nhanh chóng.

    Tóm lại

    Trước tiên, chúng tôi không khuyên bạn không nên làm phiền nội dung của người khác. Đây không phải là một chiến lược hay một chiến thuật khả thi để đạt được thứ hạng cao hơn. Có thể rất khó để đưa ra kết luận vì chúng ta không thể chắc chắn những yếu tố khác hoặc những điều chưa biết trong cuộc chơi. Cuối cùng chúng tôi chốt lại với 3 điểm sau:

    1. Đổ lỗi cho chuyển hướng 302 không đầy đủ

    Mặc dù chúng tôi tin rằng chuyển hướng 302 có thể là nguyên nhân gốc, tôi biết Google nhấn mạnh rằng không có vấn đề khi sử dụng chuyển hướng 302. Chúng tôi tin rằng có một vài lý do về cách tập tin được lưu trữ.

    Chúng tôi tìm thấy một vài điều khác xung quanh các URL thay đổi theo thời gian (dựa trên giá trị được cung cấp trong header Accept-Language) và canonical trên HTTPS không chính xác khi đo lường.

    2. Sử dụng canonical

    Phải thật sự khéo léo khi sử dụng canonical để được index. Ngay khi Google cập nhật canonical HTTP của PDF sang một URL, nó đã được index ngay lập tức.

    Sử dụng trình thu thập, bạn có thể scan trang web của bạn vì thiếu các phần tử liên kết canonical hoặc các liên kết canonical trong header HTTP của bạn.

    Với PDF và doc, bạn có thể dễ dàng thiết lập một HTTP canonical bằng cách sử dụng .htaccess.

    3. Việc tấn công có thể xảy ra

    Thứ hạng của trang có thể bị tấn công bởi một domain khác sử dụng nội dung giống hệt nhau trong những tình huống cụ thể, chẳng hạn như các vấn đề với việc index hoặc là nguồn tài nguyên authority. Điều này thường không xảy ra nhưng có lẽ có một vài điều mà Google vẫn có thể cải thiện trong việc xếp hạng các nguồn tài nguyên gốc.

    Đây là một ví dụ mà 1 tác giả nước ngoài đã thực hiện thành công, là ví dụ hay để chúng ta tham khảo và học tập các phương pháp tấn công bảng xếp hạng của Google. Đương nhiên Thế giới Seo sẽ không khuyến khích bạn theo phương pháp này mà chỉ đưa ra cho các bạn tham khảo để mở rộng tư duy làm SEO.

    Ghi nguồn
    Mã:
    www.thegioiseo.com
     
    Tin nấm gỗ lim xanh rừng
    Đang tải...
    nam lim xanh

    Bình Luận Bằng Facebook

  2. phucanh0303 Thành Viên

    Số bài viết: 23
    Đã được thích: 0
    Điểm thành tích: 1
    Cám ơn bài viết của bạn rất hữu ích đối với tôi. Tôi cũng làm seo lâu rồi nhưng vẫn chưa đủ kinh nghiệm tốt trong seo. Nhờ bài viết này của bạn tôi càng yêu nghề seo mà tôi đã theo đuổi lâu nay.
     
  3. anhemseo Thành Viên Tích Cực

    Số bài viết: 66
    Đã được thích: 6
    Điểm thành tích: 8
    Web:
    Bài viết của bác khá hay, bạn đã chia sẻ nhiều khía cạnh mà người làm seo chưa hề biết tới, mình sẽ thay đổi cách seo để cho phù hợp với người dùng và có độ tương tác cao với google
     
  4. snail_lx Thành Viên Tích Cực

    Số bài viết: 96
    Đã được thích: 2
    Điểm thành tích: 18
    Web:
    Bài viết cỏ vẻ hởi quá sức với tầm hiểu biết của mình, nói chung là không hiểu lắm về tác dụng và hiệu quả của nó, và cũng chả biết mục đích là gì luôn
     
  5. thaitoan91 Thành Viên

    Số bài viết: 42
    Đã được thích: 1
    Điểm thành tích: 8
    Web:
    Đúng là đạo cao 1 thước ma cao 1 trượng. :D .Biết thế hồi trước học làm hacker có nhiều thứ để nghịch rồi.Không chỉ google mà bất cứ một bộ máy nào cũng có lỗ hổng, quan trọng là cách tìm ra nó thôi :D