Tìm hiểu về cơ chế hoạt động của Google

Thảo luận trong 'Tin tức về các bộ máy tìm kiếm' bắt đầu bởi longtranvan, 9/9/15.

Đã xem: 1,628

  1. longtranvan Thành Viên Mới

    TÌM HIỂU VỀ CƠ CHẾ HOẠT ĐỘNG CỦA GOOGLE
    Cũng giống như các bộ máy tìm kiếm (Seach Engine) khác. Google cũng được cấu tạo bởi 3 bộ phận chính:

    • Bộ phận thu thập thông tin từ các website Google Spider (Bot)
    • Bộ phận Lập chỉ mục
    • Bộ phận xử lý, tính toán và mã hóa dữ liệu
    [​IMG]

    1. BỘ PHẬN THU THẬP THÔNG TIN GOOGLE SPIDER (BOT).
    Thông thường, website nào chúng ta đều thấy cấu trúc của tệp Rotbots.txt ở mục index. File Robots.txt này có nhiệm vụ điều hướng con bọ tìm kiếm Google Spider. Bản thân Google Spider là một loại Robots hoạt động dựa trên liên kết. Quy trình của nó cũng khá đơn giản. Khi truy cập vào 1 website bất kỳ. Google Spider tìm đọc đến file Robots.txt và File .Htaccess để xem nó được quyền truy cập vào những thư mục nào của website đó. Đồng thời nhận dạng chuỗi liên kết tĩnh Permalink được cấu hình tại File Htaccess. Tiếp sau đó Google Spider tiếp tục truy cập vào File Sitemap.xml (sơ đồ trang web). Tại File Sitmap.xml, Các quản trị web (admin) đã cấu hình sẵn 1 sơ đồ hệ thống thống các webpage.

    [​IMG]

    Từ đây, Google Spider tiến hành đi theo các liên kết tại File Sitemap.xml và thu thập thông tin dữ liệu. Các dữ liệu Website của bạn được Google Spider Craw sẽ được gửi về máy chủ (Sever) để lập chỉ mục và xử lý tính toán!.

    2. LẬP CHỈ MỤC
    Sau khi dữ liệu được Craw thành công sẽ được chuyển tiếp về bộ phận lập chỉ mục. Tại đây Google tiến hành quá trình đọc hiểu, phân loại nội dung và tiến hành lập chỉ mục cho nội dung website của bạn. Mỗi một chỉ mục thường được lưu trữ ở các Sever độc lập khác nhau sau quá trình tính toán, xử lý và mã hóa thông tin dữ liệu!.

    [​IMG]

    3. XỬ LÝ, TÍNH TOÁN VÀ MÃ HÓA DỮ LIỆU.
    Tại quy trình này, dựa vào các dữ liệu thu thập được. Kết hợp cùng hơn 200 tiêu chí xếp hạng từ khóa và gần 500 thuật toán tìm kiếm. Google sẽ tiến hành xuất bản thứ hạng cho website của bạn. Đồng thời mã hóa dữ liệu và lưu vào bộ nhớ Cache.

    [​IMG]

    Kết Luận: Tại bài viết này mình đã phân tích khá chi tiết về các bộ phận cấu trúc nên bộ máy tìm kiếm (Search Engine) Google. Hy vọng các bạn đã có thể nắm vững được cách thức hoạt động của Google. Từ quá trình index, Craw dữ liệu trong website của bạn cho tới quá trình tính toán, phân tích và xử lý dữ liệu. Hãy học từ nguyên lý và hiểu tận gốc rễ để xây dựng cho bản thân những nền tảng kiến thức nền móng. Thanks!.

    [​IMG]

    ==>> cách phòng tránh ung thư dạ dày
     
    quangdungtn90 thích bài này.
    Đang tải...
    nam lim xanh

    Bình Luận Bằng Facebook

  2. quangdungtn90 Moderator

    Số bài viết: 11
    Đã được thích: 3
    Điểm thành tích: 3
    Chữ ký theo kiểu hình ảnh hay phết nhờ :)
     
  3. breakit Thành Viên Kì Cựu

    Số bài viết: 233
    Đã được thích: 11
    Điểm thành tích: 18
    Đọc xong mà hoa hết cả mắt :))
     
  4. goctamsu Thành Viên

    Số bài viết: 26
    Đã được thích: 3
    Điểm thành tích: 3
    Web:
    trướt h mình chỉ nghỉ là google thu thập dữ liệu sau đó cất vào kho, khi người dùng nào cần thì lôi ra kết quả phù hợp
     
  5. seongang Thành Viên

    Số bài viết: 37
    Đã được thích: 2
    Điểm thành tích: 8
    Hoạt động đơn giản vậy thôi á.
     
  6. giangth07101993 Thành Viên

    Số bài viết: 7
    Đã được thích: 0
    Điểm thành tích: 1
    Đọc xong mà hoa hết cả mắt
     
  7. taitrochoifree.mobi Thành Viên

    Số bài viết: 22
    Đã được thích: 1
    Điểm thành tích: 3
    Web:
    Đây chỉ là lý thuyết thôi chứ đơn giản thế này thì ai chả làm dc Google chứ
     
  8. thangemxuananh Thành Viên Kì Cựu

    Số bài viết: 256
    Đã được thích: 7
    Điểm thành tích: 18
    Web:
    hiểu được cơ chế của gg thì seo đơn giản biết bao.
     
  9. kyoshiro Thành Viên

    Số bài viết: 39
    Đã được thích: 1
    Điểm thành tích: 8
    Web:
    Đọc thì hiểu sơ sơ, đúng là lý thuyết thấy đơn giản quá. Nhưng khi thực hiện cả một vấn đề
     
  10. Boss Moderator

    Số bài viết: 1,550
    Đã được thích: 883
    Điểm thành tích: 373
    Web:
    Không đơn giản như mình nghĩ (y)
     
  11. phuongleno1 Thành Viên

    Số bài viết: 34
    Đã được thích: 1
    Điểm thành tích: 8
    Web:
    Nhìn web của gg đơn giản nhất nhưng cơ chế hoạt động thế này thì đúng thật k tưởng tượng dc
     
  12. maimai Thành Viên Tiêu Biểu

    Số bài viết: 185
    Đã được thích: 5
    Điểm thành tích: 18
    Web:
    trên lí thuyết thì vậy thôi chứ không đơn giản như mình nghĩ
     
  13. aloduasap Thành Viên Mới

    Số bài viết: 2
    Đã được thích: 0
    Điểm thành tích: 1
    Web:
    google là cổ máy rất lớn và nó cực kì thông minh. Trên lý thuyết là vậy, cơ chế hoạt động của nó rất đa dạng và theo nhiều thuật toán phức tạp.
     
  14. trochoisq Thành Viên Tiêu Biểu

    Số bài viết: 125
    Đã được thích: 5
    Điểm thành tích: 18
    Web:
    Như vậy đúng là phải nghiên cứu kĩ gg để mà làm việc seo hiệu quả thôi