Cho biết cú pháp tìm nội dung ở trang web zing vn trên Google

DOWNLOAD800 CÂU HỎI ÔN TẬP TIN HỌC ĐẠI CƯƠNG CÓ ĐÁP ÁN

ĐỀ SỐ 04

:

Nộp Bài >

Google là một công cụ tìm kiếm hoàn toàn tự động. Google sử dụng những phần mềm được gọi là trình thu thập dữ liệu web có chức năng thường xuyên khám phá trên web nhằm tìm các trang web để thêm vào chỉ mục của chúng tôi. Trên thực tế, rất ít trang web xuất hiện trong các kết quả tìm kiếm của chúng tôi là do được gửi theo cách thủ công. Phần lớn các trang web được tự động tìm thấy và thêm vào kết quả khi trình thu thập dữ liệu web của chúng tôi thu thập dữ liệu trên web.

Google Tìm kiếm hoạt động theo ba giai đoạn cơ bản:

  • Thu thập dữ liệu: Google sử dụng các chương trình tự động [gọi là trình thu thập dữ liệu] để tìm kiếm các trang mới hoặc vừa cập nhật trên web. Google lưu trữ địa chỉ của những trang đó [hay URL của trang] trong một danh sách lớn để sau này xem lại. Chúng tôi dùng nhiều phương pháp để tìm trang, nhưng phương pháp chính là đi theo các đường liên kết trên những trang mà chúng tôi đã biết.
  • Lập chỉ mục: Google truy cập các trang đã biết bằng cách thu thập dữ liệu và cố gắng phân tích nội dung trên mỗi trang. Google phân tích nội dung, hình ảnh và các tệp video trên mỗi trang để nắm được nội dung của trang đó. Thông tin này được lưu trữ trong Chỉ mục của Google, một cơ sở dữ liệu khổng lồ được lưu trữ trên nhiều máy tính.
  • Phân phát kết quả tìm kiếm: Khi người dùng tìm kiếm trên Google, Google sẽ cố gắng xác định những kết quả có chất lượng cao nhất. Kết quả "tốt nhất" phụ thuộc vào nhiều yếu tố, trong đó có vị trí, ngôn ngữ, thiết bị của người dùng [máy tính hoặc điện thoại] và những cụm từ họ từng tìm kiếm. Ví dụ: khi tìm kiếm cùng một cụm từ là "cửa hàng sửa xe đạp", người dùng ở Paris và người dùng ở Hong Kong sẽ nhận được những câu trả lời khác nhau. Google không nhận tiền để tăng thứ hạng của trang. Việc xếp hạng là do thuật toán thực hiện.

Nếu quan tâm, bạn có thể tham khảo thêm chút thông tin về cách thức hoạt động của Tìm kiếm. Cũng có một phiên bản dài hơn nữa về cách thức hoạt động của Google Tìm kiếm.

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2022-03-16 UTC.

[{ "type": "thumb-down", "id": "missingTheInformationINeed", "label":"Missing the information I need" },{ "type": "thumb-down", "id": "tooComplicatedTooManySteps", "label":"Too complicated / too many steps" },{ "type": "thumb-down", "id": "outOfDate", "label":"Out of date" },{ "type": "thumb-down", "id": "translationIssue", "label":"Translation issue" },{ "type": "thumb-down", "id": "samplesCodeIssue", "label":"Samples / code issue" },{ "type": "thumb-down", "id": "otherDown", "label":"Other" }] [{ "type": "thumb-up", "id": "easyToUnderstand", "label":"Easy to understand" },{ "type": "thumb-up", "id": "solvedMyProblem", "label":"Solved my problem" },{ "type": "thumb-up", "id": "otherUp", "label":"Other" }]

Google lấy thông tin từ nhiều nguồn, bao gồm:

  • Các trang web
  • Nội dung do người dùng gửi, chẳng hạn như Trang doanh nghiệp của bạn và nội dung người dùng gửi trên Google Maps
  • Nội dung quét từ sách
  • Các cơ sở dữ liệu công khai trên Internet
  • Nhiều nguồn khác

Tuy nhiên, trang này tập trung vào nguồn thông tin là các trang web. Google thực hiện ba bước cơ bản để tạo kết quả từ các trang web:

  • Thu thập dữ liệu
  • Lập chỉ mục
  • Phân phát [và xếp hạng]

Thu thập dữ liệu

Bước đầu tiên là tìm những trang tồn tại trên web. Do không tồn tại một danh mục trung tâm về mọi trang web, Google phải liên tục tìm những trang mới và thêm những trang đó vào danh sách các trang đã biết. Google biết đến một số trang vì chúng tôi từng truy cập những trang đó. Google tìm thấy các trang khác khi đi theo đường liên kết từ một trang đã biết đến một trang mới. Ngoài ra, chúng tôi cũng phát hiện một số trang khác khi chủ sở hữu trang web gửi danh sách các trang [sơ đồ trang web] để Google thu thập dữ liệu. Nếu bạn đang sử dụng một nhà cung cấp dịch vụ lưu trữ web có người quản lý [chẳng hạn như Wix hoặc Blogger], thì họ có thể yêu cầu Google thu thập dữ liệu mọi trang bạn mới tạo hoặc cập nhật.

Khi phát hiện ra URL của một trang, Google sẽ truy cập hoặc thu thập dữ liệu trang đó để tìm hiểu nội dung trên trang. Google hiển thị trang và phân tích cả nội dung văn bản lẫn nội dung không phải văn bản cũng như bố cục trực quan tổng thể để quyết định vị trí mà trang có thể xuất hiện trong kết quả của Google Tìm kiếm. Càng hiểu rõ về trang web của bạn thì Google càng có thể hiển thị trang cho những người phù hợp, đang tìm kiếm nội dung của bạn.

Cách cải thiện kết quả thu thập dữ liệu trang web:

  • Xác minh rằng Google có thể truy cập các trang trên trang web của bạn và những trang đó hiển thị đúng cách. Google truy cập các trang web dưới dạng người dùng ẩn danh [người dùng không có mật khẩu hoặc thông tin]. Google phải có khả năng xem tất cả hình ảnh và các phần tử khác của trang để có thể hiểu đúng nội dung trên trang. Bạn có thể kiểm tra nhanh bằng cách nhập URL của trang vào Công cụ kiểm tra tính thân thiện với thiết bị di động.
  • Nếu đã tạo hoặc cập nhật một trang, bạn có thể gửi một URL riêng lẻ cho Google. Để thông báo cùng lúc cho Google về nhiều trang mới tạo hoặc mới cập nhật, hãy sử dụng sơ đồ trang web.
  • Nếu bạn yêu cầu Google chỉ thu thập dữ liệu một trang, hãy chỉ định trang đó làm trang chủ của bạn. Đối với Google, trang chủ là trang quan trọng nhất trên trang web của bạn. Để giúp Google thu thập dữ liệu toàn bộ trang web, hãy đảm bảo rằng trang chủ [và mọi trang khác] đều có một hệ thống điều hướng rõ ràng liên kết đến mọi phần và trang quan trọng trên trang web của bạn. Hệ thống này giúp người dùng [và Google] dễ dàng di chuyển trong trang web của bạn. Đối với các trang web nhỏ hơn [dưới 1.000 trang], bạn chỉ cần cho Google biết trang chủ, miễn là Google có thể truy cập tất cả các trang khác bằng cách đi theo đường liên kết bắt nguồn từ trang chủ.
  • Liên kết một trang khác mà Google đã biết đến trang của bạn. Tuy nhiên, xin lưu ý rằng Google sẽ không truy cập các đường liên kết trong quảng cáo, đường liên kết mà bạn trả tiền trong các trang web khác, đường liên kết trong phần nhận xét hoặc các đường liên kết khác không tuân theo Nguyên tắc quản trị trang web của Google.
Google không nhận tiền để thu thập dữ liệu thường xuyên hơn hoặc xếp hạng cao hơn cho một trang web. Nếu ai đó nói khác thì họ đã nhầm.

Lập chỉ mục

Sau khi tìm thấy một trang, Google sẽ cố gắng tìm hiểu nội dung của trang đó. Quá trình này gọi là lập chỉ mục. Google phân tích nội dung của trang, lập danh mục hình ảnh và tệp video nhúng trên trang và cố gắng tìm hiểu trang theo cách khác. Thông tin này được lưu trữ trong chỉ mục của Google – một cơ sở dữ liệu khổng lồ lưu trữ trong rất nhiều máy tính.

Cách cải thiện kết quả lập chỉ mục cho trang:

  • Tạo tiêu đề trang ngắn gọn và ý nghĩa.
  • Sử dụng tiêu đề trang để truyền đạt chủ đề của trang.
  • Sử dụng văn bản thay vì hình ảnh để truyền đạt nội dung. Google có thể hiểu một số hình ảnh và video, nhưng không hiểu rõ như đối với văn bản. Ở mức tối thiểu, hãy chú thích video và hình ảnh của bạn bằng văn bản thay thế và các thuộc tính thích hợp khác.

Phân phát [và xếp hạng]

Khi người dùng nhập một cụm từ tìm kiếm, Google sẽ cố gắng tìm câu trả lời phù hợp nhất trong chỉ mục của chúng tôi dựa trên nhiều yếu tố. Google cố gắng xác định những câu trả lời có chất lượng cao nhất và xem xét những yếu tố sẽ cung cấp trải nghiệm người dùng tốt nhất và câu trả lời phù hợp nhất, như vị trí, ngôn ngữ và thiết bị của người dùng [máy tính hay điện thoại]. Ví dụ: dù cùng tìm kiếm "cửa hàng sửa xe đạp" nhưng người dùng ở Paris và người dùng ở Hong Kong sẽ nhận được những câu trả lời khác nhau. Google không nhận tiền để xếp hạng các trang cao hơn và quy trình xếp hạng được thực hiện theo chế độ lập trình.

Cách cải thiện hoạt động phân phát và xếp hạng của bạn:

Bản mô tả chi tiết hơn nữa

Bạn muốn biết thêm thông tin chuyên sâu về cách thức hoạt động của Tìm kiếm? Hãy đọc Hướng dẫn nâng cao về cách thức hoạt động của Google Tìm kiếm.

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2022-03-04 UTC.

[{ "type": "thumb-down", "id": "missingTheInformationINeed", "label":"Missing the information I need" },{ "type": "thumb-down", "id": "tooComplicatedTooManySteps", "label":"Too complicated / too many steps" },{ "type": "thumb-down", "id": "outOfDate", "label":"Out of date" },{ "type": "thumb-down", "id": "translationIssue", "label":"Translation issue" },{ "type": "thumb-down", "id": "samplesCodeIssue", "label":"Samples / code issue" },{ "type": "thumb-down", "id": "otherDown", "label":"Other" }] [{ "type": "thumb-up", "id": "easyToUnderstand", "label":"Easy to understand" },{ "type": "thumb-up", "id": "solvedMyProblem", "label":"Solved my problem" },{ "type": "thumb-up", "id": "otherUp", "label":"Other" }]

Video liên quan

Chủ Đề