Google 如何在网络中抓取、编制索引和提供服务
当您坐在计算机前开始 Google 搜索时,整个网络的搜索结果列表几乎在一瞬间便呈现在您眼前。 Google 是如何查找与您的查询匹配的网页,又是如何确定搜索结果的顺序的?
用最简单的话来说,您可以把搜索网络想象成查看一本大书,书中庞大的索引会告诉您各种内容的具体位置。 执行 Google 搜索时,我们的程序会查看索引来决定要返回(提供)的最具相关性的结果。
提交搜索结果包含三个主要过程:
- 抓取: Google 知道您的网站吗? 我们能够找到它吗?
- 编制索引: Google 会为您的网站编制索引吗?
- 提供: 网站是否包含与用户搜索相关的良好、实用的内容?
抓取是 Googlebot 发现新的和已更新的网页的过程,这些网页将被添加到 Google 索引中。
我们使用大量的计算机来获取(或"抓取")数十亿网页。 承担获取任务的程序叫 Googlebot(也称为漫游器 (robot)、bot 或 spider)。 Googlebot 使用算法流程: 计算机程序会确定要抓取的网站、抓取频率以及从每个网站中获取的网页数量。
Google 抓取过程的起始点是一个网页网址列表,它是在之前的抓取过程中生成的,并使用网站管理员提供的 Sitemap 数据进行了扩充。 Googlebot 在访问这些网站时,会检测每个网页上的链接并将它们添加到要抓取网页的列表中。 新出现的网站、现有网站的更改和无效链接将被记录并用于更新 Google 索引。
Google 不接受为提高网站抓取频率而支付的费用。我们会将搜索业务和以盈利为目的的 AdWords 服务严格分开。
编制索引Googlebot 处理所抓取的每个网页,以便将其看到的所有字词和每个网页的位置编制到大型索引中。 此外,我们还处理包含于关键内容标记和属性中的信息,例如 Title(标题)标记和 ALT(替代)属性。 Googlebot 可以处理许多(但不是全部)类型的内容。 例如,我们无法处理大多数 Flash 文件或动态网页的内容。
提供结果用户输入查询时,我们的计算机搜索索引查找匹配网页,并返回我们认为与用户搜索最相关的结果。 相关性由 200 多个因素确定,其中之一即特定网页的
要让网站在搜索结果页获得较好的排名,很重要的一点就是确保 Google 能正确抓取您的网站并将其编入索引。 我们的网站管理员指南提供了一些有助于您避免常见问题和改善网站排名的最佳做法。
本人非常喜欢就搞到我的网站上面了。
本站主要栏目: 郑州网站优化 郑州网站建设 郑州网络公司 郑州做网站 郑州建网站
最新评论及回复