blog

谷歌的新索引基础设施“咖啡因”现已上线

<p>谷歌首先在2009年8月提到他们新的索引基础设施Caffeine,以便征求反馈意见,然后在11月份在一个数据中心推出它最后,它在所有地方都有效谷歌博客称它为“全新的网络索引系统”,这是“更多”比我们上一个索引更新鲜50%,它是我们提供的最大的网络内容集合“那么什么是咖啡因及其推出对搜索者和内容所有者意味着什么</p><p>谷歌网站管理员中心的Maile Ohye告诉我“整个网络正在不断扩展和发展,咖啡因意味着我们可以更好地发展它随着生态系统的改善,我们也会改进并向搜索者返回更多相关内容”Google的Matt Cutts补充说“咖啡因”对搜索者和内容所有者都有好处,因为这意味着所有内容(而不仅仅是被视为“实时”的内容)可以在几秒钟内被搜索到“其咖啡因是Google的索引基础架构的改进之后”这不是谷歌排名算法的改变它跨越所有数据中心,区域和语言的内容更快地向搜索者提供内容以前,Google的抓取和索引系统可用作批处理流程Googlebot会抓取一组页面,然后处理这些页面(从中提取内容,关联相关数据)它们,例如锚文本和外部链接,确定这些页面的内容),最后将它们添加到索引W中虽然这个系统是连续的,批处理中的所有文件都必须等到整个批处理被推送到现在,当Google抓取一个页面时,它会通过整个索引管道处理该页面并立即将其推送到这个变化已经比以前产生了50%的新鲜指数请注意,咖啡因的引入并不一定意味着页面将以比以前更快的速度被抓取它只是意味着一旦这些页面被抓取,它们就会被搜索者提供给很多更快(请记住,您可以通过查看服务器日志或检查Google中的缓存日期来估算网页抓取的频率)Google的存储容量已大大增加虽然Google的索引目前并未显着大于此前,新的索引基础设施使这成为可能这只有意义如果咖啡因旨在帮助谷歌更好地发展,那么它需要重要存储容量网络每天都在突飞猛进,当然比任何人想象的要快得多,谷歌首次推出谷歌存储文件信息的灵活性大大增加谷歌一直将各种细节与它存储的文件联系起来(在此在上下文中,“文档”指的是任何Web内容,例如网页,图像或视频)例如,当Google索引网页时,它还存储有关哪些外部页面链接到该页面以及哪些锚点的信息在这些链接中使用文本Caffeine基础结构提供了可以与文档一起存储的详细信息类型的更大灵活性随着Web的变化和有关Web内容的新的有价值数据的出现,Google将不必构建新的代码来利用这意味着虽然咖啡因本身不是排名算法的变化,但它可能影响未来的排名(因为新信号与页面相关)Matt Cutts告诉我“它”重要的是要认识到咖啡因只是我们的索引架构的一个变化但是咖啡因令人兴奋的是它允许更容易地注释存储在文档中的信息,并且随后可以利用这些附加信号释放未来更好排名的潜力“更新:在Matt在SMX Advanced的主题演讲中,他举了一个例子,说明谷歌现在可以为文件存储的其他数据他说,“你可以想象,在我们只能将一个页面与一个国家相关联之前,现在,我们可能会将该页面关联起来与几个国家“(请注意,他并不是说这是谷歌现在做的事情;只是它是新基础设施可能实现的一个例子)内容所有者如何才能最好地利用新的基础设施</p><p>内容所有者将在没有做任何事情的情况下获得咖啡因的好处事实上,如果有任何内容所有者可以做的话,实际上并不多</p><p>有些人可能想知道这种变化是否意味着现有的关于爬行效率的最佳实践比以前更重要 Google最近关注的网页速度更重要吗</p><p>谷歌告诉我,这一变化并没有使任何爬行,索引或排名因素比以前更重要或更不重要它只是让搜索结果中的爬行内容更快地提供,并为利用增加的灵活性铺平了道路随着网络的发展可能出现的任何内容本文中表达的意见是客座作者的意见,

查看所有