当前位置:首页>> 网站优化知识>> 网站优化知识

全文搜索

精华导读

·网站知识:虚拟中的真实:虚拟主机应用初探
·如何做好互联网的策划
·自动分词与中文搜索引擎
·网页文章的优化
·网站的一些基础小知识
·把网站变成卖场
·细说选择.cn域名的七大理由
·网站性感域名十大原则
·大型商务网站的SEO优化误区
·导致搜索引擎收录困难的5种原因
·网站建设中meta标签之详解
·网页制作中Web网页安全色谱
·网页设计中HTML常范的五个错误
·如何建立网站地图(site map)
·网站建设时如何选购虚拟主机?
·中国国家顶级域名和国际域名有什么区别?
·企业建设网站域名可以使用哪些字?
·建设网站时企业如何准备建网站资料?
·DIV+CSS建立标准WEB网页的好处

最新发表

·新网站排名不稳定的google幽灵现象
·网站优化技术:网站推广完全手册
·网站优化技术:新手一个月轻松打造3000IP的小站
·网站优化:你了解百度蜘蛛吗?
·百度的收录和清除站点规则解密
·网站推广之如何炒红你的网站
·网站优化:Google排名不是简单的网页优化
·增强网站链接推广策略有效性的途径
·阿里巴巴网站的搜索引擎优化案例分析
·实战JSP进阶编程之二:最简单的DAO
·好文共享:实战JSP进阶编程之一
·在JSP环境中配置使用fckeditor详细讲解
·Java中计算任意2个日期之间的工作天数
·jsp经典:从追MM谈Java的23种设计模式
·jsp如何使用Spring来管理Struts中的Action
·J2ME开发经验:J2ME应用程序内存优化三招
·利用WebSphere创建和管理ESB解决方案
·在ASP.NET 2.0中建立站点导航层次
·在ASP.NET中利用VWD操作数据库简介

巧妙应对内容复制---Google官方博文

文章来源:网站优化 文章编辑:admin 添加时间:2009-1-15 10:04:08

  前些日子,在冰天雪地的芝加哥举行的搜索引擎战略大会上,很多Google Fans询问内容复制的问题。对于这个话题来说,它只存在一些非常细小的差别而且特别容易让人混淆,所以有的时候,我们不得不为此去直接处理索引结果。
   
    什么是内容复制?
    内容复制通常是指同一域名或者跨域名之间的大段内容完全一样或者非常近似。 在大部分时间内,在本质上我们认为它是无意的或者不坏恶意的:比如正规的论坛、专为手机服务的网页等等,他们总会产生不同的URL和糟糕至极的链接。在一 些案例中,跨域名的内容复制要么企图欺骗搜索引擎而获得好的排名,要么期望获得更多的流量和长尾查询。

    什么不是内容复制?
    尽管我们提供了本文的另一个译本、但算法并不会将用英语和西班牙语写的同样内容的文章作为内容复制。简单的说,不必担心偶尔的片断使用(引用或者其他)会被标记为内容复制。
   
    为什么Google如此关心内容复制?
    当用户进行搜索的时候,他们强烈的希望看到同一内容的不同视角的作品。相对而言,他们会尽力去避免察看内容明显一样的结果。另外,当搜索引擎用一个繁复的Url顶替站长们创作的哪个的时候,站长们会有口难言,异常痛苦。

    对于内容复制,Google能做什么?
    在我们的抓取周期内,当保存搜索结果的时候,我们尽力去索引和显示不同内容的网页。这种过滤意味着,例如,你的网站中有一个正常的文章版本 ("regular"),也有一个复制版本("printer"), 并且你的网站没有设置robots.txt 屏蔽或者meta 标签的noindex 属性,搜索引擎只会选择其中的一个而不是全部。在我们发现的内容复制的案例中,基本不再显示这些故意欺骗排名和欺骗用户的内容,我们也会适当的调整卷入内 容复制的网站的索引和排名。然而,我们更注重过滤而不是调整排名... 所以在大量的主流案例中,站长们会发现自己的网站收录数比预期的要少。

    站长们怎样提前注意内容复制的产生?

适当的屏蔽:与其让算法自己决定,不如主动的引导搜索蜘蛛到最好的内容上去。例如,如果你不想我们索引站点内的复制内容,那么在robots.txt采用正则表达式或者disallow命令来屏蔽这些目录。 
使用301转向:如果你重构了网站,那么在.htaccess文件中采用301重定向来引导用户、Googlebot和其他的蜘蛛。 
保持一致:尽力让你的内部链接统一一致,不要采用/page、/page/、/page/index.htm 这样不同的链接。 
使用顶级域名(TLD Top Level Domain):这会帮助我们保存最恰当的文件版本,尤其在处理不同国家主体的内容上。相对于/de 或者de.example.com, 使用.de 的域名会让搜索引擎知道这是德文版本的内容。 
当心内容共享:如果你将自己的内容放到其他的网站上,一定要包含指向原文的链接。即便如此,对于每个既定搜索,基于向用户展示最适当的版本(非屏蔽)原则,我们也不能保证显示出来的是原文。 
使用webmaster工具中的域名指定属性:如果其他的网站使用www版本的和非www版本的URL来链接你,你应该让搜索引擎了解你希望搜索引擎抓取的域名地址。 
减少重复文本:例如,使用指向详细细节的概要描述链接来代替每个底页冗长的使用协议。 
避免内容碎片:用户不希望看到空空的网页,所以尽可能的避免使用占位符。不要未经过任何审核就发布内容,不要建立不存在的内容列表等等,这样用户和搜索引擎就不会看到根本不存在的内容。 
了解你的CMS系统:确保相关人员非常熟悉发布网站内容的流程,尤其是包含了博客、论坛或者相关系统的CMS软件,他们常常以多种形式来显示相同的内容。 
不要过分忧虑,积极一些:如果你发现了内容复制并且想阻止它,最好向DMCA声明内容版权,这样我们就会处理这些流氓网站.

    简单的说,对于内容复制来说,最常用的方法就是预防性的维护,这会帮助搜索引擎向用户提供单一的和相关的内容。

[ ]

首页 评论 打印 刷新 返回顶部 关闭
【相关文章】  【相关评论】
新网站排名不稳定的google幽灵现象
网站优化技术:网站推广完全手册
网站优化技术:新手一个月轻松打造3000IP的小站
网站优化:你了解百度蜘蛛吗?
百度的收录和清除站点规则解密