重复内容:原因及解决方案

像 Google 这样的搜索引擎有一个问题,即“重复内容”。重复内容意味着相似的内容出现在网络上的多个位置(URL),因此搜索引擎不知道在搜索结果中显示哪个 URL。这可能会损害网页的排名,当人们开始链接到相同内容的不同版本时,问题只会变得更糟。本文将帮助您了解重复内容的各种原因,并找到每种原因的解决方案。

  • 什么是重复内容?
    • 让我们用一个例子来说明这一点
  • 为什么要防止网站上出现重复内容?
  • 重复内容的原因
    • 误解 URL 的概念
    • 会话 ID
    • 用于跟踪和排序的 URL 参数
    • 爬虫和内容联合
    • 参数顺序
    • 评论分页
    • 适合打印的页面
    • WWW 与非 WWW
  • 概念解决方案:‘规范’ URL
  • 识别重复内容问题
  • 重复内容的实用解决方案
    • 避免重复内容
    • 301 重定向重复内容
    • 使用链接
    • 链接回原始内容
  • 结论:重复内容是可以修复的,而且应该修复
    • 评估你的技术 SEO 适应性

什么是重复内容?

息可以帮助机构发 Fili 数据 现欺诈活 动并 更准确地判断信用风险。医疗保健:详细的受影响者信息使医疗保健公司能够识别健康特征、个性化治疗方案并提高标准护理质量。营销:在广告和营销中,fili 统计数据使组织能够更精细地了解购买者的行为,从而实现更有效的活动并提高客户参与度。

重复内容是指网络上多个 URL 上都存在的内容。由于多个 URL 显示相同的内容,搜索引擎不知道哪个 URL 应该在搜索结果中排名靠前。因此,它们可能会降低这两个 URL 的排名,并优先考虑其他网页。

在本文中,我们将主要关注重复内容的技术原因及其解决方案。如果您想更广泛地了解重复内容,并了解它与复制或抓取的内容甚至关键字蚕食的关系,我们建议您阅读这篇文章:什么是重复内容。

让我们用一个例子来说明这一点

重复内容就像站在十字路口,路标指向同一个目的地,但指向两个不同的方向:你应该走哪条路?更糟糕的是,最终目的地也不同,但差别很小。作为读者,如果你仍然得到你想要的答案,你可能不介意,但搜索引擎必须选择在搜索结果中显示哪个页面,因为它当然不想显示两次相同的内容。

假设您关于 “关键字 x”的文章 出现 而相同的内容也出现在 这种情况并非虚构:它发生在许多现代内容管理系统 (CMS) 中。然后假设您的文章已被多位博主选中,其中一些链接到第一个 URL,而另一些链接到第二个 URL。这时搜索引擎的问题就显露出来了:这是 您的 问题。重复的内容是您的问题,因为这些链接都推广了不同的 URL。如果它们都链接到同一个 URL,那么您对 “关键字 x”进行排名的机会 就会更高。

如果您不知道您的网站是否存在重复内容问题,这些重复内容发现工具将帮助您找出答案!

为什么要防止网站上出现重复内容?

重复的内容会损害您的排名 了解满足客户并提高保留率的 10 种策略 至少,搜索引擎不知道该向用户推荐哪个页面。因此,搜索引擎认为重复的所有页面都有排名降低的风险。这是最好的情况。如果您的重复内容问题非常严重,例如,如果您的内容非常单薄,并且逐字逐句地复制内容,您甚至可能会因试图欺骗用户而面临 Google 的手动操作。因此,如果您希望内容排名靠前,那么确保每个页面都提供大量独特内容非常重要。

不过,这不仅仅是搜索引擎的问题。如果您的用户正在搜索特定页面,如果他们找不到他们想要的东西,他们会非常沮丧。因此,与 SEO 的许多方面一样,处理重复内容问题对于用户体验和搜索都很重要。

重复内容的原因

内容重复的原因有几十种。其中大多数是技 br 号码列表 术原因:人们很少会决定将相同的内容放在两个不同的地方,而不明确哪个是原始内容。当然,除非你克隆了一篇文章并无意中发布了它。但除此之外,对我们大多数人来说,这感觉很不自然。

不过,这有很多技术原因,而最主要的原因是开发人员的思维方式不像浏览器,甚至不像用户,更不用说搜索引擎蜘蛛了——他们像程序员一样思考。以我们之前提到的那篇文章为例,它出现在 。如果你问开发人员,他们会说它只存在一次。

误解 URL 的概念

不,那个开发人员并没有疯,他们只是说着不同的语言。CMS 可能会为网站提供支持,并且数据库中只有一篇文章,但网站的软件只允许通过多个 URL 检索数据库中的同一篇文章。这是因为,在开发人员看来,该文章的唯一标识符是该文章在数据库中的 ID,而不是 URL。但对于搜索引擎来说,URL 是内容的唯一标识符。如果你向开发人员解释这一点,他们就会开始明白问题所在。读完这篇文章后,你甚至可以立即为他们提供解决方案。

会话 ID

您经常想要跟踪访问者,并允许他们将想要购买的商品存放在购物车中。为此,您必须为他们提供“会话”。会话是访问者在您网站上所做操作的简要历史记录,可以包含购物车中的商品等内容。为了在访问者从一个页面点击到另一个页面时保持该会话,需要将该会话的唯一标识符(称为会话 ID)存储在某个地方。最常见的解决方案是使用 cookie。但是,搜索引擎通常不存储 cookie。

此时,某些系统会回退到使用 URL 中的会话 ID。这意味着网站上的每个内部链接都会将该会话 ID 添加到其 URL 中,并且由于该会话 ID 对于该会话是唯一的,因此它会创建一个新的 URL,从而产生重复内容。

用于跟踪和排序的 URL 参数

造成重复内容的另一个原因是使用不会改变页面内容的 URL 参数,例如跟踪链接。你看,对于搜索引擎来说,这两个 URL 并不相同。后者可能允许你跟踪人们来自哪个来源, 也可能使你更难获得良好的排名——这是一个非常不受欢迎的副作用!

当然,这不仅仅适用于跟踪参数。它适用于您可以添加到 URL 的每个参数,这些参数不会更改重要内容,无论该参数是用于“更改一组产品的排序”还是用于“显示另一个侧边栏”:它们都会导致重复内容。

爬虫和内容联合

重复内容的大部分原因都是您或您的网站的“错误”。但是,有时其他网站会使用您的内容,无论是否征得您的同意。他们并不总是链接到您的原始文章,因此搜索引擎无法“获取”它,并且必须处理同一篇文章的另一个版本。您的网站越受欢迎,您就会获得越多的抓取工具,从而使这个问题变得越来越严重。

参数顺序

另一个常见原因是 CMS 未使用干净整洁的 URL,而是使 其中 ID 指的是文章,cat 指的是类别。该 U 大多数网站系统中都会呈现相同的结果,但对于搜索引擎来说,它们完全不同。

评论分页

在我喜爱的 WordPress 中,以及在其他一些系统中,都有一个选项可以对评论进行分页。这会导致内容在文章 URL 以及文章 U  等之间重复。

适合打印的页面

如果您的内容管理系统创建了适合打印的页面,并且您从文章页面链接到这些页面,Google 通常会找到它们,除非您明确阻止它们。现在,问问自己:您希望 Google 显示哪个版本?包含您的广告和周边内容的版本,还是仅显示您的文章的版本?

WWW 与非 WWW

这是书中最古老的问题之一,但有时搜索引擎仍然会出错:当您的网站的两个版本都可以访问时,  与非 WWW 重复内容。另一种不太常见但我也见过的情况是  复内容,其中相同的内容在两个版本上提供。

概念解决方案:‘规范’ URL

讽刺的旁注

正典一词源自罗马天主教传统,当时人们创建了一份圣书清单,并接受其为真书。它们被称为《新约》的正典福音书。讽刺的是,罗马天主教会花了大约 300 年的时间,经过无数次斗争才制定出这份正典清单,最终他们选择了 同一个故事的四个版本……

正如我们已经看到的,多个 URL 指向相同内容是一个问题,但这个问题是可以解决的。在出版物工作的一个人通常可以很容易地告诉你某篇文章的“正确”URL 应该是什么,但有时当你问同一家公司的三个人时,你会得到三个不同的答案……

这是一个需要解决的问题,因为最终只能有一个 (URL)。 搜索引擎将内容的“正确”URL 称为规范 URL 。

识别重复内容问题

您可能不知道您的网站或内容是否存在重复内容问题。使用 Google 是发现重复内容的最简单方法之一。

在这种情况下,有几种 搜索运算符 非常有用。如果您想要查找网站上包含 关键字 X 文章的所有 URL,您可以在 Google 中输入以下搜索短语:

 您显示 上包含该关键字的所有页面。查询的该部分越具体 ,清除重复内容就越容易。您可以使用相同 

Google 会向您显示与该标题匹配的所有网站。有时甚至值得从您的文章中搜索一两个完整的句子,因为一些抓取工具可能会更改标题。在某些情况下,当您进行这样的搜索时,Google 可能会在结果的最后一页显示这样的通知:

 

这表明 Google 已开始“去重”搜索结果。效果仍然不佳,因此值得点击链接并查看所有其他结果,看看是否可以修复其中的一些问题。

 

 

滚动至顶部