정규화 및 중복 콘텐츠

게시 됨: 2023-05-13

Canonicalization and Duplicate Content | A Full Of Colorful Jewels

대부분의 사람들은 서로 다르지만 유사한 버전의 웹 사이트로 연결되는 여러 버전의 URL을 가지고 있습니다. 여기에는 몇 가지 이유가 있습니다. 첫째, 사이트 소유자는 여러 요소를 분할 테스트하거나 소셜 미디어 사이트와 같은 다른 위치에서 트래픽을 추적할 수 있습니다.

이로부터 몇 가지 질문이 생깁니다. 첫째, 어떤 웹사이트 버전이 인덱싱되어 Google이 검색자가 볼 수 있도록 결과 페이지에 표시되는 버전이 됩니까? Google은 어떤 버전이 SERP에서 순위를 매기는 기본 또는 "표준" 버전인지 결정할 때 무엇을 봅니까? 사이트 소유자는 이러한 중복 콘텐츠 페이지에 대해 불이익을 받습니까?

이 프로세스를 정규화, 정규화 또는 표준화라고 하며 오늘 이러한 질문에 답하고 보다 정확한 정규화 개념을 알려드리겠습니다. 기본 사항, Google에서 확인하는 신호에 대해 자세히 살펴보고 여러 사이트 버전과 중복 콘텐츠가 사용되는 예시 시나리오를 살펴보겠습니다. 이는 필수 정보일 뿐이므로 추가 정보가 필요하거나 정규화 문제에 대한 도움이 필요한 경우 화이트 라벨 SEO 서비스에 문의하십시오.

뛰어들자!

화이트 라벨 SEO 전문가를 찾고 계십니까? 지금 문의하세요!

정식 태그

The Canonical Tag | An Arrow Pointing To A WebsIte 표준 태그는 페이지 코드 또는 HTTP 헤더의 "<head>" 섹션에 입력할 수 있는 코드입니다. 이렇게 하면 검색 엔진에 이 버전의 URL이 순위를 매기려는 URL임을 알립니다. 즉, Google이 검색자에게 표시하는 URL입니다. 검색 엔진이 웹 사이트를 크롤링하고 이러한 태그를 포함하여 중복되거나 유사한 콘텐츠를 발견하면 하나의 URL 버전이 색인 생성을 선호하는 것임을 명확히 합니다.

다음과 같이 표시됩니다.

<link rel=”표준” https://www.yourwebsitehere.com />

(코드를 올바르게 입력하고 닫았는지 확인하십시오.)

그러나 이것은 Google이 확인하는 다른 신호 중 하나일 뿐이라는 점은 주목할 가치가 있습니다. Google은 여러 요소를 살펴보고 다른 신호를 위해 표준 태그를 간과할 수도 있습니다.

정규화 신호

그렇다면 Google은 어떤 URL이 "표준" 버전인지 어떻게 결정합니까?

Google의 John Mueller는 표준 URL을 선택할 때 두 가지 일반적인 지침이 있다고 설명합니다.

  1. 사이트 기본 설정 – 사이트에서 Google에 원하는 표준 URL을 알려주는 것
  2. 사용자 기본 설정 – Google이 검색자에게 더 유익하다고 판단하는 URL

사이트 선호도와 관련하여 Google에서 살펴보는 사항:

  • 정식 태그(link rel canonical)
  • 사이트맵 파일에 있는 URL
  • 내부 연결
  • 리디렉션
  • HTTPS URL
  • 더 보기 좋고 깨끗해 보이는 URL

Mueller는 이러한 모든 요소를 ​​고려하고 어떤 URL이 이러한 요소를 가장 잘 통합하는지에 따라 표준 요소를 선택한다고 말합니다. 그는 또한 사이트 소유자에게 검색자에게 표시할 URL을 선호하는 경우 이러한 기본 설정을 웹 사이트 전체에 일관되게 적용해야 한다고 조언합니다. 다시 말하지만, 화이트 라벨 로컬 SEO는 이 영역에 리소스가 제한되어 있는 경우에 유용합니다.

정식화 프로세스의 다른 요인에는 중복, 외부 링크 및 Hreflang이 포함됩니다.

Google은 여러 요소를 살펴보고 다른 신호를 위해 표준 태그를 간과할 수도 있습니다. 트윗하려면 클릭

중복 콘텐츠

Duplicate Content | A Laptop That Has An Image Of A Spaceship 중복되거나 매우 유사한 콘텐츠는 의도적이든 아니든 다양한 이유로 존재할 수 있으며 순위 지정 시 많은 문제를 일으킬 수 있습니다. 정규화는 이러한 문제를 완화할 수 있습니다. 중복 콘텐츠 자체가 페널티를 받지는 않지만 결과가 전혀 없는 것은 아닙니다.

주로 중복 콘텐츠는 올바른 사이트 페이지가 결과 페이지에 표시되는 것을 지연시킬 수 있습니다. 예를 들어, 정확한 키워드에 대해 순위가 매겨진 두 개의 유사한 페이지가 있는 경우 경쟁할 수 있거나 SERP에 배치할 페이지를 결정하는 데 Google 시간이 걸립니다. Google이 접근하더라도 사용자가 선호하는 버전이나 더 많은 노력을 기울인 버전이 표시되지 않을 수 있습니다. Google은 최고의 사용자 경험을 제공하는 페이지를 식별하는 데 점점 더 능숙해지고 있습니다. 그럼에도 가치 있는 콘텐츠는 이쑤시개 더미 속의 바늘처럼 형태는 비슷하지만 본질은 아닌 과도한 복제물 아래 묻힐 수 있습니다. 정규화 사례를 통해 이 프로세스를 간소화할 수 있습니다.

Google의 중복 정규화 규칙

URL 측면에서 Google은 더 길고 매개변수가 포함된 버전보다 더 깔끔하고 짧은 URL 버전을 선택하는 경우가 많습니다. 또한 Google은 종종 사이트의 HTTP 버전보다 HTTPS를 선호합니다.

Google은 페이지에서 중복 콘텐츠를 발견하면 색인을 생성할 표준 버전을 선택합니다. 이것은 최고로 결정되는 버전이 될 것입니다. 중복으로 식별되는 모든 페이지는 페이지 클러스터를 형성합니다. 신호는 해당 클러스터 내의 페이지로 전송되며 선택한 표준을 가리키는 통합자 역할을 합니다. Google이 결정하는 표준은 Google 순위 및 인덱싱 요인에 따라 시간이 지남에 따라 여전히 변경될 수 있습니다.

다음은 페이지의 중복 콘텐츠 또는 정규화 문제로 간주되는 사례의 몇 가지 예입니다.

  • "www."가 포함된 URL vs. 없는 사람
  • URL에 대문자가 있거나 없는 경우 – 가능한 한 소문자를 사용하는 것이 좋습니다.
  • 웹 주소 끝에 슬래시 "/"가 있는 URL과 없는 URL
  • 스크랩했거나 신디케이트된 콘텐츠가 포함된 페이지의 URL - 스크래핑은 불법이지만 원래 소유자에게 연결하면 콘텐츠 신디케이션이 허용됩니다. Google이 원본 사이트가 아닌 표준 버전으로 URL을 선택하면 신디케이션이 문제가 됩니다. 이것은 더 높은 수준의 콘텐츠 도용이며 이런 일이 발생하면 분류해야 합니다.
  • "index.html"이 있거나 없는 URL.
  • 동일한 콘텐츠를 포함하는 URL 위치 변형
  • 휴대기기용 URL
  • 소셜 미디어 사이트에서 리디렉션되는 URL 버전
  • URL 매개변수는 페이지 콘텐츠 변경 여부와 관계없이 패싯 탐색, 추적 코드, 세션 ID, 콘텐츠 정렬 등과 ​​같은 URL 끝에 추가됩니다.
  • 다른 페이지와 동일한 전체 콘텐츠를 표시하는 모든 페이지는 Google에 혼동을 줄 수 있으며 블로그의 기본 페이지, 카테고리 페이지, 태그 페이지, 페이지가 매겨진 페이지 또는 피드 페이지를 포함하여 잘못된 표준이 선택될 수 있습니다.

사이트 선호도와 관련하여 일관성이 매우 중요하다는 점을 기억하십시오. 중복 콘텐츠 및 정규화 문제를 최소화하려면 URL을 가능한 한 균일하게 구성하세요.

정식화 및 중복 콘텐츠에 대해 자세히 알아보세요! 지금 전화주세요!

Hreflang

Rules | A Chalkboard With Letters In It Hreflang은 일부 사이트에서 중복 문제를 해결할 수 있지만 해외 사이트에서는 작동하지 않습니다. 기본적으로 Google은 올바른 웹사이트 버전으로 이동하여 로컬 버전으로 전환하려고 시도합니다. 그러나 로컬 버전이 주요 사이트가 아니며 문제를 일으킬 수 있기 때문에 항상 작동하는 것은 아닙니다. 그렇다면 사용자는 다른 국가의 사용자를 위한 웹사이트 페이지를 받게 됩니다. Google 시스템이 이를 제대로 분류하도록 설정되지 않았기 때문에 웹사이트 소유자는 예를 들어 콘텐츠가 단순 번역인 경우에도 최소한 약간 다른 콘텐츠가 포함된 다국어 페이지를 게시하도록 권장됩니다.

일반적으로 앱 셸 모델을 기반으로 구축된 JavaScript 사이트의 경우 페이지에 처음 나타나는 코드는 다른 페이지와 매우 유사하게 읽을 수 있으며 다양한 웹사이트의 코드도 읽을 수 있습니다. 이 때문에 페이지는 때때로 다른 페이지 클러스터(즉, 다른 웹 사이트)의 일부로 또는 동일한 도메인 수준의 다른 페이지로 정규화될 수 있습니다.

Google은 알고리즘을 사용하며 대부분 자동 주기에서 중복 검색을 실행한다는 점을 기억하세요. 이것은 문제의 일부일 수 있습니다. Google이 코드를 보고 페이지를 중복으로 태그하고 완전히 크롤링하지 않으면 HTML 콘텐츠를 기반으로 하는 다른 페이지처럼 보이기 때문에 페이지를 올바르게 교체하지 못할 수 있습니다. 이는 이미 중복으로 태그가 지정되었기 때문에 페이지 렌더링이 지연됨을 의미합니다. 귀하의 화이트 라벨 전문가로서 당사는 화이트 라벨 디지털 광고 및 SEO 서비스를 도와드릴 수 있습니다.