Jak stworzyć mapę witryny?

|
|
Kategorie: SEO

Mapa witryny to plik, w którym zgłaszamy informacje o wszystkich adresach URL, grafikach oraz innych plikach w obrębie naszego serwisu. Odpowiednio zbudowana sitemapa XML jest odczytywana przez wyszukiwarki i pomaga im w zrozumieniu struktury serwisu. Należy pamiętać, że sitemapa nie gwarantuje zaindeksowania zamieszczonych w niej adresów URL, ale znacznie ułatwia proces indeksowania witryny przez roboty.

 

Budowa sitemapy

Google potrafi obsłużyć kilka formatów map witryn. Do najczęściej wykorzystywanego sposobu zapisu mapy witryny wykorzystywany jest format XML. Poprawnie skonstruowana w XML mapa powinna być zakodowana w formacie UTF-8, a adresy URL powinny zawierać odpowiednie kody zmiany znaczenia (ucieczki). Więcej informacji na temat prawidłowego projektowania mapy witryny znajduje się na stronie:

https://www.sitemaps.org/pl/protocol.html

Przykładowy fragment mapy witryny w formacie XML:


<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

 

Dobre praktyki dotyczące tworzenia sitemap

Poniżej znajduje się kilka elementów, na które warto zwrócić uwagę przy projektowaniu sitemapy:

 

Adresy powinny zwracać kod odpowiedzi serwera 200

Zgłaszamy jedynie adresy, które zwracają kod odpowiedzi 200 i są kanoniczne. Należy sprawdzić, czy zgłaszane przez nas do sitemapy adresy URL posiadają odpowiedni protokół (http://, https://) oraz czy chcemy dodać stronę z przedrostkiem (z www, bez www).

 

Adresy URL z unikalną treścią

Należy pamiętać, aby adresy URL zgłaszane do sitemapy były dla robota Google wartościowe. Nie powinniśmy umieszczać w mapie witryny stron, które:

  • posiadają tagi kanoniczne do innych adresów URL w obrębie naszej witryny
  • są wynikiem różnego rodzaju sortowania (A-Z, Z-A, od najtańszego itd.)
  • niektórych adresów powstałych przy pomocy filtrowania strony: np. kategorii sklepu z uwzględnieniem filtra „dostępność”
  • w zależności od danego serwisu oraz wybranej strategii powinniśmy przemyśleć umieszczanie stron stronicowania (paginacji) w sitemapie

 

Dzielenie sitemap na poszczególne sekcje

Dobrą praktyką w projektowaniu sitemap jest dzielenie ich na mniejsze sekcje, np. w przypadku rozbudowanego sklepu internetowego tworzenie osobnych sitemap dla:

  • produktów
  • kategorii
  • wpisów blogowych
  • stron statycznych

Taki podział pomoże nam w ustaleniu, w jakim procencie dana sekcja strony jest indeksowana przez Googlebota i pozwoli w szybki sposób zadziałać prewencyjnie w przypadku niskiej indeksacji w danym obszarze.

 

Dzielenie dużych map na mniejsze

Maksymalny rozmiar sitemapy obsługiwany przez Google:

  • 50 000 adresów URL w jednej sitemapie
  • 50 MB po zdekompresowaniu

Jeżeli rozmiar mapy strony przekracza te wartości, można podzielić ją na mniejsze części. W przypadku takiego rozwiązania warto zgrupować wszystkie mapy witryn w jednym zbiorczym indeksie, tzn. indeksie map witryn. Więcej informacji o budowie i możliwości wykorzystania indeksu:

https://support.google.com/webmasters/answer/75712?visit_id=636753605101018405-1106482775&rd=1

Dodatkowo z poziomu sitemapy możemy poinformować wyszukiwarki o:

 

Różnych wariantach językowych strony

W przypadku istnienia w serwisie różnych wariantów językowych z poziomu mapy witryny możemy wskazać robotom wyszukiwarek alternatywne adresy stron i ich powiązanie. W mapie powinny znaleźć się informacje definiujące poszczególne wersje językowe lub regionalne. Więcej informacji dotyczących budowania i informowania robotów o innych wersjach językowych:

https://support.google.com/webmasters/answer/189077

 

Osobnej wersji mobilnej strony

W przypadku różnych adresów URL dla strony mobilnej i strony desktopowej w sitemapie powinniśmy umieścić jedynie adresy podstawowej wersji strony (komputer).
Jej alternatywną wersję (mobile) możemy umieścić w adnotacji rel=”alternate”.

Przykład fragmentu sitemapy z uwzględnieniem alternatywnych stron mobilnych:

<url>
<loc>http://www.example.com/page-1/</loc>
<xhtml:link
rel=”alternate”
media=”only screen and (max-width: 640px)”
href=”http://m.example.com/page-1″ />
</url>

 

Zgłaszanie sitemapy

Po poprawnym zbudowaniu sitemapy zgodnie z wcześniejszymi dobrymi praktykami należy poinformować roboty wyszukiwarek o jej istnieniu. Najlepiej zrobić to poprzez Google Search Console:

 

  • Stara wersja Google Search Console

W przypadku starej wersji GSC należy wejść w kartę:
SKANOWANIE MAPY WITRYNY
W prawym górnym rogu widoczny jest przycisk:

Po naciśnięciu przycisku pojawi się okienko z możliwością przetestowania oraz dodania mapy witryny do naszego GSC.

  • Nowa wersja Google Search Console

W nowej wersji GSC wchodzimy w kartę „MAPY WITRYNY”, gdzie w jej górnej części mamy możliwość dodania mapy:

Dodatkową rekomendowaną metodą informowania robota Google o istnieniu sitemapy jest umieszczenie jej w pliku robots.txt. Dodajemy ją w dowolnym miejscu w pliku,
w postaci dodatkowej linii:

Sitemap: http://example.com/lokalizacja_mapy_witryny.xml

 

Sprawdzanie skuteczności mapy witryny

W starej wersji Google Search Console w sekcji „Mapy witryn” otrzymujemy informację o skuteczności indeksacji, czyli zestawienie liczby zaindeksowanych stron z liczbą adresów zgłoszonych. Jeśli posiadamy sitemapę podzieloną na mniejsze partie/sekcje możemy sprawdzić, które ze stron indeksują się lepiej, a które gorzej, i próbować wyciągnąć na tej podstawie wnioski dotyczące jakości niezaindeksowanych stron oraz działać naprawczo w celu zmiany tego trendu.

W nowej wersji GSC znajdziemy informacje dotyczące problemów z indeksowaniem stron w mapach witryn, m.in. o:

  • błędach serwera (5xx)
  • błędach (404)
  • adresach zawierających błędy indeksowania
  • zawierających tag „noindex”
  • adresach URL blokowanych przez plik robots.txt

Jeśli nasza mapa witryny posiada któryś z tych problemów, powinniśmy się im bliżej przyjrzeć i poprawić lub usunąć z sitemapy, te strony, które je wywołują. Po poprawkach, usuwamy starą sitemapę z Google Search Console i zastępujemy jej poprawioną wersją, tak aby usprawnić indeksację stron przez robota wyszukiwarki.

Podsumowując, sitemapa XML jest dokumentem bardzo pomocnym przy odczytywaniu i indeksowaniu strony przez wyszukiwarki, choć sama nie gwarantuje indeksacji wszystkich adresów w niej zgłoszonych. Odpowiednie zaprojektowanie i stworzenie mapy witryny jest niezwykle ważne, aby po zgłoszeniu jej w Google Search Console można było wyciągać wartościowe wnioski dotyczące kondycji strony. Szczególnie rekomendowana jest w przypadku dużych serwisów, których wielkość mierzona jest w tysiącach stron.

 

Komentarze do artykułu: Jak stworzyć mapę witryny?