Jak generovat sitemap

Přehled nástrojů pro generování xml souborů typu sitemap. Problematika využití sitemap souborů a práce s nimi.

K čemu je na webu soubor sitemap.xml

Soubor typu sitemap využijete tehdy, když máte web se složitější sturkturou a na některé stránky nevede třeba ani jednoznačný odkaz z menu, popřípadě se generují dynamicky. Tento soubor využívají roboty vyhledávačů, které čas od času chodí na web k tomu, aby věděly, co vlastně všechno za stránky na webu je, jak často přibývají Sitemap (ilustrace)nové nebo jsou aktualizovány staré, jakou které podstránce přikládáte prioritu a jakou vlastně má která stránka url adresu.

Google poprvé představil koncept sitemap v červnu 2005, aby umožnil webmasterům publikovat seznamy stránek obsažených na jejich webech. K Google se později připojily i vyhledávače MSN (předchůdce Bingu) a Yahoo, společně začaly podporovat sitemap protokol v listopadu 2006. Verze schématu se změnila na  „Sitemap 0.90“, ovšem jednalo se jen o změnu značení, žádné změny funkcionality provedeny nebyly. Později byla podpora rozšířena o spolupráci se souborem robots.txt. Celý koncept je založen na myšlence, udělat web co nejjednodušeji přístupný pro roboty vyhledávačů. Tolik krátce k teorii a historickému pozadí tohoto souboru. Nyní se podívejme na to, zda ho budete potřebovat vy a jak si ho případně vytvořit.

Kdy ho pravděpodobně potřebovat nebudete?

  • Když máte web malý (jednotky podstránek),
  • málo aktulizovaný,
  • s jednoduchou strukturou obsahu.

Malý jednoduchý web totiž už dnes roboty vyhledávačů nemají absolutně problém projít a indexovat, takže generovat pro web o pěti stránkách sitemapu je v zásadě zcela zbytečná starost.

Kdy byste naopak soubor sitemap měli na webu mít?

  • Pokud máte web rozsáhlejší (desítky, stovky, tisíce podstránek),
  • se složitější navigační strukturou,
  • často měněný a aktualizovaný.

Jak vypadá soubor sitemap

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://adresawebu.cz/stranka.html</loc>
        <lastmod>2013-05-13</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>

V hlavičce je definováno, že se jedná o xml soubor a je nastaveno jeho kódování – zpravidla unicode, utf-8.

Následuje seznam url (urlset), kde je definováno, že je vystaven podle sitemap protokolu verze 0.9.

Samotné url jsou pak složeny z těchto údajů:

  • <loc> – url adresy dotyčné stránky
  • <lastmod> – datum poslední změny stránky
  • <changefreq> – frekvence změn stránky
  • <priority> – priorita v rámci webu (např. hlavní stránka webu může mít vyšší prioritu, než jiná, konkrétní hodnotu nastavíte zde

Soubor je pak pod jménem sitemap.xml ideální uložit nebo nahrát pomocí ftp  přímo do kořenového adresáře webu, tj. například na adresu www.mujweb.cz/sitemap.xml. Protože vypisovat ručně řádek po řádku je poněkud pracné, je mnohem jednodušší k vygenerování tohoto souboru využít automatizované cesty a nechat ho generovat programem nebo skriptem. K tomu vám mohou posloužit některé z níže popsaných prostředků.

Online generátory

Řada redakčních systémů a eshopových softwarů dnes generuje sitemapy zcela automaticky vždy, když dojde k nějaké změně. Zpravidla stačí pouze tuto funkci zapnout a nechat automatizovaně fungovat, případně doinstalovat příslušný plugin – toto platí pro open-source redakční systémy jako WordPress, Joomla, Drupal, phpBB, PrestaShop a další.

Pokud toto není pro váš web aktuální, stále není potřeba sedat k poznámkovému bloku a ručně bušit seznam všech url adres. Dají se využít například tyto online generátory:

Aplikace ke stažení

Online generátory

 

Rate this post

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *