Aceasta reprezintă un fișier special în format XML, care se află în rădăcina resursei web. Mulți webmasteri își pun întrebarea „Trebuie oare să instalez sitemap.xml pe propriul portal și cum acest fapt va influența clasarea paginii pe motoarele de căutare? Sau nu este obligatoriu să adaug harta site-ului?”.
Pentru a răspunde la întrebările date, noi vom concretiza structura sitemap și vom încerca să explicăm motivul din care avem nevoie de acest document.
Sitemap.xml reprezintă o listă a paginilor web ale site-ului dumneavoastră, în format XML. Odată ce dispuneți de acest document, el va permite sistemelor de căutare să grăbească semnificativ indexarea paginilor, însă ea nu reprezintă o condiție obligatorie la crearea și promovarea site-urilor! Pur și simplu în lipsa hărții, paginile pot să nu ajungă mult timp în index-ul motoarelor, în special dacă ele sunt prea multe sau pe portal este prezent un nivel înalt de imbricare.
În sitemap.xml merită să adăugați doar acele pagini, care după părerea dumneavoastră trebuie să fie în index-ul sistemelor de căutare. Nu merită să includeți paginile închise de indexare în robots.txt, cu URL dinamice, paginile pentru autorizare, profiluri și alte pagini web tehnice. Titlul serverului, oferit tuturor documentelor, care se află în fișierul sitemap.xml, trebuie să fie 200.
În cazul în care portalul dumneavoastră are peste 10 000 de pagini, merită să construiți câteva hărți. Ideea este că mărimea sitemap.xml maximal admisibilă este de 10 MB, cu toate că Search Console, spre exemplu, admite posibilitatea de a adăuga fișiere cu o mărime maximă de 50 MB.
De la bun început trebuie să indicăm versiunea xml și codificarea folosită, și anume – UTF-8.
Tag-urile obligatorii:
“urlset” — acest tag se deschide la începutul hărții dumneavoastră (tag-ul este de tip pereche, respectiv acesta trebuie închis la sfârșitul documentului);
“url” — tag pereche, care reprezintă principalul tag pentru fiecare hiperlink din documentul dumneavoastră;
“loc” — tag pereche, conține link-ul la pagină.
Tag-uri facultative:
“lastmod” — arată data, la care s-au făcut modificări în document pentru ultima oară;
“changefreq” — indică frecvența cu care se planifică schimbările documentului (aproximativ);;
“priority” — reflectă prioritatea scanării paginii, primește o valoare de la 0 la 1.
Atrageți atenția! Тag-ul “priority” nu mai este susținut de motorul de căutare Google.
În cazul în care există câteva fișiere sitemap.xml (pe site sunt peste 10 000 pagini), se utilizează următoarele tag-uri:
“sitemapindex” — acest tag se deschide la începutul hărții dumneavoastră (acesta este un tag pereche, la sfârșitul documentului el trebuie închis);
“sitemap” — tag pereche, el este cel principal pentru fiecare hiperlink din document;
“loc” — pereche, care conține hiperlink-ul la sitemap.xml;
“lastmod” — un tag facultativ, care indică data ultimei modificări a paginii web.
Pentru a crea harta site-ului, puteți utiliza serviciile speciale – generatoare automate, precum:
1. Mysitemapgenerator.com. În versiunea gratuită, acesta permite scanarea până la 500 de pagini, ceea ce se potrivește ideal portalurilor informaționale de dimensiuni medii. Se utilizează pachetele cu plată (2,5$ și 4$), pot fi indexate de la 1 milion de pagini până la un număr de pagini nelimitat, instalând reînnoirea sitemap după orar (util pentru portalurile pe care apar des pagini web noi).
2. Gensitemap.ru. Aici puteți scana gratuit până la 1000 de pagini. Pachetele cu plată variază în dependență de cantitatea de pagini, care trebuie adăugată pe harta site-ului.
Dacă site-ul dumneavoastră web este elaborat pe baza unuia din cele mai răspândite sisteme CMS, de exemplu WordPress, atunci dumneavoastră puteți utiliza oricare din următoarele plugin-uri – nu este obligatoriu să utilizați servicii externe.
Există o cantitate enormă de plugin-uri care generează harta site-ului, de exemplu Google XML Sitemaps, WP Realtime Sitemap.
Pentru început, determinați acele pagini ale site-ului web, care după părerea dumneavoastră sunt utile pentru utilizatori și trebuie să fie adăugate în index-ul motoarelor. De asemenea, merită să determinați URL-urile canonice pentru paginile web alese.
Alegeți cel mai potrivit tip de sitemap și creați-l, utilizând un serviciu extern sau plugin-ul.
Introduceți linkul pe harta site-ului în robots.txt și adăugați-o pe panoul webmasterului Google.
Google lucrează cu următoarele extensiuni:
XML;
RSS;
TXT;
HTML.
Independent de tipul hărții site-ului, ei îi vor fi caracteristice limitele indicate mai jos:
sitemap nu poate include mai mult de 50 000 URL-uri;
mărimea fișierului nu trebuie să fie mai mare de 50 MB.
Dacă la întocmirea sitemap.xml, dumneavoastră observați că fișierul are peste 50 de MB, va fi necesar să creați 2 sau mai multe harți ale site-ului. Este suficient de simplu să faceți asta:
Elaborați fișierul indexat.
În fișierul indexat al hărții site-ului web indicați link-urile la celelalte sitemap-uri.
Adăugați documentul indexat în panoul Search Console.
Pentru a adăuga harta site-ului în Search Console, trebuie să alegeți în secțiunea „Index” tab-ul „Fișiere Sitemap” și să adăugați adresa hărții. După aceea va fi lansată scanarea Sitemap-ului dumneavoastră la erori, iar rezultatele vor fi trecute în tabelul de mai jos.
În ceea ce privește webmaster-ul de pe Yandex, algoritmul acțiunilor este tot același (indicat în screenshot). Dumneavoastră vă rămâne doar să inserați link-ul la hartă și totul este gata.
Înainte de a fi adăugat, fișierul poate fi verificat la erori. Pentru asta alegeți secțiunea „Instrumente”, după care „Analiza fișierelor Sitemap”.
link-urilor greșite în fișier (URL generează eroarea 404);
documentelor web cu redirecționarea 301, 302 ;
paginilor web cu URL dinamic.
Sitemap.xml într-adevăr grăbește indexarea paginilor web, ceea ce poate fi util pentru site-urile cu multe pagini, de exemplu, magazinele online. Ca acest fișier să ajungă cât mai rapid în mâinile Yandex sau Google, este necesar să-l adăugați pe panoul pentru webmasteri. Dacă sunteți angajat independent în compilarea structurii site-ului, vă recomandăm să citiți un articol despre utilitatea site-ului.