Sitemap - Šta je to i za šta služi - IBP Studio

Uz pomoć fajla sitemap, web master tako saopštava pretraživačima o stranicama koje su dostupne za skeniranje. Sam fajl Sitemap predstavlja XML dokument u kojem su navedeni URL adrese web sajta sa metapodacima koji su povezani sa svakim URL-om, kao na primer: datum njegove poslednje izmene, Frekvencije promene, i njegov prioritet na web-sajtu. Sve to u cilju da bi pretraživač mogao što bolje da skenira sajt. Pretraživači uglavnom mogu da čitaju dva formata fajla Sitemap. Jedan je u XML formatu, a drugi je u TXT formatu.

Skeneri, obično nalaze stranice uz pomoć linkova koji se pozivaju na njih. Ove informacije se dopunjuju iz podataka iz fajlova Sitemap, dajući informaciju pauku pretraživača  uz pomoć protokola Sitemap, da pronađe sve URL adrese  i da ih skenira. Sitemap nije garancija će stranice biti indeksirane pretraživačem, on predstavlja samo dopunsku informaciju za pretraživač, koji može detaljnije da obavi svoj posao, a to je da skenira sajt.

 XML - Format fajla Sitemap

 Potrudićemo se da podrobnije opišemo XML-shemu protokola Sitemap.

Format protokola Sitemap se sastoji iz XMl - tegova. Svi podaci u fajlu Sitemap moraju da se koristi procedura maskiranja i kodiranje u formatu UTF-8.

Pa da počnemo:

  • Početak i kraj moramo oivičiti sa tegom <urlset> </urlset>.
  • Napišite standard protokola u tegu < urlset>.
  • Uključite teg <url> za svaku URL adresu kao roditeljski element tega XML(parent).
  • Uključite teg <loc> u svakom roditeljskom tegu <url>,kao teg niže hijerarhije(children).

 Primer Sitemap  

<?xml version="1.0" encoding="UTF-8"?> 
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9/">
<url>
<loc>https://www.example.com/</loc>
<lastmod>2023-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

 

Definicija XML Tegova u fajlu Sitemap

  •  <urlset> - Obavezan - Vrši Inkapsulaciju i opredeljuje standard danog protokola
  • <url> - Obavezan - Roditeljski teg za svaku URL adresu. Svi ostali tegovi su tegovi nižeg prioriteta za ovaj teg(children).
  • <loc> - Obavezan - URL adresa stranice. Adresa mora da sadrži prefiks(HTTPS) i završava se kosom crtom. Dužina ne sme prevazilaziti 2048 simbola.
  • <lastmod> - Nije Obavezan -  Datum poslednje premene stranice. Zapisuje u formatu  W3C Datetime Standarda.  Može da se upotrebi i format YYYY-MM-DD. Obratite pažnju da datum mora biti identični sa datumom promene same stranice. Ovaj teg nema ničeg zajedničkog sa Headerom "If-Modified-Since (304)" koji vraća server na upit.
  • <changefreq> - Nije Obavezan -  Verojatnost frekvencije promene stranice(Uglavnom se koristi za novostne portale i dnevne vesti). Ovo značenje daje opštu informaciju i ne mora da znači tačnost podatka. Moguća značenja: 
    • always
    • hourly
    • daily
    • weekly
    • monthly
    • yearly
    • never

Imajte u vidu, da značenja ovog tega se ne smatra kao komanda, već kao napomena, te ne mora da znači da robot pretraživača ne mora da skenira sajt, kad mu napišemo da ne mora da ga skenira nikada, i obrnuto. Zbog toga ovaj teg i nije obavezan, ali može biti od koristi.

  • <priority> - Nije Obavezan - Prioritet URL u odnosu na druge URL adrese vašeg sajta. Dozvoljeni dijapazon - od 0,0 do 1,0. Ovo značenje ne sravnjuje stranice vašeg sajta sa stranicama drugih sajtova. Ono pokazuje koje su stranice vašeg sajta po vašem mišljenju glavnije(prioritetnije) u odnosu na druge stranica na vašem sajtu. 

Prioritet stranice po Defoltu je  - 0,5.

Obratite pažnju da visoko značenje prioriteta na svim stranicama, nema smisla. i Prioritetnost jeste relativna veličina. Ovaj parametar se koristi da se opredeli redosled obrade URL adresa na vašem sajtu.

 

Indeks Sitemap (kako napraviti grupu iz nekoliko Sitemap fajlova)

Ako imamo ogroman sajt možemo pretraživaču predstaviti nekoliko fajlova Sitemap, ali u svakom od tih fajlova ne sme biti više od 50 000 URL adresa, i veličina svakog fajla ne sme biti veća od 50 Mb. Ukoliko postoji takva neobhodnosts, fajl možemo zipovati uz pomoć arhivatora gzip, što će rezultirati smanjenje propusne sposobnosti kanala. Ako imamo više od 50 000 URL adresa, treba napraviti više Sitemap fajlova.

Prilikom predstavljanja pretraživaču više fajlova Sitemap, moramo spomenuti svaki fajl u fajlu index_sitemap.xml. U fajlu Index Sitemap ne sme biti više od 50 000 fajlova Sitemap. Veličina fajla ne sme biti veća od 50 Mb (52 428 800 bajta), i takođe može biti arhivran(zipovan). Format fajla Index Sitemap je veoma sličan kao i format fajla Sitemap.xml.

Kako izgleda fajl Index Sitemap:

  • Na početku stavljamo otvoreni teg <sitemapindex>, i napišite odmah i zatvoreni teg </sitemapindex>.
  • Između tegova napišite teg <sitemap> za svaki fajl Sitemap kao roditeljski XML teg.
  • Uključite teg <loc> nižeg priorite(children) za svaki roditeljski teg <sitemap>.

Neobavezan teg <lastmod> je dostupan za fajl indeksa Sitemap. 

 Važno

Fajl indeksa Sitemap može sadržati samo fajlove Sitemap, koji se nalaze na tom sajtu za koji je građen index Sitemap, i na kojem se nalaze fajlovi Sitemap. Kodiranje fajla je UTF-8. 

 

 Primer Index Sitemap

<?xml version="1.0" encoding="UTF-8"?><sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><br>
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
 



 

Bez Komentara

Ostavite svoj komentar

In reply to Some User
Cookies user preferences
We use cookies to ensure you to get the best experience on our website. If you decline the use of cookies, this website may not function as expected.
Accept all
Decline all
Analytics
Tools used to analyze the data to measure the effectiveness of a website and to understand how it works.
Google Analytics
Accept
Decline
Advertisement
If you accept, the ads on the page will be adapted to your preferences.
Google Ad
Accept
Decline
Save