Metraščių svetainės schema html. Išsamus svetainės schemos vadovas

Svetainės schema arba svetainės schema yra specialus failas (dažniausiai turi plėtinį xml), kuriame pateikiama informacija apie visus svetainėje esančius puslapius. Naudojant šį failą, paieškos sistemai galima aiškiai suprasti, kokius svetainės puslapius pageidautina indeksuoti pirmiausia, kaip reguliariai atnaujinami puslapių duomenys, taip pat atskirų svetainės puslapių indeksavimo svarba. Tai labai supaprastina paieškos robotų indeksavimą. Svetainės žemėlapio failas turi būti visose svetainėse, kurias sudaro penkiasdešimt ar daugiau puslapių.

Kaip sukurti svetainės žemėlapio failą internete ir pridėti jį prie savo svetainės

Kadangi svetainės schema yra xml failas, galite ją sukurti teksto formatu naudodami bet kurį redaktorių ir išsaugoti naudodami xml plėtinį. Tačiau nepriklausomos pastangos visai nebūtinos, internete yra specialių paslaugų, su kuriomis galite generuoti nemokamai - automatiškai sukurkite sitemap.xml failą internete ir pridėkite jį prie bet kurios svetainės. Išsamiau apie sitemap.xml failo kūrimo procesą galite žiūrėti vaizdo įrašą:

Norėdami automatiškai sukurti svetainės schemą, reikiamame lauke įvesti norimos svetainės adresą, pasirinkti tinkamą failo formatą, nustatyti svetainės puslapių indeksavimo seką, nurodyti puslapio atnaujinimo dažnumą ir nustatyti kitus dominančius parametrus. tu. Atlikus visas šias operacijas, reikia paspausti mygtuką „vykdyti“ ir po trumpo laiko žemiau esančiame lange atsiras sukurtos svetainės schemos kodas. Jums tereikia nukopijuoti ir įklijuoti šį kodą į failą, kurį sukūrėte redaktoriuje sitemap.xml, išsaugokite ir įkelkite į savo svetainės šakninį katalogą.

Tačiau norint, kad šis failas duotų laukiamą efektą, neužtenka tik sukurti ir į savo svetainę įtraukti Svetainės schemą, reikia ir informaciją apie jo prieinamumą perduoti paieškos robotui. Norėdami tai padaryti, faile turite įrašyti kelią į jį, pridėdami prie jo eilutę:

Svetainės schema: http://YASH_SITE.ru/sitemap.xml

Po to visos operacijos bus baigtos, jūsų svetainės schema yra paruošta atlikti savo funkcijas. Tik reikia atsiminti, kad viename sukurtame xml faile neturėtų būti daugiau nei 50 000 puslapių, o jo apimtis – ne daugiau kaip 10 megabaitų. Priešingu atveju turėsite sukurti kitą tokį failą.

Sveiki, draugai! Šioje pamokoje kalbėsime apie svetainės žemėlapio kūrimas paieškos sistemoms„WordPress“. Bet pirmiausia prisiminkime kas yra svetainės schema (sitemap.xml)?

Svetainės žemėlapis(failas sitemap.xml)- Taifailas su plėtiniu .xml, kuriame saugoma informacija Dėl paieškos sistemos(pvz., „Yandex“, „Google“, „Bing“, „[email protected] ) apie visus jūsų puslapius ir jūsų įrašus Interneto svetainė , kurios yra dalykinės indeksavimas paieškos sistemomis.

Svetainės žemėlapis veikia kaip pagalbininkas paieškos sistemoms, padeda nustatyti puslapių ir įrašų vietą svetainėje, kada jie buvo paskutinį kartą atnaujinti, kaip dažnai jie buvo atnaujinti ir jų svarbą, palyginti su kitais svetainės puslapiais, paieškos variklis as galeciau tikslingiau indeksuoti svetainę.

Taip pat yra keletas apribojimų naudojant svetainės žemėlapį, būtent:

  • turėtų būti svetainės schemoje ne daugiau 50 000 URL;
  • failo dydis sitemap.xml neturėtų viršyti 10 MB.

Svetainės žemėlapis yra svarbiausias bet kurios svetainės atributas. Ji yra paieškos variklio padėjėja ir, jei norite reklamuoti savo svetainę internete – svetainės žemėlapio kūrimas yra privalomas!

Sitemap.xml failo kūrimas „WordPress“.

Norėdami sukurti svetainės schemą, naudosime papildinį Google XML svetainių schemos. Taigi, pradėkime!

1. Eikite į Papildiniai -> Pridėti naują.

2. Paieškos laukelyje parašykite Google XML svetainių schemos ir paspauskite mygtuką Įeikite klaviatūroje norėdami ieškoti.

3. Įdiekite papildinį spustelėdami mygtuką "Diegti".

4. Įdiegę turite suaktyvinti papildinį. Norėdami tai padaryti, paspauskite mygtuką "Suaktyvinti papildinį".

„Google XML Sitemaps“ papildinio nustatymas

5. Suaktyvinę papildinį, eikite į Nustatymai -> XML svetainės schema.

6. Atsidariusiame puslapyje matome nustatymus svetainių žemėlapiai. Čia turime pakeisti šiuos dalykus:

Kitos parinktys yra konfigūruojamos kiekvienam projektui atskirai. Taip pat galite palikti visus nustatymus numatytas, jei nėra noro juose ką nors keisti. Noriu atkreipti jūsų dėmesį į tai, kad net ir su numatytaisiais nustatymais viskas bus puikus darbas.

Atlikę pakeitimus spustelėkite mygtuką « Atnaujinti nustatymus" .

7. Svetainės schema sukuriama iškart suaktyvinus papildinį. Pačiame nustatymų puslapio viršuje pamatysite nuorodą į savo svetainės schemą ( Nustatymai -> XML svetainės schema).

Kaip matote, svetainės schemos kūrimas „WordPress“ yra gana paprasta užduotis, kurią gali sukurti net patys nepatyrę vartotojai.

Leiskite dar kartą priminti, kad svetainės žemėlapis padeda reklamuoti savo svetainę paieškos sistemose, o jo buvimas yra privalomas kiekvienoje svetainėje.

Sveiki, draugai! Šioje pamokoje kalbėsime apie paieškos sistemos svetainės schemos kūrimą „WordPress“. Bet pirmiausia prisiminkime, kas yra svetainės schema (sitemap.xml)? Svetainės schema (failas sitemap.xml) yra failas su .xml plėtiniu, kuriame saugoma informacija paieškos sistemoms (pvz., Yandex, Google, Bing, [email protected]) apie visus jūsų puslapius ir įrašus svetainėje, kurie turi būti indeksuojami. pagal paieškos sistemas. Svetainės schema veikia kaip pagalbinė priemonė paieškos sistemoms; ji padeda nustatyti puslapių ir įrašų vietą svetainėje, kada jie buvo paskutinį kartą atnaujinti, kaip dažnai jie buvo atnaujinami ir kiek jie svarbūs, palyginti su kitais svetainės puslapiais, kad paieškos variklis gali protingiau indeksuoti svetainę. Taip pat yra keletas svetainės schemos naudojimo apribojimų, būtent: svetainės schemoje turi būti ne daugiau kaip 50 000 URL;…

Apžvalga

Balsuokite už pamoką

100

Įvertinimas

Rezultatas: Mieli skaitytojai! Nepatingėkite balsuoti ir palikti komentarą. Taip galiu suprasti pamokų ir straipsnių naudingumą ir gerinti jų kokybę ateityje. Iš anksto dėkoju!

Šiame straipsnyje sužinosite, kaip sukurti svetainės schemą ir bendrinti ją su „Google“.

Svetainių schemų kūrimas ir pateikimas

Svetainės schemos failų formatai

„Google“ palaiko kelis svetainės schemos failų formatus, aprašytus toliau. Visi formatai turi naudoti standartinį protokolą. „Google“ šiuo metu nepalaiko šio atributo Svetainės schemos failuose.

Visiems formatams taikomi šie apribojimai: svetainės schemoje gali būti daugiausia 50 000 URL, o nesuspaustas jos dydis neturi viršyti 50 MB. Jei failo dydis ar jame nurodytų adresų skaičius viršija šias ribas, padalinkite jį į kelias dalis. Galite sukurti svetainės schemos indekso failą, kuriame išvardijamos visos jūsų svetainės schemos, ir pateikti jas „Google“ iš karto.

Tekstinis failas

Jei jūsų svetainės schemoje yra tik puslapių adresai, galite siųsti „Google“ paprasto teksto failą su tais URL (po vieną kiekvienoje eilutėje). Pavyzdys:

Http://www.example.com/file1.html http://www.example.com/file2.html

  • Turite naudoti UTF-8 kodavimą.
  • Faile neturėtų būti nieko kito, išskyrus URL sąrašą.
  • Šiam tekstiniam failui gali būti suteiktas bet koks pavadinimas, bet turi būti naudojamas .txt plėtinys (pvz., sitemap.txt).

„Google“ svetainės

Jei jūsų svetainė buvo sukurta ir patvirtinta naudojant „Google“ svetaines, svetainės schema sukuriama automatiškai. Negalite jo pakeisti, bet galite nusiųsti „Google“, kad gautumėte ataskaitų teikimo informaciją. Atminkite, kad jei viename pakatalogyje yra daugiau nei 1000 puslapių, svetainės schema gali būti rodoma netinkamai.

  • Jei jūsų puslapiai yra priglobti „Google“ svetainėse, jūsų svetainės schema turėtų būti adresu http://sites.google.com/site/ VashSait /system/feeds/sitemap .
  • Jei svetainė buvo sukurta naudojant Google Apps, svetainės schemos URL turėtų būti: http://sites.google.com/ Jūsų domenas /VashSait /system/feeds/sitemap .

Svetainės schemos failų plėtiniai

„Google“ palaiko išplėstinę sintaksę svetainės schemoje toliau nurodytų tipų informacijai. Naudodami jį galite pridėti vaizdo įrašų, vaizdų ir kito turinio aprašymų, kad pagerintumėte jo indeksavimą.

Sveiki, mieli tinklaraščio svetainės skaitytojai. Nusprendžiau viename straipsnyje apibendrinti viską, ką jau rašiau apie svetainės schemą (Sitemap xml), kuri pirmiausia reikalinga norint nurodyti paieškos sistemoms tuos puslapius, kuriuos jie turėtų indeksuoti pirmiausia. Tai labai svarbus ir, tiesą sakant, privalomas bet kurio interneto projekto atributas, tačiau daugelis arba to nežino, arba neteikia svetainės žemėlapiui didelės reikšmės.

Iš karto pažymėkime visus „i“ ir pabandykime atskirti dvi sąvokas - svetainių schemas xml formatu ir HTML formatu (taip pat yra geografinė šio žodžio interpretacija, apie kurią rašiau straipsnyje „“). Antroji parinktis yra įprastas visos žiniatinklio šaltinio medžiagos sąrašas, kuris bus prieinamas visiems, spustelėjus atitinkamą meniu elementą. Ši parinktis taip pat naudinga ir padeda pagreitinti bei pagerinti paieškos sistemų išteklių indeksavimą.

Svetainės schemos svetainės schema xml formatu – bet man jos reikia

Tačiau pagrindinis įrankis, skirtas tiesiogiai nurodyti paieškos sistemoms tuos išteklių puslapius, kuriuos reikės indeksuoti, yra failas Sitemap.xml (tai yra labiausiai paplitęs pavadinimas, bet teoriškai jį galima pavadinti bet kuo, nesvarbu) , kurios nebus matomos jūsų žiniatinklio projekto lankytojams.

Jis sudarytas naudojant specialią, paieškos sistemoms suprantamą sintaksę, kurioje bus surašyti visi indeksuotini puslapiai, nurodant jų svarbą, paskutinio atnaujinimo datą ir apytikslį atnaujinimo dažnumą.

Yra du pagrindiniai failai, kuriuos turi turėti bet kuris žiniatinklio projektas - robots.txt ir sitemap.xml. Jei jūsų projekte jų nėra arba jie užpildyti neteisingai, tada labai tikėtina, kad rimtai pakenksite savo ištekliui ir neleisite jam atskleisti viso savo potencialo.

Jūs, žinoma, galite manęs neklausyti (nes nesu autoritetas, dėl palyginti nedidelės sukauptos faktinės medžiagos), bet manau, kad nesiginčysite be atodairos su specialistais, kurie po ranka turi statistiką iš dešimčių tūkstančių projektų. .

Šiai progai sandėlyje turėjau „fortepijoną krūmuose“. Prieš pat rašydamas šį straipsnį, aptikau gerai žinomos automatinės skatinimo sistemos specialistų publikaciją neįprastu pavadinimu „Rankos“ (tai MegaIndex analogas, apie kurį rašiau).

Akivaizdu, kad bet kuri į juos panaši sistema yra suinteresuota sėkminga klientų projektų eiga, tačiau jos gali tik pripumpuoti klientų resursus nuorodų mase ir, deja, negali daryti įtakos svetainių turiniui ir teisingai techninei konfigūracijai.

Todėl buvo atliktas labai įdomus ir daug atskleidžiantis tyrimas, kurio tikslas – nustatyti 10 populiariausių priežasčių, apsunkinančių projektų reklamavimą ir šiuos duomenis nukreipti tiesiai į klientus...

Pirmoje vietoje, žinoma, buvo "ne unikalus turinys" (arba nukopijavote, arba turite, o tai nekeičia esmės). Tačiau antroje vietoje buvo būtent svetainės schema xml formatu, tiksliau, jos nebuvimas arba neatitikimas pripažintam kūrimo formatui. Na, o trečioje vietoje buvo anksčiau minėtas robots.txt failas (jo nebuvimas arba neteisingas sukūrimas):

Kai nepagrįstai tvirtinate, kad jūsų projektas turi turėti žemėlapį (kitaip tai yra švaistymas), tai neatrodo taip įtikinamai, tarsi šis teiginys būtų paremtas tikrais faktais iš gana reprezentatyvaus tyrimo.

Gerai, tarkime, kad aš jus įtikinau, ir pažiūrėkime, kaip galite patys susikurti svetainės schemą (formato sintaksė), kaip ją sukurti „Joomla“ ir „WordPress“, taip pat pažiūrėkime, kaip galite ją sukurti naudodami specialius internetinius generatorius.

Tačiau vien sukurti svetainės schemą neužtenka, kad įsitikintumėte, jog jūsų projektas bus tinkamai indeksuotas paieškos sistemų. Taip pat reikės įsitikinti, kad paieškos sistemos (mūsų atveju „Google“ ir „Yandex“) sužinotų būtent apie šią svetainės schemą. Tai galima padaryti dviem būdais, tačiau apie tai pakalbėsime šiek tiek vėliau (turi būti bent kažkokia intriga, kuri patrauktų skaitytojų dėmesį).

Kodėl jums reikia žemėlapio svetainės ir failo robots.txt?

Pirmiausia pabandykime pagrįsti logišką būtinybę naudoti tiek failą robots.txt, kuris draudžia indeksuoti tam tikrus jūsų žiniatinklio projekto elementus, tiek svetainės schemos failą, kuriam reikia indeksuoti tam tikrus puslapius. Norėdami tai padaryti, grįžkime atgal prieš penkerius ar dešimt metų, kai dauguma interneto išteklių buvo tiesiog HTML failų rinkinys, kuriame buvo visų straipsnių tekstai.

„Google“ arba „Yandex“ paieškos robotas tiesiog nuėjo į tokį HTML projektą ir pradėjo indeksuoti viską, kas tik pateko į rankas, nes beveik visur buvo projekto turinys. Bet kas vyksta dabar, kai plačiai naudojamos CMS (turinio valdymo sistemos)? Tiesą sakant, net iškart įdiegęs variklį, paieškos robotas jau ras kelis tūkstančius failų pas jus, ir tai nepaisant to, kad galbūt dar neturite jokio turinio (na, dar neparašėte nė vieno straipsnio).

Ir apskritai turinys šiuolaikinėse TVS, kaip taisyklė, yra saugomas ne failuose, o duomenų bazėje, kurios paieškos robotas natūraliai negali tiesiogiai indeksuoti (darbui su duomenų bazėmis rekomenduoju nemokamai).

Akivaizdu, kad šen bei ten pataikyti, „Yandex“ ir „Google“ paieškos robotai vis tiek ras jūsų turinį ir jį indeksuos, tačiau kaip greitai tai įvyks ir Kiek bus baigtas indeksavimas? jūsų projektas yra labai didelis klausimas.

Būtent siekiant supaprastinti ir pagreitinti projektų indeksavimą paieškos sistemoms plačiai paplitusio TVS kontekste, reikia sukurti robots.txt ir sitemap.xml. Naudodami pirmąjį failą, nurodote paieškos sistemos robotams, kurie failai neturėtų gaišti laiko indeksuodami (pavyzdžiui, variklio objektai), taip pat galite jį naudoti norėdami blokuoti kai kurių puslapių indeksavimą, kad pašalintumėte turinio dubliavimo poveikį, kuris būdingas daugeliui TVS (daugiau apie tai skaitykite straipsnyje apie).

Svetainės schemos failo pagalba jūs aiškiai ir aiškiai nurodote „Yandex“ ir „Google“ robotams, koks tiksliai yra jūsų projekte esantis turinys, kad jie veltui nesiblaškytų naudojamo variklio failų valdymo kampeliuose. Nepamirškite, kad robotai turi tam tikrus peržiūros laiko ir dokumentų skaičiaus apribojimus. Jis klajos po jūsų variklio failus ir išeis, o turinys ilgą laiką liks neindeksuotas. Oi kaip.

Prisiminkite, kaip garsioje komedijoje vienas spalvingas personažas pasakė: „Neik ten, eik čia, kitaip...“. Būtent šio simbolio funkciją atlieka robots.txt ir žemėlapio svetainė su xml plėtiniu, kad reguliuotų paieškos robotų judėjimą jūsų žiniatinklio projekto užkampiuose ir plyšiuose. Akivaizdu, kad robotai gali įsibėgėti, bet greičiausiai jie klusniai vykdys jūsų gerai parašytus draudžiamus ir įsakmius (svetainės žemėlapyje) nurodymus.

Tai aišku? Tada mes pradedame tiesiogiai spręsti klausimą, kaip įvairiais būdais sukurti sitemap.xml ir kaip apie jo egzistavimą informuoti du „RuNet“ paieškos ramsčius - „Google“ ir „Yandex“, kad jie veltui nesikratytų jūsų projekto, kartu sukuriant papildomą apkrovą jūsų serverio prieglobai, tačiau tai yra labai antraeilis dalykas, pagrindinis dalykas yra indeksavimas (greitas ir išsamus).

Skirtingai nuo robots.txt, kurį greičiausiai turėsite parašyti patys, svetainės schemos failą xml formatu, paprastai jie bando sukurti kokiu nors automatiniu būdu. Tai suprantama, nes esant dideliam dažnai atnaujinamo projekto puslapių skaičiui, jo kūrimas rankiniu būdu gali pakenkti žiniatinklio valdytojo protui.

Taip, tai visai nebūtina, nes... Beveik kiekviena TVS turi plėtinį, kuris leis jums sukurti ir, pasirodžius naujai medžiagai, iš naujo sukurti svetainės schemos failą. Na, arba visada galite naudoti internetinį svetainės schemų generatorių kaip paruoštą sprendimą.

Bet vis tiek man atrodo, kad būtų naudinga susipažinti su paprasta (ką galiu pasakyti - paprasčiausia) sintaksė kuriant svetainės schemą. Be to, mažuose ir retai atnaujinamuose projektuose galite jį nubrėžti rankiniu būdu.

Kaip patiems susikurti Sitemap.xml „Joomla“ ir „WordPress“.

Paprastai „Svetainės schemos“ direktyva rašoma pačioje pabaigoje. Kai kitą kartą paieškos robotai apsilankys jūsų žiniatinklio projekte, jie tikrai peržiūrės robots.txt turinį ir atsisiųs jūsų žemėlapį studijoms. Tačiau tokiu būdu apie jo egzistavimą gali sužinoti visokie ridikai, kurių žemėlapio svetainė padės pavogti jūsų turinį.

Tačiau yra ir kitas būdas tiesiogiai perduoti informaciją apie svetainės žemėlapio vietą paieškos sistemoms be robots.txt tarpininkavimo. Tai atliekama naudojant „Yandex Webmaster“ sąsają ir „Google“ įrankių juostas, nors galite naudoti. Ar jau susipažinote su šiais paieškos variklio įrankiais?

Jei ne, būtinai pridėkite savo projektą ir prie , ir prie , tada atitinkamuose skirtukuose nurodykite kelią į svetainės schemą Xml formatu.

Taip atrodo „Yandex Webmaster“ svetainės schemos pridėjimo forma:

Štai kaip atrodo panaši kelio įvedimo forma Google įrankių juostoje:

Internetiniai generatoriai Svetainės schemos generatorius ir XML svetainių schemos

Jei nenorite ieškoti TVS plėtinių, leidžiančių automatiškai sukurti žemėlapio svetainę, tokiu atveju galite naudoti internetinius generatorius. Tačiau čia yra vienas trūkumas, lyginant su automatiniu žemėlapio kūrimu pačioje TVS – pridėjus naują medžiagą teks dar kartą eiti į internetinę paslaugą ir iš naujo sukurti šį failą, o tada įkelti į savo serverį.

Turbūt vienas garsiausių internetinių svetainių schemų generatorių yra svetainės schemų generatorius. Jis turi gana daug funkcijų ir leis nemokamai sugeneruoti 1500 puslapių svetainės schemą, o tai yra gana daug.

Svetainės schemos generatorius atsižvelgs į failo robots.txt turinį, kad puslapiai, kuriuos draudžiama indeksuoti, nebūtų įtraukti į žemėlapį. Tai savaime nėra baisu, nes draudimas robotuose ir taip turės didesnį prioritetą, tačiau sutaupys jus nuo nereikalingos informacijos sukurtame Svetainės žemėlapio faile. Norint sudaryti žemėlapį, tereikia nurodyti pagrindinio puslapio URL ir pateikti savo el. paštą, po kurio būsite įrašyti į eilę generavimui:

Kai ateis jūsų eilė, gausite pranešimą apie tai el. paštu ir spustelėję laiške esančią nuorodą galėsite atsisiųsti failą, kurį jums sukūrė Svetainės schemos generatorius. Viskas, ką jums reikia padaryti, tai įkelti jį į reikiamą vietą savo serveryje. Na, karts nuo karto turėsite pakartoti šią procedūrą, kad svetainės schema būtų atnaujinta.

Yra panaši internetinė generatoriaus paslauga anglų kalba, kurią galite rasti šioje nuorodoje - XML ​​Svetainės schemos. Jis turi 500 puslapių limitą, bet kitu atveju viskas beveik taip pat, kaip aprašyta aukščiau.

Sėkmės tau! Greitai pasimatysime tinklaraščio svetainės puslapiuose

Jums gali būti įdomu

Kas yra URL adresai, kuo skiriasi absoliučios ir santykinės svetainės nuorodos?
Kas yra Chmod, kokius leidimus priskirti failams ir aplankams (777, 755, 666) ir kaip tai padaryti per PHP
„Yandex“ paieška pagal svetainę ir internetinę parduotuvę
OpenServer – modernus vietinis serveris ir pavyzdys, kaip juo naudotis diegiant WordPress kompiuteryje
Kaip padidinti svetainės srautą iki 300 žmonių per dieną?

Failas sitemap.xml, kaip ir įprastas svetainės žemėlapis, yra puslapių rinkinys, suformatuotas XML žymomis. Naudodami šį failą, paieškos sistemos supranta, kurie jūsų svetainės puslapiai turėtų būti indeksuojami pirmiausia.

Svetainės schema XML formatu:

Kiekvienas variantas turi savo pliusų ir minusų. Pagrindinis XML formato svetainės schemos pranašumas yra tas, kad ji pašalina galimybę sulieti svetainės puslapių statinį svorį.

Šiame straipsnyje papasakosiu, kaip sukurti teisingą Sitemap.xml failą.

Jei jau žinote viską apie svetainės schemos kūrimą, pereikite tiesiai prie paskutinio skyriaus, kuris vadinasi „gudrybės“.

1. Sitemap.xml failo direktyvos

Yra 3 privalomos direktyvos, kurias būtina užpildyti bet kuriuo atveju, tai yra žymos:

Taip pat 3 pasirenkamos žymos:

Štai priminimas apie kiekvienos žymos iškodavimą oficialioje svetainėje http://www.sitemaps.org/ru/protocol.html:

Atributas

Būsena

apibūdinimas

reikalaujama

Apima šį failą ir nurodo dabartinį protokolo standartą.

reikalaujama

Pirminė kiekvieno URL žyma. Kitos žymos yra pavaldžios šiai žymai.

reikalaujama

Paties puslapio URL. Visada prasideda priešdėliu (pvz., HTTP) ir baigiasi pasviruoju brūkšniu (jei to reikalauja jūsų svetainės serveris).

Atkreipkite dėmesį: URL ilgis neturi viršyti 2048 simbolių.

neprivaloma

Failo paskutinio modifikavimo data. Griežtai nurodyta W3C Datetime formatu. Tai leidžia, jei reikia, nepaisyti laiko segmento ir naudoti formatą YYYY-MM-DD.

neprivaloma

Leidžia nurodyti, kaip dažnai keičiasi informacija puslapyje.

Ši vertė yra apytikslė.

Galiojančios reikšmės:

  • visada
  • valandinis
  • kasdien
  • kas savaitę
  • kas mėnesį
  • kasmet
  • niekada

Jei puslapis keičiasi kiekvieną kartą jį atidarius, naudokite reikšmę „visada“. Jei tai archyvo puslapis, nedėkite niekada.

Atkreipkite dėmesį, kad šis atributas yra užuomina paieškos robotui, o ne taisyklė. Todėl ryšys tarp jo ir faktinio paieškos roboto apsilankymų puslapyje dažnumo yra netiesinis.

neprivaloma

Leidžia nurodyti kai kurių svetainės puslapių prioritetą kitų puslapių atžvilgiu.

Vertybių diapazonas yra nuo 0,0 iki 1,0.

Pagal numatytuosius nustatymus kiekvienam puslapiui suteikiamas 0,5 prioritetas.

Atributo vertė padeda palyginti tik jūsų svetainės puslapių prioritetą. Tai reiškia, kad tai neturi įtakos jūsų svetainės palyginimui su konkurentų svetainėmis paieškos tinkle. Be to, visiems puslapiams nustatyti maksimalų prioritetą taip pat beprasmiška. Nes tada roboto reikšmės bus vienodos ir atributas tiesiog neveiks. Taigi neieškokite spragų, o nurodykite objektyvius puslapių prioritetus.

Išsaugoti šį priminimą. Iš pradžių tai tikrai jums bus naudinga. Verta paminėti dar vieną XML svetainės schemos pranašumą – ji lanksti. Lankstumas yra skirtingų pasirenkamų direktyvų derinys.

Dabar, kai jau aišku, kas yra XML svetainės schema, ir žinote pagrindines šio failo direktyvas, galite pereiti prie jo sudarymo.

2. Sitemap.xml failo kompiliavimas

Yra 3 būdai sukurti svetainės schemą:

  • Rankiniu būdu;
  • Automatiškai, naudojantis specialiomis paslaugomis;
  • Automatiškai, naudojant paruoštus sprendimus TVS įskiepių pavidalu ir kt.

Svetainės schemos rengimo procesas yra toks:

  • Sukuriame svetainės žemėlapį vienu iš aukščiau išvardytų metodų;
  • Tikriname galiojimą naudodami paieškos sistemos paslaugas (https://webmaster.yandex.ru/sitemaptest.xml);
  • Failą talpiname svetainėje;
  • Faile robots.txt nurodome kelią į paieškos robotams skirtą svetainės žemėlapį (Beje, apie tai yra atskiras straipsnis);
  • Svetainės schemą nurodome „Yandex“ ir „Google“ žiniatinklio valdytojo skyduose.

Taigi, kaip sukurti svetainės schemos failą?

Pažvelkime į failo sudarymo rankiniu būdu pavyzdį. Jei į svetainės schemą norite įtraukti 5 savo svetainės puslapius:

Štai kaip svetainės schema turėtų atrodyti XML formatu:

Aukščiau pateiktas kodas nurodo paieškos varikliui, kad puslapis yra http://site.ru/

paskutinį kartą keista 2005 m. sausio 1 d. Atnaujinama kartą per mėnesį. O šio puslapio prioritetas yra 0,8 (maksimalus galimas – 1).

Ypač patogus suporuotų žymų paryškinimo funkcionalumas.

Svetainės schemos generavimo paslaugos

Jei jūsų svetainėje yra daug naudingų puslapių ir nenorite gaišti laiko rinkdami failą rankiniu būdu, jums padės šios paslaugos:

Tokių paslaugų yra daug. Naudoju https://www.xml-sitemaps.com/.

Leiskite trumpai paaiškinti visus nustatymus:

„Google“ paieškos variklis rekomenduoja naudoti https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki

TVS įskiepiai

Svetainių valdymo sistemoms yra daugybė papildinių ir paruoštų sprendimų. Pavyzdžiui:

Prijungti

Galiojimas

Sukūrę svetainės schemą, turite patikrinti, ar joje nėra klaidų. Norėdami patikrinti, naudokite paslaugą https://webmaster.yandex.ru/sitemaptest.xml

Po sėkmingo patvirtinimo įkeliame failą į svetainę.

Failo vieta

Kitaip nei failas robots.txt, sitemap.xml failas gali būti bet kurioje svetainės vietoje. Pavyzdžiui, svetainės šakniniame aplanke failas bus pasiekiamas šiuo adresu:

Jei įdėjote failą į /files/ aplanką, jis bus pasiekiamas šiuo adresu:

Sėkmingai atsisiuntę failą, būtinai nurodykite paieškos robotams, kaip rasti šį failą. Tai daroma labai paprastai. Svetainės schemos direktyvoje esančiame faile robots.txt() įrašykite visą failo adresą. Pavyzdžiui, robots.txt failas gali atrodyti taip:

Svarbu! Skirtingai nei robots.txt, gali būti keli svetainės schemos failai. Tokiu atveju turite nurodyti visą adresą visuose svetainės schemos failuose, esančiuose robotuose ir žiniatinklio valdytojuose.

„Search Console“ ir „Yandex.Webmaster“ skydelis

Liko paskutinis etapas. Paieškos sistemų žiniatinklio valdytojo skydeliuose nurodykite kelią į svetainės žemėlapį.

  • Indeksavimo nustatymas
  • Svetainių schemos
  • „Patikrinti“ ir „Pridėti“

XML svetainės schemoje yra apribojimų:

  • Viename faile galite nurodyti daugiausia 50 000 URL
  • Failo svoris yra ne didesnis kaip 10 megabaitų (paieškos sistemos neindeksuoja didesnių nei 10 megabaitų dokumentų). Jei reikia, failą galima suglaudinti naudojant .gzip archyvatorių.
  • Failų kodavimas yra tik UTF-8

Šiuo metu pagrindiniai etapai yra baigti. Laikykitės visų aprašytų paprastų taisyklių ir neturėsite klaidų. Antroji straipsnio dalis skirta išsamesniems sitemap.xml parametrams, subtilybėms ir ypatybėms; šių žinių jums prireiks kuriant profesionalų internetinių parduotuvių svetainės schemą.

3. Svetainių schemų grupavimas

Jei viršijate 50 000 URL apribojimą, turite naudoti įdėtą struktūrą ir sukurti kelių svetainių schemų grupę. Tai yra, kurkite svetainių schemas svetainės schemoje!

Įprastoje svetainėje (ne dideliame portale ar internetinėje parduotuvėje) tokia puslapių apimtis yra reta, todėl dauguma SEO specialistų patogumui naudoja Svetainės schemos grupavimą, pavyzdžiui, norėdami sugrupuoti produktų puslapius ar skyrius.

Sintaksė yra tokia:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

XML žymų apibrėžimas:

Atributas


apibūdinimas

reikalaujama

Apima informaciją apie visas šiame faile esančias svetainių schemas.

reikalaujama

Inkapsuliuoja informaciją apie vieną svetainės schemos failą.

reikalaujama

Nurodo svetainės schemos failo vietą.

nereikalinga

Nurodo atitinkamo svetainės schemos failo modifikavimo laiką. Robotas naudoja šią informaciją, kad suprastų, kurie svetainės schemos failai pasikeitė. Netiesiogiai ši žyma leidžia robotui greitai atrasti naujus svetainės puslapius.

Taip sukuriamas sugrupuotas svetainės žemėlapis. Visos kitos procedūros yra tokios pat, kaip aprašyta aukščiau. Nepamirškite nurodyti teisingos nuorodos į failą robots.txt faile, svetainės schemos direktyvoje.

4. Tyrimas

2014 m. pabaigoje atlikau nedidelį tyrimą, kurio tikslas – išanalizuoti sitemap.xml failo turėjimo svetainėje efektyvumą.

Indeksuojant prekių grupę internetinės parduotuvės svetainėje kilo problema (apie 10 000 prekių). Tuo pačiu metu niekas netrukdė jų indeksuoti. Buvo sudarytas svetainės žemėlapio failas, kurį sudaro tik nuorodos į svetainės produktus. Svetainės žemėlapis buvo atnaujintas automatiškai. Per 2 mėnesius daugiau nei 70% URL buvo įtraukti į „Yandex“ paieškos variklio indekso duomenų bazę. Didelė dalis į indeksą įtrauktų puslapių yra puslapiai iš svetainės žemėlapio. Noriu pastebėti, kad per šį laikotarpį nebuvo imtasi jokių kitų priemonių svetainės indeksavimui paspartinti (pavyzdžiui, nuorodų pridėjimas).

Štai patys rezultatai:

Išvada: svetainės schema vis tiek turi įtakos jūsų svetainės indeksavimui. Būtina reguliariai atnaujinti ir atnaujinti šį failą.

5. Traškučiai

Kad šis straipsnis netaptų nuobodus patyrusiems SEO specialistams, siūlau susipažinti su šiais „gudrybėmis“.

Nuotraukų svetainės schema

Norėdami pritraukti papildomo srauto iš paieškos sistemų (galbūt ne visiškai konversijų srauto), galite sukurti papildomą svetainės schemą vaizdams.

Vaizdo svetainės schemos sintaksė atrodo taip:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://example.com/primer.html

http://example.com/kartanka.jpg

http://example.com/photo.jpg

Priminimas apie XML žymas:

Būtinai?

apibūdinimas

Yra visa informacija apie vieną vaizdą. Kiekviename URL (žymoje) gali būti iki 1000 žymų.

Vaizdo URL.

Kai kuriais atvejais vaizdo URL domenas gali skirtis nuo pagrindinės svetainės naudojamo domeno. Jei abu domenai bus patvirtinti „Search Console“, problemų nekils. Bet jei jūsų vaizdai priglobti naudojant turinio valdymo sistemą, pvz., „Google“ svetaines, turėsite patvirtinti prieglobos svetainę „Search Console“. Be to, failas robots.txt neturėtų užkirsti kelio turinio, kurį reikia indeksuoti, tikrinimui.

Vaizdo antraštė.

Filmavimo vieta. Pavyzdžiui, Poronaiskas, apie. Sachalinas.

Vaizdo pavadinimas.

Vaizdo licencijos URL.

Įsilaužimas į gyvenimą baigusiems skaityti

Daugelis SEO specialistų sugeneruoja svetainės schemos failus vieną kartą projekto pradžioje. Tada jie pamiršta apie svetainės žemėlapį. Puslapiai buvo indeksuoti – gerai. Ne, bet ką tu gali padaryti?! Paprastai jie pamiršta į svetainės schemą įtraukti naujų puslapių.

Tyrimo metu išsiaiškinau, kad patogiausias būdas išspręsti šią problemą yra atskiras sitemap.xml failas, kuriame bus tik tie svetainės puslapiai, kurie dar neindeksuoti.

Ir tai leido daugiau nei 70% naujų URL įtraukti į „Yandex“ indeksą.

 

Gali būti naudinga perskaityti: