سایت مپ در واقع، فایلی است که لیستی از مهم ترین محتواهای موجود در سایت را در بر دارد تا خزندههای گوگل بتوانند به راحتی این محتواها را ببینند و ایندکس کنند. همچنین سایت مپ به موتورهای جستجو میگویند که کدام محتواها از بقیه مهمتر است. در مقابل این نوع Sitemap یک نوع نقشه سایت دیگر نیز وجود دارد که مبتنی بر HTML است و در آن لیستی از مهم ترین فایل های موجود در سایت قرار دارد. این نوع نقشه سایت، بیشتر برای کاربران مورد استفاده قرار میگیرد تا بتوانند محتوای موجود در سایت را بیابند و از آن استفاده کنند. موتورهای جستجو از نقشه سایت XML (همان نوع اول) استفاده میکنند تا ساختار سایتها را یاد بگیرند. باید به خاطر داشته باشید که قرار دادن URL صفحاتِ سایت در سایت مپ، ایندکس شدن سایت را تضمین میکند. این موضوع به این معنی است که اگر نقشه سایتی از کدهای XML خوب استفاده کند، آدرسهای معتبر و مرتبی را برای کراولرها فراهم کند و سایر نیازمندیهای موتورهای جستجوگر را برآورده سازد، URLهای موجود در آن در Crawlهای بعدی مورد توجه قرار خواهند گرفت. همین امر شانس دیده شدن صفحات مختلف در موتورهای جستجوگر را افزایش میدهد.
اگرچه سایت مپ در هر شرایطی برای وبسایت مفید خواهد بود، اما در شرایط زیر بسیار موثر و کارساز است: سایت جدید با صفحات جدیدی دارید که هنوز به خوبی به آنها لینک داده نشده است (لینک داخلی و خارجی). میدانید که رباتهای گوگل و سایر crawlهای سطح وب، لینکها را دنبال میکنند و از صفحهای به صفحه دیگر میروند؛ بنابراین اگر سایت شما لینکی نداشته باشد ممکن است صفحات شما را پیدا نکنند. سایت شما واقعاً بزرگ است و ممکن است خزندههای Google از خزیدن در برخی از صفحات به روز شده شما غافل شوند. در سایتتان از URLهای داینامیک برای محتوای خود استفاده میکنید. محتوای آرشیو شدۀ سایتتان به خوبی به صفحات فعال، لینک نشدهاند. اگر تشخیص و شناسایی صفحات سایتتان بسیار دشوار است یا دارای محتوای غیر متنی سنگین، مانند فلش هستند. می توان گفت سایت مپها، در واقع ابزاری برای خوراک دادن و شناساندن سایت به موتورهای جستجوگر هستند.
همه موتورهای جستجوی مهم از پروتکل های XML رسمی که در سایت Sitemaps.org تعریف شده است، استفاده میکنند. یک نمونه کد XML که در سایت مپ مورد استفاده قرار میگیرد را در ادامه مشاهده میکنید:
کدهای XML سایت مپ شامل تگهای اختیاری و الزامی هستند. کدهای XML معتبر با تگهای شروع (بازشونده) “ “ آغاز میشوند که یک تگ الزامی است. سپس این تگ با تگ دیگری همچون “
موتورهای جستجوی گوگل و بینگ، فرمت XML را برای نقشه سایت به عنوان یک پروتکل پذیرفتهاند. با این حال، آنها Feed نقشه سایت را که از پروتکل های RSS 2.0، Atom 1.0 و فایل های متنی ASCII استفاده میکنند را نیز میپذیرند. سایت مپ را میتوان به شکل XML نیز مورد استفاده قرار داد یا در صورتی که حجم بالایی دارد با استفاده از ابزار Gzip، فشردهسازی کرد. علاوه بر استانداردهای نقشه سایت برای محتوای وب، گوگل از فرمتهای خاصی برای سایت مپ پشتیبانی میکند که برای رسانههای خاصی مورد استفاده قرار میگیرد. این موارد شامل نقشههایی برای فایلهای ویدئویی، تصاویر، محتوای موبایلی، کد منبع نرم افزار و محتوای خبری هستند. بعد از اینکه فرمت مناسب نقشه سایت در فضای نام اعلام شد، میتوان تمامی محتواهای اضافی دیگر را به آن افزود. نکات مهم درباره فرمت فایل سایت مپ 1. موتور جستجوی بینگ (Bing) از فرمتهایی که توسط گوگل پشتیبانی می شود حمایت نمیکند، اما یکی از مسئولان بینگ بیان کرده است هر چیزی که پشتیبانی نشود، نادیده گرفته خواهد شد. بنابراین وبمسترها میتوانند از این موارد در سایت مپ خود به راحتی استفاده کنند. گوگل توصیه میکند که نقشه سایتِ حاویِ محتوایِ خبری را به عنوان یک فایل جداگانه در نظر بگیرید زیرا این نوع سایت مپ بیشتر از سایر فایلها خزیده میشوند. موتورهای جستجوی گوگل و بینگ از فایل های Media RSS به عنوان جایگزینی برای تشخیص توضیحات متای فایل های ویدئویی استفاده می کنند. از آنجایی که بینگ نیز از این نوع فایل پشتیبانی میکند، توسعۀ Feed ویدئویی mRSS راهکاری هوشمندانه خواهد بود که از هدر رفتن وقتتان جلوگیری میکند.
بهتر است بدانید در فایل نقشه سایت، قوانین و محدودیتهایی نیز وجود دارد. این محدودیتها شامل موارد زیر هستند:
فضای نام یا namespace
نقشه سایت حتماً باید namespace داشته باشد و فضای نام پیش فرض را به خوبی مشخص کند: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
محدودیت در اندازه
فایل نقشه سایت نباید بیشتر از 50000 آدرس در خود داشته باشد. اندازه این فایل هم نباید بیشتر از 50 مگابایت باشد. اگر بیشتر از 5000 آدرس داشتید، از فایل ایندکس نقشه سایت استفاده کنید که در بخش بعد توضیح داده میشود.
نیازمندیهای متنی
فایل نقشه سایت باید به صورت UTF-8 باشد و از کاراکترهای entity-escaped در URL استفاده شود (به عنوان مثال جایگزین کردن کاراکتر “&” با کاراکتر “&” در آدرسهای داینامیک).
آدرسهایی با فرم یکسان
همه آدرسهایی که در نقشه سایت نوشته میشوند باید از قواعد یکسانی پیروی کنند. این موضوع به این معناست آدرس هایی که با WWW آغاز میشوند را نمیتوان با آدرسهای بدون پیشوند WWW ترکیب کرد. همچنین آدرسهایی که دارای شناسه جلسه (session ID) هستند را نیز در این فایل قرار ندهید.
موقعیت
فایل نقشه سایتی که در دایرکتوری ذخیره شده است، تنها میتواند آدرسهایی را نشان دهد که در آن دایرکتوری یا زیر دایرکتوریهای آن ذخیره شدهاند. آدرسهای موجود در دایرکتوریهای موازی، دایرکتوریهای والد، Subdomain های مختلف یا آنهایی که از پروتکل متفاوت استفاده میکنند مرجعهای معتبری نیستند. ذخیره کردن نقشه سایت در دایرکتوری ریشه میتواند از به وجود آمدن مرجع نامعتبر جلوگیری کند.
لینکهای سالم
به این نکته توجه داشته باشید که نقشه سایت تان نباید بیش از 1% خطای لینک داشته باشد. در غیر اینصورت کل نقشه دور انداخته میشود. خطای لینک، هر نوع کد پاسخ HTTP است که شامل تغییر مسیر 404 برای لینک های شکسته و ریدایرکت 301 و 302 برای لینکهای تغییر مسیر یافته است. این موضوع برای بینگ نیز یک قانونِ شناخته شده است. استفاده از لینکهای صحیح در قوانین سئو برای تمامی موتورهای جستجو الزامی است. شما میتوانید کد پاسخ HTTP برای هر URL را با استفاده از ابزار Header Checker بررسی کنید. برای آدرسهای متعدد در یک سایت، می توان از ابزارهایی همچون Find Broken Link و Find Broken Links, Redirects & Google Sitemap Generator Free Tool استفاده کرد.
فایل ایندکس نقشه سایت
بیشتر سایتهای بزرگ بیش از 50000 آدرس URL دارند که ایندکس شدنشان در موتورهای جستجو خیلی برایشان اهیمت دارد. از آنجایی که در نقشه سایت تنها اجازه ورود 50000 آدرس وجود دارد، وبمسترها میتوانند یک فایل ایندکس نقشه سایت برای خود ایجاد کنند. فایل ایندکس نقشه سایت میتواند بیش از 50000 ورودی داشته باشد.
اگر از وردپرس استفاده نمیکنید و یک CMS با زبان های (PHP ,HTML) اختصاصی دارید، اصلا نگران نباشید. شما میتوانید از یک ابزار تولیدکننده سایت مپ مثل XML-Sitemaps استفاده کنید که به سادگی این کار را برای شما انجام میدهند. فقط کافی است وارد سایت شوید(تصویر بالا) و در کادر مشخص شده، آدرس سایت خود را وارد کنید. بعد از چند ثانیه فایل سایت مپ برای سایت شما آماده تحویل است.
بر خلاف فایل robots.txt، موتورهای جستجو نمیتوانند به صورت خودکار به دنبال نقشه سایت بگردند و آن را بخوانند. بنابراین باید خودتان به صورت دستی این قایل را در اختیار گوگل قرار دهید.
برای انجام این کار وارد اکانت سرچ کنسول سایتتان شوید، از منوی سمت چپ گزینه سایت مپ را انتخاب کنید. اگر قبلاً سایت مپ خود را در گوگل ثبت کرده باشید.ثبت نقشه سایت در گوگل
اگر هیچ فایلی از قبل در این قسمت وجود ندارد، آدرس فایل خود را بگذارید و دکمه Submit را بزنید.
اگر همه چیز درست تنظیم شده باشد، شما اطلاعات sitemap خود را در قسمت نقشههای سابمیت شده ببینید.
بعد از مدتی روی فایل سابمیتشده کلیک کنید، اگر پیام «Sitemap index processed successfully» برایتان نمایش داده شد، یعنی گوگل سایت شما را بررسی و تأیید کرده است.