آموزش کامل سرچ کنسول گوگل (قسمت دوم)

آموزش کامل سرچ کنسول گوگل - قسمت دوم : استفاده از گزارش “Index Coverage”

قسمت دوم: چگونه سئو تکنیکال خود را با گوگل سرچ کنسول بهینه کنید.
در این قسمت به شما نحوه استفاده از امکانات سرچ کنسول برای رفع ایرادات سئو وب سایت را آموزش خواهم داد:

استفاده از گزارش “Index Coverage” برای پیدا کردن مشکل ایندکس شدن و درست کردن آن

اگر وب سایت شما به درستی ستاپ شده باشد، گوگل:

  • صفحه شما را پیدا می کند
  • و به سرعت آن را ایندکس می کند

اما بعضی اوقات، اوضاع خوب پیش نمی رود.

اگر بخواهید همه ی صفحات شما ایندکس شود، کارهایی هست که باید انجام دهید.

اینجا گزارش “Index Coverage” به کار می آید.

گزاراش “Index Coverage” چیست؟
گزارش “Index Coverage” به شما نشان می دهد که کدام صفحات وب سایت شما در گوگل ایندکس شده اند. همچنین به شما مشکلات تکنیکالی که باعث می شود جلوی ایندکس صفحات را بگیرد، نشان می دهد.<

گزارش index coverage

نکته: گزارش Coverage مقداری پیچیده است.

و من فقط می توانم یک لیست از آنها به شما بدهم و برایتان آرزوی خوش شانسی کنم.

بجای آن، به شما به صورت گام به گام آنالیز یک سایت واقعی را یاد خواهم داد.

به این صورت میتوانید نحوه استفاده از گزارش Index Coverage برای پیدا کردن مشکلات و رفع آنها را یاد میگیرید.

چگونه توسط گزارش Index Coverage ارورهای سایت را پیدا کنیم

در بالای صفحه ی گزارش Index Coverage ما ۴ تب داریم:

  1. Error
  2. Valid with warnings
  3. Valid
  4. Excluded

خطاهای over time

الان تمرکز خود را بر روی تب Error می گذاریم.

همانطور که می بینید، این وب سایت ۵۴ خطا دارد. این نمودار نشان می دهد که چطور این اعداد در طول زمان تغییر می کنند.

اگر به پایین اسکرول کنید، شما اطلاعات مربوط به هر خطا را خواهید دید:

خطاهای indexation

دلایل زیادی در اینجا وجود دارد.

برای اینکه شما این دلایل را در کنید، توضیحات مختصری در مورد هر کدام به شما میدهم:

“Submitted URL seems to be a Soft 404”

این به این معنی است که این صفحه “پیدا نشده” است، اما کدهایی در Header وجود دارد که یک وضعیت نادرست را برگردانده است. ( البته این مورد کمی گیج کننده است )
“Redirect error”
یک redirect (301/302) برای این صفحه وجود دارد، اما کار نمی کند.
“Submitted URL not found (404)”
صفحه پیدا نشد و سرور کد (۴۰۴) درستی را برگردانده است.
“Submitted URL has crawl issue”
این می تواند به ۱۰۰ دلیل مختلف اتفاق بیفتد. باید صفحه را بررسی کنید تا ببینید مشکل چیست.
“Server errors (5xx)”
روبات های گوگل نمی توانند به سرور دسترسی پیدا کنند. ممکن است خراب شده باشد، تایم اوت داده باشد، یا زمانی که روبات گوگل به آن سر زده است، مشکل داشته است.

و وقتی شما بر روی یکی از دلایل خطاها کلیک کنید، شما لیستی از صفحاتی که مشکل دارند را مشاهده خواهید کرد.

صفحات affected

خطاهای ۴۰۴ به آسانی قابل رفع کردن هستند. خب شروع می کنیم با رفع کردن خطاهای ۴۰۴۰.

بر روی URL ی که در لیست وجود دارد، کلیک کنید. با این کلیک ۴ گزینه در سمت راست نمایان می شود:

خطای individual

اما ابتدا باید با مرورگر خود صفحه را بررسی کنید، به این صورت می توانید بررسی کنید که آیا واقعا صفحه ی شما مشکل دارد یا خیر.

سپس لینک خود را در قسمت URL inspection در بالای صفحه ی وارد کنید.

ابزار url inspection

و روبات گوگل صفحه ی شما را بررسی میکند.

و شما اطمینان حاصل میکنید که این صفحه خطای ۴۰۴ می دهد.

fetch as google

چگونه این مورد را درست کنیم؟

خب، ۲ گزینه داریم:

  1. به همان صورتی که است بگذاریم بماند، گوگل نهایتا آن صفحات را deindex می کند.
  2. شما می توانید آن صفحه ی ۴۰۴ را به یک محصول مشابه، صفحه ی دسته بندی یا پست بلاگ ریدایرکت کنید.

چگونه خطاهای “Soft 404” را رفع کنیم

حالا وقت اینه که خطاهای “Soft 404” را رفع کنیم.

دوباره URL هایی که این خطا را دارند بررسی کنید.

ارور soft 404

سپس هر URL را در مرورگر خود باز کنید.

اگر بعد از بررسی مشاهده کردید که صفحه ی مورد نظر بدون مشکل است.

با ابزار URL inspection بررسی کنید که آیا گوگل هم میتواند به این صفحه دسترسی پیدا کند یا خیر.

ابزار url inspection input url

این بار، ما بر روی دکمه “TEST LIVE URL” کلیک میکنیم. اینکار روبات های گوگل را به آن صفحه می فرستند. همچنین صفحه ی شما را به همان صورتی که روبات گوگل آن را می بیند، رِندِر می کند.

 

دکمه test live url

 

به نظر میاد گوگل این بار آن صفحه را پیدا کرده است.

url برای گوگل در دسترس است

حالا ببینید که گوگل چگونه آن صفحه را رِندِر کرده است. بر روی “VIEW TRSTED PAGE” کلیک کنید و سپس تب “SCREENSHOT” را مشاهده کنید.

در صورتیکه مشابه چیزی بود که کاربرها آن را می بینید، خیلی خوب است.

سپس، بر روی تب “MORE INFO” کلیک کنید و بررسی کنید که کدام یک از منابع را گوگل به درستی نمی تواند بخواند.

منابع لود نشده اند

گاهی اوقات دلایل خوبی برای بلاک کردن بعضی منابع از روبات های گوگل وجود دارد. اما گاهی اوقات این بلاک کردن ها باعث خطاهای “Soft 404” می شوند.

در این مورد ۵ منبع بلاک شده است.

وقتی مطمئن شدید که هر کدام از این خطاها رفع شدند. بر روی دکمه “REQUEST INDEXING” کلیک کنید:

دکمه request indexing

این به گوگل می گوید که صفحه را ایندکس کند.

دفعه ی بعدی که ‍روبات های گوگل به وب سایت شما سر می زنند، آن صفحه باید ایندکس شود.

چگونه سایر خطاها را رفع کنید

شما می توانید از همین روندی که برای خطاههای “Soft 404” طی کرده ایم برای رفع سایر خطاها استفاده کنید:

  1. صفحه ی خود را در مرورگر باز کنید
  2. توسط ابزار “URL inspection” صفحه را برسی کنید
  3. اطلاعات خاصی که گوگل سرچ کنسول در مورد آن خطا به شما می دهد را مطالعه کنید
  4. هر مشکلی که وجود دارد را برطرف کنید.

اینجا چند مثال کوچک می زنیم:

  • Redirect errors
  • Crawl errors
  • Server errors

با کمی تلاش، شما می توانید تقریبا هر خطایی را در گزارش “Index Coverage” برطرف کنید.

چگونه “Warnings” را در گزارش Index Coverage برطرف کنیم

بر روی تب “Valid with warnings” در گزارش “Index Coverage” کلیک کنید

فیلتر اخطارها

این بار فقط یک “Warning” وجود دارد: “Indexed, though blocked by robots.txt”.

فیلتر کردن اخطارها

خب اینجا چه چیزی داریم؟

گوگل سرچ کنسول به ما می گوید که صفحاتی توسط robots.txt بلاک شده اند. پس بجای اینکه بر روی “Fetch As Google” کلیک کنید، بر روی “Test Robots.txt Blocking” کلیک کنید:

بلاک کردن ربات ها

این ما را به robots.txt tester در سرچ کنسول قدیمی می برد.

اگر این URL توسط robotx.txt بلاک شده باشد، به روش زیر آن را برطرف کنید.

اگر می خواهید آن صفحه ایندکس شود، باید آن را از robots.txt حذف کنید.

اما اگر نمیخواهید ایندکس شود، دو گزینه دارید:

  1. تگ “noindex,follow” را به صفحه اضافه کنید و آن را از robots.txt حذف کنید.
  2. با استفاده از ابزار URL Removal از دست این صفحه خلاص شوید.

چگونه از ابزار “URL Removal” در سرچ کنسول استفاده کنیم

استفاده از ابزار “URL Removal” برای حذف صفحات از ایندکس گوگل سریع و آسان است.

متاسفانه هنوز این ابزار به گوگل سرچ کنسول جدید نیامده است، بنابراین لازم است که از آن در گوگل سرچ کنسول قدیمی استفاده کنید.

ابزار “Removals” در زیر تب “Legacy tools and reports” در گوگل سرچ کنسول جدید قرار دارد و شما را به سرچ کنسول قدیمی می برد.

گوگل سرچ کنسول removals

در نهایت، URL خود را برای حذف کردن در این ابزار وارد می کنید:

حذف url

چند بار بررسی کنید که URL درست را وارد کرده اید، سپس بر روی “Submit Request” کلیک کنید.

تایید removal

به این صورت این صفحه از گوگل حذف می گردد.

بررسی صفحات ایندکس شده برای مشکلات موجود

حالا تب “Valid” را بررسی میکنیم.

این به ما می گوید که چند صفحه در گوگل ایندکس شده اند.

ایندکس های مورد تایید

اینجا باید به چه چیزهایی توجه کنید؟ به دو چیز.

1 – کاهش یا افزایش غیر منتظره صفحات ایندکس شده

آیا تا بحال شاهد کاهش ناگهانی صفحات ایندکس شده، بوده اید؟

این میتواند نشانه ای برای یک مشکل باشد:

  • شاید بعضی از صفحات روبات های گوگل را بلاک کرده باشند
  • یا شاید شما به اشتباه تگ noindex را به صفحات اضافه کرده باشید

بهرحال:

جز اینکه آگاهانه یک سری از صفحات را deindex کرده باشید، احتمالا بخواهید این مورد را بررسی کنید.

در سمت مقابل:

چی میشد اگر شاهد افزایش ناگهانی صفحات ایندکس شده، می شدید؟

دوباره، این میتواند نشانه ای برای یک مشکل باشد.

( برای مثال، شاید شما تعدادی صفحه که باید بلاک باشند را از بلاک در آورده باشید)

۲ – افزایش غیر منتظره تعداد زیاد صفحات ایندکس شده

در حال حاضر مشاهده می کنید ۴۱ پست در وب سایت داریم.
پست های منتشر شده

خب وقتی به گزارشات تب “Valid” در “Index Coverage” نگاه میکنیم، انتظار داریم این مقدار صفحه ایندکس شده باشند.

اما اگر این مقدار بیشتر از ۴۱ باشد چه؟ این یه مشکل هست. و باید آن را رفع کنیم.

مطمئن شوید مواردی که نباید Exclude شوند، Exclude نشوندحالا:

دلایل خیلی خوبی برای جلوگیری از ایندکس شدن یک صفحه در موتورهای جستجو وجود دارد.

شاید یک صفحه ی لاگین باشد.

شاید یک صفحه شامل مطالب تکراری باشد.

یا شاید صفحه ای با کیفیت کم باشد.

منظور از صفحه با “کیفیت کم” به این معنی نیست که آن صفحه به درد نمی خورد. ممکن است صفحه برای مخاطب ها مفید باشد اما به اندازی کافی برای موتور های جستجو مناسب نباشد.

به این معنی که:

قطعا میخواهید مطمئن شوید که صفحاتی که میخواهید ایندکس شوند از دید گوگل Exclude نشوند.

در این مورد، ما تعداد زیادی صفحه داریم که Exclude شده اند…
صفحات exclude شده

و اگر به پایین اسکرول کنید، شما لیستی از دلایل exclude شدن صفحات از ایندکس گوگل را مشاهده می کنید.

خطاهای صفحات excluded

خب بذارین بیشتر توضیح بدم…

“Page with redirect”

صفحه به یک URL دیگر ریدایرکت می شود.

این کاملا اوکی هست. مگر اینکه بک لینک ها یا لینک های داخلی به آن صفحه لینک شده باشند، در نهایت گوگل از ایندکس کردن آن جلوگیری میکند.

“Alternate page with proper canonical tag”

گوگل ورژن دیگری از این صفحه را در جای دیگر پیدا کرده است.

این کاری است که یک Canonical URL باید انجام دهد. پس این اوکی است.

“Crawl Anomaly”

می تواند دلایل مختلفی داشته باشد. بنابراین باید جستجو کنید.

“Crawled – currently not indexed”

صفحاتی وجود دارند که گوگل Crawl کرده است، اما بنا به دلایلی ایندکس نشده اند.

گوگل دلیل دقیقی برای اینکه این صفحات ایندکس نشده اند به شما نمی دهد.

اما طبق تجربه ی من، این خطاها به این معنی است که صفحه به اندازه ی کافی خوب نیست که در نتایج گوگل نمایش بگیرد.

خب، چه باید بکنید تا این مشکل حل شود؟

توصیه ی من اینه که کیفیت هر کدام از صفحات لیست شده را بهبود دهید.

برای مثال، اگر یک صفحه ی دسته بندی باشد، مقداری محتوا که آن دسته بندی را توضیح دهد، به آن اضافه کنید. اگر صفحه مقدار زیادی محتوای تکراری داشته است، آن را یکتا کنید. اگر صفحه محتوای زیادی نداشت، محتوای آن را بیشتر کنید.

در کل، کاری کنید که صفحه برای ایندکس شدن در گوگل با ارزش شود.

“Submitted URL not selected as Canonical”

منظور گوگل این است:

“این صفحه محتوایی مشابه سایر صفحات دارد. اما ما فکر میکنیم که URL دیگری محتوای بهتری دارد”

بنابراین آنها این صفحه را از ایندکس گوگل حذف کرده اند.

توصیه ی من: اگر شما محتوای تکراری در تعدادی از صفحات دارید، تگ noindex به همه ی صفحات بجز صفحه ای که میخواهید ایندکس شود اضافه کنید.

“Blocked by robots.txt”

اینها صفحاتی هستند که robots.txt از Crawl شدن آنها توسط گوگل جلوگیری کرده است.

ارزشش را دارد که این خطاها را بررسی کنید تا مطمئن شوید صفحاتی که بلاک شده اند باید بلاک می شدند.

اگر همه چیز خوب به نظر می رسد. پس robots.txt به خوبی عمل کرده است و نیازی نیست نگرانش باشید.

“Duplicate page without canonical tag”

این صفحه قسمتی از صفحات تکراری می باشد و شامل Canonical URL نمی باشد.

در این مورد، به راحتی متوانید ببینید که چه چیزی شده است.

“Discovered – currently not indexed”

گوگل این صفحات را Crawl کرده است، اما هنوز آنها را ایندکس نکرده است.

“Excluded by ‘noindex’ tag”

همه چیز خوب است. تگ noindex به خوبی عمل می کند.

خب این گزارش Index Coverage بود. این یک ابزار خیلی شگفت انگیز است.

نظر دهید