پیغام خطای discovered – currently not indexed نشون میده که Google از وجود URL صفحه شما اطلاع داره، اما هنوز اون رو کراول نکرده (و بنابراین ایندکس هم نشده).

برای اکثر وب سایت های کوچیک، این حالت URL طبیعی است و پس از خزیدن URL ها توسط Google، این مسئله به طور خودکار برطرف میشه. روند ایندکس شدن URL یه سایت در تصویر زیر نشون داده شده:

ایندکس شدن

در تصویر زیر هم خطای discovered – currently not indexed که ممکنه برای شما در کنسول جستجوی گوگل ظاهر بشه رو نشون دادیم:

discovered - currently not indexed

ولی اگه شما در وبسایت های بزرگتر (یعنی حدوداً بیشتر از ۱۰.۰۰۰ صفحه) با این مسئله روبرو هستین، ممکنه دلایل زیر در به وجود اومدن این خطا موثر باشن:

  1. Overloaded server سرور بیش از حد شلوغ: گوگل در خزیدن سایت شما با مشکل روبرو شده. چون که به نظر میرسه این سایت بیش از حد شلوغ شده. اگه این مورد باعث ایجاد مشکل شما شده بود با ارائه دهنده میزبانی خودتون مشورت کنین.
  2. Content overload اضافه بار محتوا: وب سایت شما محتوای خیلی بیشتری نسبت به چیزی که Google در حال حاضر برای خزیدن می‌خواد، داره. پس خزنده‌ها فکر می‌کنن که کراول کردن این سایت ارزش نداره. نمونه‌هایی از مطالب متناسب با این مورد: صفحات دسته محصولات فیلتر شده، محتوای تولید شده خودکار و محتوای تولید شده توسط کاربر. در صورتی که می‌خواین Google اون صفحه رو کراول و فهرست بندی کنه می‌تونین با هرس کردن content pruning و منحصر به فرد کردن محتوا این کار رو انجام بدین. همینطور با حذف لینک های داده شده به اون ضفحه و به روزرسانی فایل robots.txt خودتون، برای جلوگیری از دسترسی Google به URl هایی که نباید محتوای اونها رو discover کنه می‌تونین این مشکل رو حل کنین.
  3. ساختار پیوند داخلی ضعیف: Google راه‌های کافی برای ورود به محتوایی که قراره کراول بشه پیدا نمی‌کنه. پس با بهبود ساختار پیوند داخلی می‌تونین این مشکل رو برطرف کنین.

شماره ۱ و ۲ نمونه‌های کلاسیک مسائل مربوط به خزیدن است که برای وب سایت های بزرگتر، این موضوع نگران کننده است.

تو این راهنما قراره به یکی از خطای Coverage کنسول جستجوی گوگل بپردازیم و ببینیم چطوری میشه از شر discovered currently not indexed خلاص شد، پس تا آخر مقاله با ما همراه باشین:

پیغام discovered currently not indexed

پیغام خطای discovered – currently not indexed به این معنیه که Google با استفاده از فایل sitemap.xml یا از طریق URL Bot با موفقیت URL های وب سایت رو کشف کرده اما در فهرست جستجوی Google ایندکس نشده. بنابراین در کنسول جستجوی گوگل پیغامی با این شکل: discovered – currently not indexed ظاهر میشه که میگه: URL ها خزیده و کشف شده‌اند اما هنوز در جستجوی Google ایندکس نشدن!
اگه تعداد زیادی صفحه در کنسول جستجوی Google خودتون دارین که Exclude شدن، ممکنه متوجه بشین که خیلی از اونها با این پیغام discovered – currently not indexed نشون داده میشن.

اگه در بررسی این پیغام خطا مهارت کافی رو پیدا کنین، با کلیک کردن روی صفحه متوجه میشین که Google حتی این صفحات رو کراول هم نکرده، چون که آخرین تاریخ خزیده شدن اونها N/A هست:

تاریخ آخرین خزش

توضیحی که توسط گوگل داده شده اینه که ممکنه ربات google در تلاش برای جستجوی صفحه با مشکلی روبرو شده باشه. البته به نظر ما این اتفاق خیلی بعید و دور از ذهنه، زیرا بعضی سایت ها به سختی ترافیک دارن و در Blogger-Google میزبانی میشن!!

البته اینجا یه توضیح محتمل‌تر هم داریم و اون اینه که، به هر دلیلی، Google این صفحات رو مهم ندونسته و اونها رو در صف خزیدن بسیار کم قرار داده و از اونجایی که ربات گوگل خیلی سرش شلوغه، هرگز مجبور به دوباره برگشتن و کراول کردن اونها نمیشه.

پرسش
حالا به نظرتون Google رو چه حسابی تعیین می‌کنه یه صفحه مهمه یا مهم نیست، وقتی حتی اون رو کراول نکرده؟

درسته که شما یه URL با نقشه سایت ارسال می‌کنین یا Google Bot صفحه وب شما رو از طریق مکانیسم پیوند کشف کرده، اما خب این کشف کردن از طریق خزنده های ارگانیک Google انجام شده. ولی خب سایت شما هنوز ایندکس نشده و همچنین Google Bot صفحات زیادی رو در وب سایت شما مشاهده می‌کنه و علاقه‌ای نداره که در حال حاضر اونها رو ایندکس کنه. پس اینطوریه که خطای discovered – currently not indexed ظاهر میشه!

نحوه رفع وضعیت discovered – currently not indexed

اگه چشمتون به مواردی خورد که با این پیغام روبرو بودن و ایندکس نشده‌ بودن، باید تو سه تا مورد زیر دنبال دلیل خطا بگردین:

۱- ابتدا اطمینان حاصل کنین که به طور تصادفی URL های زیادی تولید نمی‌کنین.

۲ – مطمئن بشین که پیوند داخلی به خوبی کار میکنه و تلاش کنین که تعداد صفحات رو کاهش بدین.

۳ – به نوعی محتوا رو برای تقویت بیشتر ترکیب کنین!

discovered – currently not indexed

هنگامی که دیدین URL وب سایت شما با مشکل ایندکس نشدن و این پیغام روبرو شده، بدونین که URL در حال تکمیل موفقیت آمیز فرآیند کشف و خزیدن توسط Google Bot است اما خب هنوز ایندکس نشده و ممکنه بعد از مدتی Google Bot فکر کنه که آیا URL باید براساس اطلاعاتی که در اونها ارائه میدین، فهرست بندی بشه یا نه.

کنترل فنی discovered currently not indexed در کنسول جستجو

همیشه سعی کنین URL های وب سایت خودتون رو برای Google Bot بدون هیچ گونه ارور ۴۰۴ ، قابل کشف و کراول کنین، بعد از همه این موارد اگه چک کردین و دیدین که حدود ۹۹ درصد پیج‌ها ایندکس نشدن وقتشه که سراغ یه سری از مسائل فنی برین! به این فکر کردین که آیا تا حالابه طور تصادفی با استفاده از انواع مختلفی از الگوهای URL، یو آر الی تولید می‌کنین یا نه؟ بله اینجا همون جاییه که مسئله دیگه فقط ایندکس نشدن صفحات نیست، بلکه ممکنه تو انبوهی از URLهای به ظاهر مشابهی که در حقیقت کاملاً متفاوت هستن، گم بشین.

بنابراین مواردی مانند پارامترهایی که در URL خودتون دارین مثل سایز حروف، می‌تونن منجر به تولید محتوای تکراری بشن و اگه ربات گوگل بسیاری از این URL های تکراری رو کشف کرده باشه، به نظرتون لازم میدونه همه رو ایندکس کنه؟! معلومه که نه!

درخواست ایندکس کردن دستی

پس از آزمایش، متوجه شدیم که می‌تونین از Google درخواست کنین فلان صفحه رو فهرست بندی کنه. در واقع با این کار به گوگل می‌گین که اولویت بیشتری برای این صفحه قرار بده و به طور کلی طی چند روز هم کراول و هم ایندکس بشه، پس در واقع می‌تونیم از این روش برای دور زدن discovered – currently not indexed استفاده کنیم!

اما نکته منفی این کار اینه که شما می‌تونین صفحات رو یکی یکی درخواست کنین. بنابراین باید به هر صفحه برین و روی REQUEST INDEXING کلیک کنین. در شکل زیر نحوه انجام دادن این کار بهتون نشون داده شده:

discovered - currently not indexed

روی پیوندی که می‌خواین برای اون درخواست ایندکس کردن بفرسین و روی دکمه INSPECT URL که نشون داده میشه کلیک کنین. با این کار به صفحه‌ای میرین که جزئیات بیشتری برای URL انتخاب شده نشون میده:

inspect url

در این صفحه باید نوشته بشه «URL در Google نیست» و آخرین تاریخ خزیدن N/A است.

روی دکمه REQUEST INDEXING کلیک کنین تا یه پنجره براتون باز بشه که Google رو در حال پردازش و ارسال درخواست نشون میده. این کار حدود یک یا دو دقیقه طول میکشه.

همین کار رو برای هر صفحه‌ای که می‌خواین درخواست ایندکس بدین، انجام بدین تا دیگه از شر خطای discovered – currently not indexed هم راحت بشین.

نتیجه فهرست بندی رو بررسی کنین

بعد از ۶ یا ۷ روز دوباره درخواست خودتون رو بررسی کنین، سپس خواهید دید دیگه با discovered – currently not indexed مواجه نمی‌شین.

کلام آخر

اگه URL هایی رو در این بخش مشاهده کردین که در حال حاضر فهرست نشده، اون URL ها رو لیست کنین و با ابزار بازرسی URL بررسیشون کنین و ببینین که آیا خطایی با ابزار بازرسی URL مشاهده می‌کنین یا نه. اگه از صفحات خاص خطایی دریافت کردین، فقط این خطاها رو برطرف کنین و اجازه بدین تا ربات گوگل از طریق آزمایش زنده با کنسول جستجوی گوگل اون رو کراول کنه و برای صفحات اون URL ها تغییری ایجاد کنه و درخواست ایندکس کردن بده و URL های وب سایت شما رو که در حال حاضر فهرست نشده یا به عبارتی حاوی پیام discovered currently not indexed است رو حذف exclude کنه.

امیدواریم که آموزش برای شما مفید واقع شده باشه. هر سوال یا نظری درباره این موضوع دارین، می‌تونین از طریق کامنت‌ها با ما در ارتباط باشین.