Навчання
Crawl budget для e-commerce: як не витрачати Googlebot на слабкі URL
E-commerce сайти легко створюють тисячі слабких URL. Цей гайд показує, як захистити crawl budget і залишити важливі сторінки доступними.
Запусти свіжий аудит DomainLens і використовуй звіт як список пріоритетів.
Чому crawl budget в e-commerce швидко ускладнюється
Інтернет-магазини швидко генерують комбінації URL: filters, sorting, pagination, variants, tracking parameters, search results і out-of-stock pages. Багато з них корисні покупцям, але слабкі для пошуку.
Ціль не в тому, щоб усе заблокувати. Ціль — допомогти crawlers витрачати більше часу на indexable categories, product pages, buying guides і сторінки, які реально можуть отримувати трафік.
Звідки зазвичай береться waste
- Faceted navigation створює багато майже дубльованих filter URLs.
- Sort parameters і tracking parameters створюють crawlable copies.
- Out-of-stock або discontinued products лишаються indexable без плану.
- Internal links ведуть на redirected, canonicalized або noindex URLs.
Як це чистити
Спершу виріши, які filtered URLs заслуговують на індексацію. Цінні landing pages мають отримати clean internal links, self-canonical tags і унікальний контент. Low-value combinations зазвичай треба canonicalize, noindex або блокувати від crawl залежно від кейсу.
XML sitemaps мають містити canonical 200 URLs. Посилайся прямо на final product і category URLs, а не parameterized versions. Для discontinued products роби redirect тільки коли є сильна заміна; інакше краще корисний 404 або noindexed archive page.
Як відстежувати прогрес
Використовуй DomainLens, щоб ловити crawlability, canonical, sitemap, redirect і internal-link проблеми на репрезентативних templates. Потім дивись Search Console і logs, чи Googlebot витрачає менше часу на junk і більше на commercial pages.
Переглядай правила після merchandising змін. Filter, який минулого сезону був low value, може стати valid landing page, якщо змінився попит або inventory.