NETWORK TECHNOLOGY
Комплексни ИТ решения, поддръжка, сигурност и автоматизация за Вашия бизнес
Техническа поддръжка: 24/7
+359 2 958 6535

OpenCart: Kак спираме search URL-и и чистим crawl budget в Google

Как да спрем индексацията на OpenCart search и параметри, да намалим “Crawled – not indexed” и да освободим crawl budget за категории и продукти.

OpenCart SEO почистване: Спираме индексацията на “боклук” URL-и (search, филтри, параметри), чистим “Crawled – currently not indexed” и освобождаваме crawl budget, за да се обхождат по-често категориите и продуктите. Настройка дистанционно (Zoom/AnyDesk) с тестове на място.

OpenCart: Как да махнем search страниците от Google и да освободим crawl budget

Ако в Search Console виждате много “Crawled – currently not indexed” и примери като index.php?route=product/search&tag=..., проблемът почти винаги е един и същ, Google намира огромен брой динамични URL-и, които нямат SEO стойност. По-долу е точната методика как се оправя, без да чупим магазина и без да режем важни страници.

⚠ Това не е “магия за класиране”. Това е хигиена. Ако Google губи ресурс в параметри и search комбинации, реалните категории и продукти се обхождат по-рядко, индексирането става по-бавно и получавате шум вместо SEO ефект.

Google Search Console – много Crawled currently not indexed страници

При OpenCart много често се индексират (или поне се обхождат) URL-и, които не трябва да съществуват за Google. Това са search страници, резултати по тагове, филтри с параметри, сортирания, лимити, пагинации и всякакви комбинации. Резултатът е огромен брой “страници”, които не носят трафик, но изяждат crawl budget.

1) Какво означава “Crawled – currently not indexed”

Това означава, че Google е обходил страницата, видял е съдържанието и е решил да не я индексира. Само по себе си това не е проблем. Проблем е, когато броят им стане огромен, защото тогава Google харчи време за “страници”, които никога няма да ви донесат трафик.

Реално Google казва: “Виждам го, но не ми трябва”. Ние трябва да го накараме да спре да го обхожда, или да получава ясен сигнал, че това не е страница за търсене. Това е типична задача при технически SEO одит.

2) Защо се случва при OpenCart

Най-честите източници на шум са:

Важното: тези URL-и често са полезни за потребителя като функционалност, но са токсични за SEO, защото създават много дубли и “тънки” страници.

3) Каква е целта, кое махаме и кое оставяме

Целта не е да “скрием” сайта от Google. Целта е Google да вижда само стойностните страници: категории, продукти, статични страници, блог, landing-и. Всичко, което е вътрешен инструмент (search, филтри, сортиране), трябва да се контролира. При OpenCart това често върви заедно с OpenCart разработка и персонализация.

Оставяме за Google
  • Категории
  • Продукти
  • Информационни страници
  • Блог / статии
  • Важни landing страници
Ограничаваме за Google
  • Search (route=product/search)
  • sort, order, limit
  • параметри от филтри
  • безсмислени комбинации и дубли

4) План за действие (robots, meta, htaccess, sitemap)

Правим го на няколко нива. Едното само няма да реши всичко, комбинацията е важна.

4.1 robots.txt, минимален и чист

robots.txt не “махa” вече индексирани URL-и, но спира бъдещо обхождане и намалява шума. Пример за OpenCart, който е достатъчен в 90% от случаите:

robots.txt (препоръчано)

User-agent: *
Disallow: /admin/
Disallow: /system/
Disallow: /storage/
Disallow: /vendor/

# OpenCart internal routes
Disallow: /*?route=account/
Disallow: /*?route=checkout/
Disallow: /*?route=affiliate/
Disallow: /*?route=product/search

# Common parameter noise (if your theme generates these)
Disallow: /*?sort=
Disallow: /*&sort=
Disallow: /*?order=
Disallow: /*&order=
Disallow: /*?limit=
Disallow: /*&limit=

Allow: /

Sitemap: https://YOUR-DOMAIN.bg/sitemap.xml
Ако имате филтри, които генерират параметри като &color= или &price=, добавяме и тях. Не копираме безкрайни списъци. Правим го само за параметрите, които реално се виждат в индекса.

4.2 Meta robots за search и филтърните страници

Ако не искаме да режем функционалността на страницата, но не искаме индексация, най-чистото решение е: noindex, follow на search страниците и “резултатни” страници. Това става с малка корекция в controller-а или чрез OpenCart модули и OCMOD доработка.

4.3 Canonical за параметри

При категории с sort, order, limit и подобни, canonical трябва да сочи към чистия URL (без параметрите). Така Google спира да ги приема като отделни страници. При по-тежки магазини това често върви с Journal3 оптимизация и доработка.

4.4 htaccess, махане на tracking и “мръсни” параметри

Ако имате URL-и с utm, gclid, fbclid и други, препоръчително е да се чистят с 301 към чистия URL. Това е лесна победа, защото намалява дублирането.

Важно: не правим 301 от search към начална или категория “на сила”. По-добре noindex и ограничено обхождане, отколкото грешно пренасочване, което може да обърка Google.

4.5 Sitemap, само стойностни страници

Sitemap трябва да съдържа категории и продукти, не search, не филтри, не параметри. Ако sitemap е чист, Google започва да се ориентира по него много по-добре. При нужда това се комбинира и с структурирани данни и техническа SEO настройка.

5) Кога 410 Gone има смисъл и кога не

410 Gone е полезно, когато имате URL-и, които не искате да съществуват изобщо и вече са влезли в индекса, например search URL-и с тагове, които Google е индексирал масово.

Ако върнете 410 за всички search URL-и, това е ОК само ако сте сигурни, че не режете легитимна страница. Обикновено search страницата като функционалност трябва да си работи за потребителя, просто да е noindex. Затова 410 се ползва избирателно, не като универсална брадва.

6) Как проверяваме дали Google спира да ги “яде”

След настройките гледаме 3 неща:

Най-видимият ефект е, че Google започва да обхожда по-често реалните продуктови и категорийни URL-и, а не безсмислени комбинации. Това често се вижда и след OpenCart оптимизация на скорост.

7) Често задавани въпроси

Искате да изчистим OpenCart индексацията и crawl budget-а?

  • Откриваме реално индексираните “шумни” URL-и
  • Настройваме robots.txt, canonical, noindex и sitemap
  • При нужда, правим контролирано 410 за вече индексирани search страници
  • Тестваме на живо в Search Console (URL Inspection)

Пишете на office@ntg.bg или заявете SEO консултация. За по-широка работа по магазина вижте и OpenCart поддръжка.

Практическият стандарт е прост: Google трябва да вижда стойностните страници, а шумът да бъде ограничен. Така индексирането става по-стабилно и по-предсказуемо, без случайни “изненади” от параметри и search комбинации.


Снимка на автора
Автор

инж. Свилен Арсов

Ръководител ИТ инфраструктура и сигурност в Network Technology.

Коментари

Зареждане…
Само регистрирани и влезли потребители могат да коментират.