Как да спрем индексацията на OpenCart search и параметри, да намалим “Crawled – not indexed” и да освободим crawl budget за категории и продукти.
Ако в Search Console виждате много “Crawled – currently not indexed” и примери като
index.php?route=product/search&tag=..., проблемът почти винаги е един и същ,
Google намира огромен брой динамични URL-и, които нямат SEO стойност. По-долу е точната методика как се оправя,
без да чупим магазина и без да режем важни страници.
⚠ Това не е “магия за класиране”. Това е хигиена. Ако Google губи ресурс в параметри и search комбинации, реалните категории и продукти се обхождат по-рядко, индексирането става по-бавно и получавате шум вместо SEO ефект.
При OpenCart много често се индексират (или поне се обхождат) URL-и, които не трябва да съществуват за Google. Това са search страници, резултати по тагове, филтри с параметри, сортирания, лимити, пагинации и всякакви комбинации. Резултатът е огромен брой “страници”, които не носят трафик, но изяждат crawl budget.
Това означава, че Google е обходил страницата, видял е съдържанието и е решил да не я индексира. Само по себе си това не е проблем. Проблем е, когато броят им стане огромен, защото тогава Google харчи време за “страници”, които никога няма да ви донесат трафик.
Реално Google казва: “Виждам го, но не ми трябва”. Ние трябва да го накараме да спре да го обхожда, или да получава ясен сигнал, че това не е страница за търсене. Това е типична задача при технически SEO одит.
Най-честите източници на шум са:
index.php?route=product/search&tag=... или &keyword=...?sort=, &order=, &limit=&color=, &price= и др.Целта не е да “скрием” сайта от Google. Целта е Google да вижда само стойностните страници: категории, продукти, статични страници, блог, landing-и. Всичко, което е вътрешен инструмент (search, филтри, сортиране), трябва да се контролира. При OpenCart това често върви заедно с OpenCart разработка и персонализация.
Правим го на няколко нива. Едното само няма да реши всичко, комбинацията е важна.
robots.txt не “махa” вече индексирани URL-и, но спира бъдещо обхождане и намалява шума. Пример за OpenCart, който е достатъчен в 90% от случаите:
User-agent: *
Disallow: /admin/
Disallow: /system/
Disallow: /storage/
Disallow: /vendor/
# OpenCart internal routes
Disallow: /*?route=account/
Disallow: /*?route=checkout/
Disallow: /*?route=affiliate/
Disallow: /*?route=product/search
# Common parameter noise (if your theme generates these)
Disallow: /*?sort=
Disallow: /*&sort=
Disallow: /*?order=
Disallow: /*&order=
Disallow: /*?limit=
Disallow: /*&limit=
Allow: /
Sitemap: https://YOUR-DOMAIN.bg/sitemap.xml
&color= или &price=,
добавяме и тях. Не копираме безкрайни списъци. Правим го само за параметрите, които реално се виждат в индекса.
Ако не искаме да режем функционалността на страницата, но не искаме индексация, най-чистото решение е: noindex, follow на search страниците и “резултатни” страници. Това става с малка корекция в controller-а или чрез OpenCart модули и OCMOD доработка.
При категории с sort, order, limit и подобни, canonical трябва да сочи към чистия URL
(без параметрите). Така Google спира да ги приема като отделни страници. При по-тежки магазини това често върви с
Journal3 оптимизация и доработка.
Ако имате URL-и с utm, gclid, fbclid и други, препоръчително е да се чистят с 301 към чистия URL. Това е лесна победа, защото намалява дублирането.
Sitemap трябва да съдържа категории и продукти, не search, не филтри, не параметри. Ако sitemap е чист, Google започва да се ориентира по него много по-добре. При нужда това се комбинира и с структурирани данни и техническа SEO настройка.
410 Gone е полезно, когато имате URL-и, които не искате да съществуват изобщо и вече са влезли в индекса, например search URL-и с тагове, които Google е индексирал масово.
След настройките гледаме 3 неща:
Пишете на office@ntg.bg или заявете SEO консултация. За по-широка работа по магазина вижте и OpenCart поддръжка.
Практическият стандарт е прост: Google трябва да вижда стойностните страници, а шумът да бъде ограничен. Така индексирането става по-стабилно и по-предсказуемо, без случайни “изненади” от параметри и search комбинации.