Как настроить URL и hreflang для Hindi и English, организовать перевод и обновления так, чтобы многоязычный интернет-магазин Индии не терял позиции.

Многоязычный интернет-магазин в Индии часто начинает с простого шага: берут существующие страницы и переводят их на второй язык. Проблема в том, что для поисковика это нередко выглядит как две почти одинаковые версии одного и того же, а не как полезные страницы для разных аудиторий.
Дубли появляются, когда отличия сводятся к замене текста в заголовке и паре блоков, а остальное остается одинаковым: шаблон, мета-теги, описания, фильтры, URL-параметры. В итоге релевантность размывается. Поисковик не понимает, какую страницу показывать, и может ранжировать обе хуже, чем одну сильную.
Каннибализация запросов - это когда две страницы на сайте конкурируют за один и тот же запрос. Например, у вас есть категория на English и такая же на Hindi, но обе оптимизированы под один и тот же смысл и схожие ключи. В выдаче то появляется одна, то другая, позиции прыгают, а трафик не растет.
Быстрее всего дубли рождаются в типовых местах: в категориях и карточках товаров, в фильтрах и сортировках (из-за десятков комбинаций), а также на служебных страницах вроде доставки, возвратов и FAQ, где перевод сделан формально и слишком коротко.
Простой пример: вы продаете одну и ту же модель наушников и делаете перевод карточки на Hindi, но оставляете одинаковые заголовки характеристик и одинаковые мета-описания. С точки зрения поиска это два почти одинаковых документа, и система начинает выбирать случайно.
Симптомы обычно заметны даже без глубокой диагностики:
Цель одна: чтобы Hindi и English не выглядели для поисковика как случайные копии. Для многоязычного интернет-магазина в Индии лучше заранее выбрать одну схему адресов и держаться ее годами. Смена структуры почти всегда приводит к просадке трафика и путанице в индексации.
Чаще всего выбирают подпапки: /hi/ и /en/. Это удобно, если вы ведете один сайт, один бренд и одну техническую базу. Сила домена копится вместе, проще поддерживать единые правила для каталога, метаданных и внутренних ссылок. И самое важное: язык сразу виден в URL.
Поддомены (например, hi.shop.tld) тоже работают, но ощущаются как два сайта рядом. Настроек и контроля обычно больше, а риск, что один язык начнет развиваться быстрее другого и перетягивать запросы на себя, выше.
Параметры вроде ?lang=hi чаще создают проблемы. Такие URL легко плодятся из фильтров, сортировок и рекламных меток. В результате вы быстро получаете десятки вариантов одной страницы. Это усложняет контроль дублей и настройку hreflang и canonical.
Отдельные домены оправданы, когда у языковых версий разные бренды, логистика или требования по юрлицу. Но это почти всегда дороже: два набора SEO-работ, две стратегии ссылок, больше рисков разъехаться по контенту.
При выборе схемы стоит опираться не на привычку, а на ресурсы и реальную потребность:
Правило простое: один язык - один уникальный URL. Не смешивайте Hindi и English на одной и той же странице с одним адресом. В противном случае поисковики видят конкурирующие версии и путаются, какая из них главная.
Для многоязычного интернет-магазина в Индии самый понятный вариант - подпапки по языкам. Их легко читать людям, их хорошо поддерживают аналитика и большинство CMS.
Задайте фиксированные префиксы (например, /hi/ и /en/) и используйте их везде, где есть контент: категории, товары, блог, доставка, возвраты, поддержка.
Главная страница тоже должна иметь логику. Обычно делают одну дефолтную версию (часто /en/ как более нейтральную) и отдельную для Hindi (/hi/). А корень сайта (/) лучше использовать как аккуратный вход: либо ведет на выбранный язык, либо показывает выбор языка. Важно не создавать индексируемые дубли.
URL на деванагари могут выглядеть красиво, но на практике часто дают проблемы: кодировка, копирование в мессенджеры, разные варианты написания. Для стабильности чаще выбирают латиницу в слагах (транслит или английские слова), а сам язык страницы задают контентом и разметкой. Если все же используете деванагари, зафиксируйте единые правила и не допускайте автоматических вариаций.
Отдельно заранее решите, какие параметры допустимы, а какие должны считаться техническими и не создавать отдельные страницы. Обычно к рисковым относятся: сортировка (?sort=), хвосты пагинации (?page= с копиями первой страницы), фильтры (?color=) и рекламные метки.
Canonical помогает поисковику выбрать главную версию из очень похожих страниц. Он полезен при технических дублях: один и тот же товар доступен по разным URL из-за параметров, сортировки, лишних слэшей, UTM и похожих мелочей. Но canonical не склеивает страницы мгновенно и не гарантирует, что другая версия не попадет в индекс. Это подсказка, а не приказ.
В многоязычном проекте canonical часто ломают одной ошибкой: ставят его на страницу другого языка. В итоге Hindi-страница говорит «главная - English», а English говорит то же самое. Поисковик может оставить в индексе только один язык. Простое правило: если это полноценные страницы на своих языках, canonical у каждой версии должен указывать на саму себя.
Редиректы при переключении языка уместны только когда пользователь явно выбрал язык и вы хотите запомнить выбор (например, через куки). Автоматический редирект по IP или языку браузера опасен: бот может не увидеть вторую версию, а пользователи будут прыгать между языками. Лучше, чтобы обе версии отдавали 200 и были доступны по прямым URL.
Коды статуса держите в порядке: 200 для существующих страниц, 301 для постоянного переезда, 404 если страницы нет, 410 если она удалена окончательно.
Если вы меняете структуру URL (например, переносите язык из параметра в подпапку), действуйте последовательно: подготовьте новые страницы, включите 301 «один к одному» со старых на новые, обновите карту сайта и внутренние ссылки, и только затем убирайте старые маршруты. Массовый редирект на главную почти всегда убивает видимость и создает новые дубли.
Hreflang - подсказка для поисковиков, какую версию страницы показывать пользователю по языку (и иногда по региону). Для многоязычного интернет-магазина в Индии это способ не смешивать Hindi и English в выдаче и не заставлять Google выбирать наугад между похожими страницами.
Главное правило: страницы должны быть связаны парами и без дыр. Если у категории есть версия на English и на Hindi, обе страницы должны указать друг на друга в hreflang. Если одна сторона забыта, сигнал ломается, и вы снова получаете путаницу.
Полезная практика - завести простую карту соответствий URL: какая страница на en соответствует какой на hi. Это помогает и редакторам, и разработчикам, особенно при массовых обновлениях каталога.
x-default нужен, когда у вас есть нейтральная страница выбора языка или международная версия, которая не привязана к конкретному языку. Если выбора языка нет и вы сразу ведете на конкретную версию, x-default не обязателен.
Подключайте hreflang минимум на страницах, где есть трафик и риск конкуренции: главная, доставка/оплата/возвраты, категории, карточки товаров, статьи и гайды, если они участвуют в поиске.
Проверка без сложных инструментов: выберите 10-20 URL разных типов и убедитесь, что язык в тексте реальный, все URL в hreflang существуют и отдают 200, а связка en <-> hi замкнута.
Тонкие страницы чаще появляются не из-за самого факта перевода, а из-за пустого или одинакового смысла на разных URL. В многоязычном интернет-магазине в Индии это быстро приводит к конкуренции двух языков за одни и те же запросы, а часть страниц вообще не получает трафик.
Перевод обязателен там, где пользователь принимает решение и где есть ожидания по правилам и условиям: карточки товара, доставка, возвраты, способы оплаты, тексты в корзине и на чекауте.
Второстепенные блоки можно писать короче, но даже короткий текст должен добавлять смысл, а не быть копией с перестановкой слов.
Для Индии локализация часто важнее буквального перевода. Показывайте корректную валюту, привычные размеры и единицы, популярные способы оплаты, реальные сроки и географию доставки. Если условия отличаются по регионам, лучше честный текст с конкретикой, чем общий шаблон.
Мета-теги тоже должны быть уникальными для каждого языка. Не копируйте структуру «Купить X | Бренд» без адаптации. В Hindi и English разные длины слов и разные привычные формулировки. Достаточно, чтобы Title и Description отражали: что это, для кого и чем отличается именно на этом языке.
Если товара нет на складе, не превращайте страницу в заглушку из одной фразы. Сохраните URL и основной контент, покажите статус, срок ожидания или альтернативы и дайте понятную навигацию. Так страница остается полезной и не становится тонкой.
Чтобы Hindi и English не начали конкурировать друг с другом, важна дисциплина в переводах. Хороший процесс снижает риск тонких страниц и помогает держать каталог в порядке.
Начните с инвентаризации: какие страницы реально приносят деньги и трафик. Обычно первыми идут основные категории, подкатегории и карточки хитов. Служебные страницы тоже важны, но они редко вытягивают продажи, если каталог не готов.
Дальше нужен глоссарий: короткий документ с терминами, которые нельзя переводить как попало (бренды, модели, размеры, материалы). Он же фиксирует правила: что транслитерировать, что оставлять на английском, как писать валюту и сокращения.
Удобно идти небольшими партиями и проверять, что вы публикуете полноценные страницы.
До публикации проверьте вещи, которые видит покупатель: цена, наличие, доставка, корректные размеры (например, cm vs inches), отсутствие смешения языков в одном блоке. После выкладки смотрите, не выросло ли число страниц с высоким отказом и не появилась ли конкуренция двух языковых URL по одному запросу.
В каталоге и фильтрах дубли появляются быстрее всего: один и тот же набор товаров начинает открываться по десяткам похожих URL. Для многоязычного интернет-магазина в Индии это особенно заметно, если Hindi и English смешиваются в фильтрах, хлебных крошках и названиях атрибутов.
Индексируйте только те страницы фильтров, которые отвечают на частый запрос и дают стабильный ассортимент. Всё остальное оставляйте для удобства пользователя, но не для поисковой выдачи.
Чаще всего закрывают от индексации сортировку, хвосты пагинации, временные фильтры (скидки, новинки, «есть в наличии в одном городе»), комбинации с почти пустым списком и дублирующие параметры.
Если вы все же делаете посадочные под фильтры, задайте им понятные заголовки и текст, а не просто «Категория + выбранные галочки». И главное: у Hindi и English должны быть свои версии таких посадочных, без автосмешивания текста и URL.
Цвета, размеры и материалы лучше переводить как отдельные словари, а не руками в карточках. Тогда «Blue» не превратится в три разных варианта, а «L» не станет «Большой» и не сломает фильтры. Практичный подход: хранить значения атрибутов как коды (blue, cotton, size_l), а показывать подписи на нужном языке.
Отдельный URL для вариации нужен только если вариация реально отличается по смыслу и спросу (например, разные объемы памяти у смартфона). Если различие мелкое (цвет носков), чаще достаточно одного товара и выбора внутри страницы, иначе появятся дубли карточек.
Отзывы и вопросы лучше хранить единым блоком данных, но показывать аккуратно: либо переводить выбранные отзывы, либо фильтровать по языку. Плохо, когда на Hindi-странице половина отзывов на English и наоборот.
Проверьте внутренние ссылки: меню, блоки «похожие товары», хлебные крошки должны вести на тот же язык. Если на English-странице в крошках внезапно появляется Hindi-категория, поисковик начинает путать версии и усиливает каннибализацию.
Каннибализация почти всегда начинается не из-за двух языков как таковых, а из-за мелких настроек, которые делают страницы слишком похожими или путают поисковик.
Самая частая проблема - смешивание языков на одной странице. Например, карточка товара на English, но отзывы, характеристики и доставка частично на Hindi из-за автоперевода без редактуры. Страница выглядит «ломаной» и начинает конкурировать сама с собой.
Еще один тихий источник дублей - одинаковые Title/Description и H1 на двух языках. Если в Hindi-версии вы оставили английский шаблон, поисковик видит две страницы про одно и то же без ясного различия.
Проверьте эти ошибки в первую очередь:
С hreflang особенно важно, чтобы URL был финальным, без цепочек. Если вы отправляете Google на /hi/страница, а он попадает на /en/страница через редирект, сигналы языка ломаются.
Заранее решите: у каждой страницы должна быть пара на другом языке или часть контента остается только на Hindi или только на English. Для многоязычного интернет-магазина в Индии это нормально, если логика зафиксирована (например, доставка и возвраты на двух языках, а блог пока на одном).
База, которая чаще всего предотвращает дубли:
После релиза основная цель - поймать каннибализацию рано, пока позиции только начали метаться между /hi/ и /en/.
Проверяйте по фактам:
Представьте магазин одежды в Индии: English нужен для крупных городов (Мумбаи, Бангалор, Дели), а Hindi - для регионов, где покупателю проще читать и оформлять заказ на родном языке. Ошибка, которая быстро ломает SEO, - залить машинные переводы на все страницы и получить сотни слабых дублей.
Базовая схема понятная: категории и карточки живут в подпапках /en/ и /hi/. У каждой страницы есть родная версия и полноценный перевод там, где он реально нужен. Если для Hindi вы пока не готовы перевести редкие бренды или узкие подкатегории, лучше временно не создавать отдельную /hi/ страницу, чем выпускать пустую и одинаковую.
Чтобы тексты про доставку и оплату работали на обоих языках, не ограничивайтесь буквальным переводом. В English версии полезно подчеркнуть скорость, трекинг и варианты экспресс-доставки по мегаполисам. В Hindi версии - простыми словами объяснить процесс, сроки по штатам, что делать при возврате и какие способы оплаты привычнее в регионах.
Смотрите на результат не только по общему трафику, а по языкам и по деньгам: конверсия отдельно для /en/ и /hi/, доля добавлений в корзину, выручка и средний чек, а также запросы, по которым ранжируется каждая версия.
Если вы собираете и поддерживаете витрину на TakProsto (takprosto.ai), удобно заранее зафиксировать структуру /en/ и /hi/ и правила для canonical, hreflang и фильтров в planning mode. А дальше выпускать изменения пакетами, сохраняя снимки и быстро откатывая неудачные релизы.
Начните со структуры URL и правил индексации, а не с массового перевода.
/en/ и /hi/) и держитесь ееhreflang для пар страницПотому что для поисковика это часто две почти одинаковые страницы, которые конкурируют друг с другом.
Если отличаются только пару абзацев, а мета-теги, шаблонные блоки, фильтры и параметры одинаковые, релевантность размывается: вместо одной сильной страницы вы получаете две слабые.
Самый практичный вариант для одного бренда и одной платформы — подпапки: /en/ и /hi/.
Плюсы:
Поддомены чаще требуют больше контроля, а параметры ?lang=hi обычно быстрее создают дубли.
Делайте canonical сам на себя для каждой языковой версии.
То есть:
Не ставьте canonical с Hindi на English (и наоборот), иначе поисковик может оставить в индексе только один язык.
Минимум — связать пары страниц на двух языках: en ↔ hi.
Правила:
hreflang отдают 200 и не редиректятx-defaultЭто снижает шанс, что в выдаче покажется «не тот» язык.
Каннибализация — когда две страницы (например, /en/category и /hi/category) пытаются ранжироваться по одному и тому же смыслу, и поиск начинает «качать» их туда-сюда.
Типичные признаки:
Чаще всего — в категориях, карточках товаров и особенно в фильтрах/сортировках.
Ускорители дублей:
Если у страницы нет готового качественного Hindi-контента, лучше временно не создавать отдельный Hindi URL, чем публиковать пустую копию.
Переводите в первую очередь то, что влияет на решение:
Так вы снижаете риск «тонких» страниц и конкуренции языков.
Избегайте автоматических редиректов по IP/языку браузера.
Лучший вариант:
Сделайте короткий, повторяемый процесс.
hreflang симметричен, canonical корректен, нет новых индексируемых параметровЭто помогает держать качество и не плодить слабые страницы.