Что нужно знать о локализации сайтов: нюансы

12.09.2017

Валерия Самсонова, маркетинг и PR в Logrus IT

В первой части мы обсудили, что такое локализация сайта, зачем она нужна и как это обычно происходит. На этот раз мы немного углубимся в детали: на какие языки стоит переводить, с какими форматами работать и что предусмотреть, чтобы потом не пришлось все переделывать.

 

Website localization Logrus IT

Языки

На первый взгляд, выбор языков для сайта — не та задача, над которой приходится долго раздумывать. В большинстве случаев этот выбор определяется теми странами, на рынках которых присутствует ваша компания или куда планирует расширяться.

Полезными в выборе языков могут оказаться системы веб-аналитики, которые позволяют отследить географию посетителей сайта. Также можно ориентироваться на рейтинг самых распространенных в интернете языков.

Но и здесь есть свои тонкости, которые могут повлиять на выбор языков для локализации. Рассмотрим несколько возможных ситуаций:

  • в стране несколько официальных языков

Примеры: Канада (английский и французский), Сингапур (малайский, английский, путунхуа и тамильский), Швейцария (немецкий, французский, итальянский, ретороманский).

Конечно, в первую очередь следует руководствоваться здравым смыслом: вряд ли кому-то придет в голову переводить сайт на все 22 официальных языка Индии. Однако не лишним будет изучить, какие языки наиболее востребованы на ваших рынках сбыта, а также ознакомиться с языковой политикой конкретной страны.

  • разные диалекты одного языка

Примеры: португальский (Бразилия, Португалия), китайский (кантонский, путунхуа, цзинь), английский (США, Великобритания, Австралия)

Диалекты в разных странах и регионах могут существенно отличаться, поэтому всегда полезно уточнять, на какой вариант языка необходимо выполнить перевод. Кстати, таким образом можно выявить недобросовестного локализатора: если он не задает уточняющих вопросов насчет диалектов, это должно насторожить.

  • в стране/регионе широко распространен негосударственный язык

Примеры: испанский в южных штатах США, русский в Латвии

Не обязательно останавливаться только на государственном языке страны. Чтобы максимально полно охватить регион, иногда имеет смысл также переводить на наиболее распространенные неофициальные языки. Это может стать хорошим конкурентным преимуществом в борьбе за аудиторию.

  •  языки стран СНГ

Примеры: азербайджанский, туркменский, таджикский, казахстанский

Казалось бы, в странах СНГ русский язык понимает большая часть населения и переводить сайт на государственные языки этих стран не обязательно. Но в последние годы наметилась тенденция к снижению роли русского языка, а в некоторых странах ведется целенаправленная политика поддержки национальных языков. Так что пренебрегать переводами на них не стоит.

Форматы файлов

Один из наиболее частых вопросов от заказчиков: в каком формате должны быть файлы для локализации?

  • Если сайт небольшой (например, лендинг или визитка) и если заказчик сам занимается размещением локализованной версии сайта, это могут быть просто тексты и строки интерфейса в форматах DOC(X) или XLS(X).
  • Однако в большинстве случаев от заказчика потребуются исходные файлы сайта в форматах HTML, PHP, XML, JS, YML, JSON и т. д., а также графические исходники (например, если на сайте есть картинки с надписями, которые нужно локализовать).

В нашей компании текстовый контент сайта извлекается из исходных файлов с помощью специальных программ, а затем переводится и редактируется с сохранением структуры. То есть заказчик получает локализованные файлы в том же формате, что и оригиналы. Перед отправкой все материалы обязательно проходят проверки, чтобы убедиться, что нигде не поврежден код или не осталось непереведенных строк.

  • Если сайт был изначально разработан с заделом на нескольких языковых версий (см. ниже про интернационализацию), в нем могут содержаться специальные файлы локализации в форматах PO или XLIFF.

О чем важно знать заранее

Локализация современных сайтов очень напоминает локализацию программного обеспечения, поэтому без программиста в большинстве случаев не обойтись.

О некоторых вещах, связанных с локализацией, полезно задумываться уже на этапе проектирования сайта (именно поэтому в техзадании хорошим тоном будет указать, планируются ли другие языковые версии).

Подготовку сайта к созданию дополнительных языковых версий называют интернационализацией.

CMS с поддержкой многоязычности

Большинство популярных CMS (систем управления контентом) в том или ином виде поддерживают создание дополнительных языковых версий сайта. Обычно для этого достаточно установить плагин (например, Polylang, WPML, qTranslate X для WordPress) и с его помощью добавить новую версию.

Если вы используете CMS собственной разработки, важно убедиться, что она поддерживает многоязычность. В частности, необходимо, чтобы типы данных, которые должны (или могут) быть локализованы, были соответствующим образом размечены. Для этих целей часто используют библиотеку gettext, которая изначально заточена под локализацию программного обеспечения.

Длина строк

Стоит учитывать, что в разных языках одна и та же фраза почти всегда будет иметь разную длину. И если для текста статьи это не слишком существенно, то в элементах интерфейса (кнопках, пунктах меню, формах) длина строки становится критичным фактором. Никто не обрадуется, если увидит такое:

В среднем, английское предложение на 20–30% короче, чем русское или немецкое. Китайский и корейский языки еще более лаконичные. Это следует учитывать при создании макета сайта: например, использовать относительные величины вместо абсолютных, оставлять «запас» по ширине в элементах интерфейса и в целом руководствоваться принципами адаптивного дизайна.

Кодировки и шрифты

Наверное, все когда-нибудь сталкивались с проблемой кодировки, когда вместо русского текста в документе фигурировали совершенно нечитаемые символы («кракозябры»). Этого легко можно избежать, если пользоваться универсальной международной кодировкой UTF-8, которая уже стала стандартом в веб-разработке.

Еще один важный момент — выбор шрифтов для многоязычного сайта. Не все шрифты по умолчанию поддерживают одновременно кириллицу и латиницу, не говоря уже об иероглифике. Особенно это касается дизайнерских шрифтов, разрабатываемых на заказ. Поэтому перед тем, как использовать шрифт на сайте, стоит убедиться, что он поддерживает стандарт Юникод.

Региональные форматы и единицы измерения

Локализация также должна включать в себя адаптацию к реалиям целевого рынка. Сюда можно отнести региональные форматы времени и даты, валюту, единицы измерения, а также направление языка и особенности пунктуации.

Чтобы облегчить задачу, можно уже на этапе разработки сайта использовать различные JavaScript-библиотеки (Date.js, Moment.js, Money.js и др.) для автоматической конвертации форматов и отображения единиц измерения в зависимости от локали.

Местное законодательство

О чем точно не стоит забывать при создании мультиязычного сайта, так это о соблюдении законодательных норм. Убедитесь, что информация на сайте и предлагаемые товары/услуги не противоречат местным законам, а юридически значимые документы (соглашение о конфиденциальности, условия использования сервиса и т. п.) переведены должным образом.

Также в некоторых случаях для нормальной работы сайта может понадобится местный хостинг и/или домен.

Поддержка многоязычного сайта

Современный сайт — это не что-то статичное и неизменное. Содержимое постоянно обновляется: появляются новые статьи, новости, акции, описания продуктов или услуг. Все это нужно оперативно переводить или создавать с нуля на нескольких языках.

Отдельная большая тема — поисковое продвижение разных языковых версий сайта, для которого также могут потребоваться услуги локализатора. А если у вас онлайн-магазин или другой интернет-сервис, то хорошим тоном будет организовать техподдержку клиентов на их родном языке.

Поэтому при планировании бюджета не стоит забывать, что поддержание многоязычного сайта также потребует определенных вложений и трудозатрат.