On ne lance pas simplement des catalogues numériques en Chine

LinkedIn
Twitter

Catalogues numériques en Chine: Le 14 mars 2014, notre premier client en Chine a mis en ligne ses nouveaux catalogues numériques. Voir notre produit utilisé à l'autre bout du monde a été un moment de grande joie et de fierté pour nous, d'autant plus si l'on considère les obstacles techniques que nous avons dû surmonter pour y parvenir. Mais quels étaient ces problèmes et comment nos savants fous les ont-ils résolus ? Si vous êtes confronté à des traductions en chinois pour votre application ou si vous êtes simplement curieux de voir comment nous avons réalisé le projet... Publitas compatible avec l'usage chinois, vous devriez consulter ce post.

Avoir METRO Chine rejoindre les 17 autres pays dans lesquels METRO Cash & Carry utilise déjà notre logiciel a été une étape plutôt cool pour nous.

Mais y arriver n'a pas été aussi facile que vous le pensez.

Nous nous sommes heurtés à plusieurs défis en rendant Publitas compatible avec une utilisation en Chine, et trois d'entre eux nous ont particulièrement interpellés :

  1. Limaces
  2. Pluralisation
  3. Recherche

Nous allons examiner chacun de ces problèmes plus en détail ci-dessous et expliquer comment nous les avons résolus.

On ne peut pas se contenter d'un simple mème sur le lancement de catalogues numériques en Chine.

Vrai ou quoi ?

Problème #1 : les limaces

Pour citer le Glossaire Djangoune limace est :

"Une étiquette courte pour quelque chose, contenant uniquement des lettres, des chiffres, des traits de soulignement ou des traits d'union. Ils sont généralement utilisés dans les URL."

Par exemple, lorsque vous avez un groupe dans Publitas appelé "Makro UK" et une publication appelée "Semaine 12", celle-ci est convertie en un slug pour l'URL :
https://view.publitas.com/makro-uk/week-12

Le dernier élément de cette URL ("makro-uk/week-12") est le slug. Aussi, des choses comme "V&D" sont (par défaut) converties en : "v-d"

En bref, la création de slugs comme celui-ci est une façon humaine et conviviale pour les moteurs de recherche de construire des URL. Le processus est très simple. Publitas :

  1. Transforme une chaîne de caractères en minuscules.
  2. Supprime les caractères spéciaux (par exemple, les parenthèses, les virgules, les points d'exclamation, etc.) et remplace les espaces par -.
  3. La plupart du temps, & est remplacé par "-" et @ est remplacé par "at".

Donc "Maman et Papa étaient à la maison" devient : "maman-papa-étaient-à-la-maison".

Cela fonctionne très bien pour les langues utilisant l'alphabet latin :
irb(main):005:0> "Mom & Dad".parameterize => "mom-dad"

Mais quand il s'agit de chinois, ça ne marche pas :
irb(main):003:0> "中文測試".parameterize => ""

Solution : Translittération des caractères Unicode en ASCII

Heureusement, il existe déjà des bibliothèques qui traitent de ce problème. Celle que nous utilisons s'appelle Stringexet se compose de trois bibliothèques : ActsAsUrl, Unidecoder, et StringExtensions.

Donc maintenant, lorsque nous translittérons des caractères Unicode, voici ce qui se passe :
"你好".to_ascii #=> "Ni Hao"

Une fois cette information obtenue, vous pourrez construire un slug correct. En bref, vous ne pouvez pas utiliser directement des outils standard pour construire des slugs en chinois et vous devrez d'abord translittérer les caractères Unicode en ASCII.

Problème #2 : Pluralisation

L'autre problème est lié aux traductions. Supposons que vous vouliez traduire, de l'anglais au néerlandais : "1 thing, 2 things". Dans les deux langues, vous pouvez exprimer "thing" au singulier et au pluriel, ce qui rend la traduction en néerlandais très simple. En chinois, cependant, ce n'est pas le cas. Le mot "thing" (singulier) n'a tout simplement pas de traduction valable. Le seul mot que vous pouvez traduire est "choses (事)" (pluriel). Jetez un coup d'œil au code de nos visionneurs de catalogues ci-dessous :

Anglais (EN)

      téléspectateur :
        chargement : chargement...
        pages :
          zéro : "Aucune page"
          un : "{count} page"
          autre : "{count} pages"

Chinois (ZH)

      visionneuse :
        chargement : 正在载入...
        pages :
          zéro : 没有页面
          un : ""
          autre : 网页

Comme vous pouvez le voir ici, les chaînes "zero" et "other" sont traduites sans problème de l'anglais au chinois. Mais lorsqu'il s'agit de "one" (singulier), la traduction échoue car il n'existe pas en chinois.

Solution : Ne traduisez que les mots au pluriel

La façon d'aborder la pluralisation en chinois consiste à ne traduire que la forme plurielle. Voici comment nous appliquons cette méthode dans les traductions de nos catalogues :

Anglais (EN)

      téléspectateur :
        chargement : chargement...
        pages :
          zéro : "Aucune page"
          un : "{count} page"
          autre : "{count} pages"

Chinois (ZH)

      visionneuse :
        chargement : 正在载入...
        pages :
          zéro : 没有页面
          autre : 网页

Ainsi, au lieu d'avoir des traductions pour "un" et "autre", nous les fournissons simplement pour "autre" en chinois.

Problème #3 : Recherche

le pouvoir de la personnalisation du contenu infographie Publitas

Pour que la recherche fonctionne correctement, les mots sont soumis à un processus lorsqu'ils sont indexés. La méthode la plus couramment utilisée est appelée "stemming". En gros, cela signifie que les différentes formes d'un mot sont réduites à une forme commune. (Voici un article qui explique le stemming de manière plus détaillée). Par exemple, imaginez que vous indexez un PDF pour un magasin d'animaux domestiques contenant les mots suivants chats, félin et catty. Tous ces mots sont réduits à la racine "chat", de sorte que lorsque vous recherchez "chat", ils seront trouvés. Cette technique n'est toutefois pas applicable au chinois.

Solution : Recherchez à la fois le radical et le mot exact

Nous utilisons le service de recherche d'Amazon CloudSearchet heureusement, ils ont récemment ajouté le support chinois. Auparavant, notre moteur de recherche recherchait toujours les mots contenant le radical. Mais comme nous voulions prendre en charge le chinois (où la racine n'est pas applicable), nous avons dû mettre en place une solution de secours permettant de rechercher également les mots entiers. Ainsi, au lieu de dire "Amazon, donne-nous des mots qui contiennent le radical", nous avons commencé à dire "Amazon, donne-nous des mots qui contiennent le radical OU qui sont égaux au mot exact".

Catalogues numériques en Chine - Conclusion

Webinaire de Productsup et Publitas : Transformer les acheteurs en consommateurs avec du contenu à partager et à acheter. Nous espérons que cet article a permis de mieux comprendre les difficultés rencontrées pour rendre nos catalogues compatibles avec une utilisation en Chine et la manière dont vous pouvez résoudre des problèmes similaires. N'hésitez pas à partager cet article.