Jai un plan du site (qui est soumis à Google pour indexation ) dans laquelle jajoute des URL contenant une esperluette (&). Étant donné que dans le plan du site, & doit être échappé, jai remplacé & par & dans les URL de le plan du site. Les URL de mes pages réelles ne contiennent que &.

Étant donné que je ne connais pas les webmasters et le référencement Google, je souhaite comprendre si cette différence desperluette dans lURL et le plan du site causer nimporte quel problème. Mes pages seront-elles indexées? Cela peut sembler être une question de niveau noob car je peux accéder au site après avoir remplacé & par & dans lURL. Mais toute aide sur ce front sera très appréciée.

Commentaires

  • Dans quelle partie de lURL utilisez-vous une esperluette?
  • @ MrWhite Je passe quelques paramètres dans lURL et je sépare ces paramètres en utilisant une esperluette pour séparer les paramètres

Answer

si cette différence desperluette dans lURL et le plan du site causera un problème.

tl; dr Aucun problème, car les URL sont les mêmes.

Comme dans le plan du site, & doit être échappé, jai remplacé & par &

Votre sitemap est un document XML. Comme pour tout document XML, les valeurs de données doivent être stockées avec une entité XML encodée. Le caractère & est un caractère spécial (il indique lui-même le début dune entité XML) et doit donc être codé pour annuler sa signification particulière. Cest juste la façon dont les données sont stockées dans un document XML .

Lorsque le document XML est lu par un analyseur XML, les valeurs des données sont décodées , revient à la valeur réelle. Ainsi, & devient & lorsque le document XML est lu.

Donc, une URL de la forme /page?foo=1&bar=2 stocké dans un document XML est identique à lURL /page?foo=1&bar=2 de votre document HTML5 .

Les URL de mes pages actuelles ne contiennent que &

En HTML5 cest parfaitement OK, à condition quil ny ait pas dambiguïté. Cependant, en HTML4.1 (et versions antérieures), vous auriez dû encoder correctement lentité HTML & comme & dans votre source HTML code pour HTML valide. Cependant, les navigateurs sont très tolérants et votre document HTML aurait probablement encore « fonctionné ».

En HTML5, vous navez strictement besoin que de coder lentité HTML & sil y a une ambiguïté. Prenons lexemple artificiel suivant. Nous voulons transmettre la chaîne littérale « & dollar; » dans le paramètre URL foo.

<!-- In an HTML document (WRONG) --> <a href="/page?foo=&dollar;">link</a> 

LURL souhaitée est http://example.com/page?foo=&dollar;, cependant, lancre HTML ci-dessus entraîne lenvoi de lutilisateur à http://example.com/page?foo=$ – ce qui nest pas lintention. Pour créer le résultat souhaité, le & doit être une entité HTML encodée pour annuler sa signification particulière, ce qui donne le HTML (correct) suivant:

<!-- In an HTML document (CORRECT) --> <a href="/page?foo=&amp;dollar;">link</a> 

Il est toujours plus sûr dencoder de manière cohérente lentité HTML & dans votre HTML- document. Si vous générez votre contenu via un CMS, cela devrait être automatique.

Je peux accéder au site après avoir remplacé & avec &amp; dans lURL.

Vous voulez probablement dire » dans lURL, dans votre HTML « ? Parce que si vous deviez encoder lentité HTML & avec &amp; dans la barre dadresse du navigateur (par exemple), ie. en dehors dun contexte HTML, vous nobtiendrez pas les résultats attendus. Par exemple, si vous saisissez ce qui suit directement dans la barre dadresse du navigateur:

/page?foo=1&amp;bar=2 

Vous obtiendrez alors les deux paramètres dURL [foo] => 1 et [amp;bar] => 2, ce qui nest clairement pas lintention.

Commentaires

  • TL; DR: lURL contient une esperluette simple (&) mais si vous utilisez sitemap.xml vous devez encoder une esperluette simple comme &amp;. La signification de lesperluette encodée est toujours une esperluette claire. Si vous voulez ignorer la plupart de lencodage, utilisez .

Réponse

Les URL que vous incluez dans le plan du site doivent suivre le norme RFC-3986 . Comme vous pouvez le lire dans le Guide officiel de Google , & doit être échappé par &amp; donc vous êtes prêt à partir.

Néanmoins, une fois que vous aurez soumis votre plan de site via Google Searh Console, vous serez en mesure de savoir sil y a un problème avec les URL soumises.

Juste au cas où, vous ne devriez inclure que les URL finales, cela signifie quil y a peut-être certains paramètres que vous pourriez éviter. Par exemple:

 - https://example.com/shoes (good one) - https://example.com/shoes?order=1&amp;color=blue (remove this one) 

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *