Tenho um mapa do site (que foi enviado ao Google para indexação ) em que estou adicionando URLs que contêm um “e” comercial (&). Como no mapa do site & deve ser escapado, substituí & por & nos URLs em o mapa do site. Meus URLs de página reais contêm apenas &.

Como eu sou novo no Google webmasters e SEO, gostaria de entender se essa diferença de “e” comercial no URL e no mapa do site causar qualquer problema. Minhas páginas serão indexadas? Esta pode parecer uma questão de nível iniciante porque consigo acessar o site após substituir & por & no URL. Mas ainda assim qualquer ajuda nesta frente será muito apreciada.

Comentários

  • Em qual parte do URL você está usando um “e” comercial?
  • @ MrWhite Estou passando alguns parâmetros no URL e estou separando esses parâmetros usando “e” comercial para separar os parâmetros

Resposta

se essa diferença de “e” comercial no URL e no mapa do site causar algum problema.

tl; dr Sem problemas, porque os URLs são os mesmos.

Como no mapa do site & deve ser evitado, substituí & por &

Seu sitemap é um documento XML. Como acontece com qualquer documento XML, os valores dos dados devem ser armazenados codificados por entidade XML. O & caractere é um caractere especial (ele próprio denota o início de uma entidade XML) e, portanto, deve ser codificado para negar seu significado especial. É assim que os dados são armazenados dentro de um documento XML .

Quando o documento XML é lido por um analisador XML, os valores dos dados são entidades XML decodificadas , de volta ao valor real. Portanto, & torna-se & quando o documento XML é lido.

Portanto, um URL no formato /page?foo=1&bar=2 armazenado dentro de um documento XML é idêntico ao URL /page?foo=1&bar=2 em seu documento HTML5 .

Meus URLs de página reais contêm apenas &

Em HTML5 isso está perfeitamente OK, desde que não haja ambigüidade. No entanto, em HTML4.1 (e anteriores) você teria que codificar corretamente a entidade HTML & como & em seu código-fonte HTML código para HTML válido. No entanto, os navegadores são muito tolerantes e seu documento HTML provavelmente ainda teria “funcionado”.

No HTML5, você apenas precisa estritamente de codificar a entidade HTML & se houver uma ambigüidade. Veja o seguinte exemplo inventado . Queremos passar a string literal “& dólar;” no foo parâmetro de URL.

<!-- In an HTML document (WRONG) --> <a href="/page?foo=&dollar;">link</a> 

O URL desejado é http://example.com/page?foo=&dollar;, entretanto, a âncora HTML acima resulta no envio do usuário para http://example.com/page?foo=$ – o que não é a intenção. Para criar o resultado desejado, o & deve ser codificado por entidade HTML para negar seu significado especial, resultando no seguinte (correto) HTML:

<!-- In an HTML document (CORRECT) --> <a href="/page?foo=&amp;dollar;">link</a> 

É sempre mais seguro codificar consistentemente a entidade HTML & em seu HTML- documento. Se você estiver gerando seu conteúdo por meio de um CMS, isso deve ser automático.

Consigo acessar o site após substituir & com &amp; no URL.

Provavelmente, você quer dizer” no URL, em seu HTML “? Porque se você fosse codificar a entidade HTML & com &amp; na barra de endereço do navegador (por exemplo), ou seja, fora de um contexto HTML, você não obterá os resultados esperados. Por exemplo, se você digitou o seguinte diretamente na barra de endereço do navegador:

/page?foo=1&amp;bar=2 

Então você obteria os dois parâmetros de URL [foo] => 1 e [amp;bar] => 2, o que claramente não é a intenção.

Comentários

  • TL; DR: o URL contém um “e” comercial simples (&), mas se você usar sitemap.xml, será necessário codificar E comercial simples como &amp;. O significado do “e comercial” codificado ainda é “e comercial” simples. Se você quiser pular a maior parte da codificação, use .

Resposta

Os URLs que você incluir no mapa do site devem seguir a padrão RFC-3986 . Como você pode ler no guia oficial do Google , & deve ser escapado com &amp; então você está pronto para ir.

No entanto, depois de enviar seu sitemap por meio do Google Searh Console, você poderá saber se há algum problema com os URLs enviados.

Por precaução, você deve incluir apenas URLs finais, o que significa que talvez haja alguns parâmetros que você possa evitar. Por exemplo:

 - https://example.com/shoes (good one) - https://example.com/shoes?order=1&amp;color=blue (remove this one) 

Comentários

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *