Googleドキュメントに多数のリンクを含むテキストの本文があります。テキストとすべてのリンクをクライアントのCMSに取り込む必要があります。

残念ながら、GoogleドキュメントではユーザーがHTMLをエクスポートできなくなったようです。「名前を付けてダウンロード」を試しました。 Webページ(.html、zip形式)」とそのファイルをText Wranglerにアップロードしてクリーンアップしますが、リンクはすべてスクランブルされています。たとえば、twitter.com / sreeは次のようになります。

<a href="https://www.google.com/url?q=https://twitter.com/sree&amp;sa=D&amp;ust=1465095908840000&amp;usg=AFQjCNHpFpNdY6Hsr5xrZZlF5vCGTGIt6w">Sree Sreenivasan</a> 

すべてのリンクを手動でやり直すのではなく、必要なHTMLコードをGoogleドキュメントから取得する方法はありますか?

回答

Text Wranglerで次のような正規表現を使用できます:

<a href="https://www.google.com/url\?q=(.*)\&amp;sa(.*)">(.*)</a> 

次のように置き換えます:

<a href="$1">$3</a> 

回答

GoogleドキュメントのリンクをHTMLに変換する場合は、 gd2md-htmlアドオンを試してみてください(完全な開示:私はこれを開発しました): https://github.com/evbacher/gd2md-html/wiki

リンクを含むGoogleドキュメントからテキストのセクションを選択できます。それをHTMLに変換します。たとえば、Googleドキュメントの次のセクション:

ここに画像の説明を入力

この比較的クリーンなHTMLに変換します:

<h2>Markdown syntax, standards information</h2> <ul> <li>Basic Markdown syntax from John Gruber, the inventor of Markdown: <a href="https://daringfireball.net/projects/markdown/syntax">https://daringfireball.net/projects/markdown/syntax</a> <li>CommonMark standard: <a href="http://commonmark.org/">http://commonmark.org/</a> 

コメント

  • プロジェクトと提携している場合は、回答でそれを開示してください。また、このソフトウェアが質問に対する回答である方法の簡単な説明は、これを非常に価値のある回答にします。
  • ありがとうございます'絶対に正しいです。リンクを使用して部分的な選択を変換する例を明確にし、追加しようとしました。
  • ありがとうございます!これは、反対票に対抗するために今すぐ投票を獲得するはずです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です