XMLからCSVコンバータ
ガイド
XMLからCSVコンバータ
任意のXMLドキュメントを貼り付け、その繰り返し記録を平坦なCSVファイルに変換します。このツールは行要素と列を自動検出し、最初の10行をプレビューし、完全なCSVをダウンロードできます。これは、古くからのシステムからデータを移行する、エクスポート、またはXMLフィードをスプレッドシートやETLパイプラインに変換する際に便利です。
使用方法
- XMLを入力エリアに貼り付け、または.xmlファイルをアップローダーにドラッグ&ドロップしてください。
- 行要素を空白に残して、ツールがルートの最も一般的な子要素を自動検出するようにし、またはタグ名(例:
order,record,item)を入力して特定の繰り返し要素をターゲットにします。 - 区切り文字(カンマ、セミコロン、タブ、パイプ)および改行終端(LFまたはCRLF)を、導出先のシステムに合わせて選択します。
- ヘッダー行を含めるかどうか、XML属性を追加列としてキャプチャするかどうか、値の空白を削除するかどうかを切り替えます。
- プレビュー(最初の10行)および行/列の要約を確認し、ダウンロードアイコンをクリックして完全なCSVを保存します。
機能
- 行要素を自動検出 – ルートの最も一般的な直接子要素を選択し、ほとんどのXMLドキュメントが設定なしで動作します。
- 属性キャプチャ – XML属性は、設定可能なプレフィックス(デフォルト
@)で独自の列に変換され、要素列と区別しやすくなります。 - キーの合併列 – ヘッダーはすべての行から推論され、オプションまたは稀に出現するフィールドも出力に表示されます。
- RFC 4180のエスケープ – デリミターや引用符、改行が含まれる値は自動的に引用符で囲まれ、内部の引用符は2回繰り返し("\")でエスケープされます。
- 設定可能なデリミターや改行終端 – カンマ、セミコロン、タブ、またはパイプ;LFまたはCRLF — 下流のツールが期待するものと正確に一致します。
- プレビュー+完全ダウンロード – オンスクリーンプレビューは最初の10行までに制限され、ページが反応性を保ちます。コピーおよびダウンロードは常に完全な出力に対して動作します。
- ブラウザ内で完全に動作 – あなたのXMLはあなたのマシンに留まり、データに顧客またはビジネス記録がある場合に特に重要です。
ベース64画像文字列に遭遇し、それが実際に何であるかを確認する必要があるとき、このツールを使います。APIレスポンスに埋め込まれたサムネイルをデバッグする、CSSやHTMLメールに埋め込まれた画像を確認する、トラッキングピクセルを逆エンジニアリングする、画像生成APIからの出力の確認を行う、またはデータベースエクスポートから資産を回復するなどです。レンダリングがブラウザ内で行われるため、プロダクションに送信する前にベース64パラメータが正しく構成されているかを迅速に確認する手段としても使えます。
- 古くからのデータ移行 – 過去のシステムからXMLをエクスポートし、スプレッドシート、BIツール、または現代のデータベースにロードするための記録を抽出します。
- オープンデータフィード – 多くの政府や研究データセットはまだXMLで配布されています;CSVは分析に非常に友好的です。
- API応答 – XML API応答をテーブル形式に平坦化し、一時的なチェックや非技術的なステークホルダーに共有するための手段を提供します。
- SaaSエクスポート – いくつかのエンタープライズSaaS製品はエクスポート時にのみXMLを出力します;CSVはスプレッドシート、ダッシュボード、ETLツールがインポート時に期待するものです。
よくある質問
-
XMLをCSVに平坦化するとは何を意味しますか?
XMLは階層的構造を持ちます — 要素は他の要素にネストされ、任意の深さまで可能です。CSVは平坦で、すべての行が同じ列セットを持ちます。平坦化とは、繰り返しXML要素を1つ選択し、その子フィールドと属性を列に変換することです。深くネストされたブランチは通常、テキストコンテンツに変換されたり、セパレータで結合されたりします。そのため、CSVはテーブルデータに非常に適していますが、真のツリー構造には損失をもたらします。
-
CSVはなぜ、カンマ、引用符、改行に対して特別なエスケープルールが必要ですか?
CSVはデリミターフォーマットであり、値内に文字列デリミタ、引用符、または改行が含まれると、列または行の境界として誤解されます。RFC 4180は、このような値をダブルクォートで囲み、内部のダブルクォートを2回繰り返し("\")でエスケープすることで、小さな状態マシンで解析可能なシンプルなフォーマットを実現し、任意のテキストをフィールドに許容します。
-
XML属性はなぜ子要素と異なる扱いされますか?
XMLでは、属性は開始タグに存在し、子要素はタグ内に存在しますが、CSVでは両方とも列として終了します。ツールは通常、属性列をプレフィックス(よく@)で前付けることで、属性@idが行のメタデータであることを識別し、要素列と区別します。この慣習により、要素名と属性名が同じ場合の名前衝突を回避できます。
-
LFとCRLFの改行終端の違いは何か?
LF(\n)はUnixおよびmacOSの改行終端です。CRLF(\r\n)はWindowsの慣例であり、RFC 4180が実際に指定した改行終端です。現代のパーサーは両方をサポートしていますが、いくつかの古いWindowsツール、およびWindows上でファイルに混合終端があるExcelは、CRLFを使用すると最も適切に動作します。適切な改行終端を選択することで、下流でのインポートエラーを回避できます。
-
列の自動検出はなぜ行間のキーの合併に基づいていますか?
現実のXMLでは、オプション要素が存在します — 一部の記録には属性またはサブ要素があり、他の記録にはありません。もし列リストを最初の記録のフィールドに限定すると、その後のオプションフィールドが無視されてしまいます。すべての行で見られるキーの合併を取ることで、すべての異なるフィールドが独自の列に確保され、記録に含まれていない場合は空セルが表示されます。
恵 スコアボードが到着しました!
スコアボード ゲームを追跡する楽しい方法です。すべてのデータはブラウザに保存されます。さらに多くの機能がまもなく登場します!
