ETLとELT、順番が違うだけ?

複数の場所からデータを集めて分析に使う際、「抽出(Extract)」「変換(Transform)」「格納(Load)」という3つの工程を経ます。

従来主流だったETLは、変換してから格納します。近年広がるELTは、まず生のまま格納し、後から必要に応じて変換します。順番が違うだけに見えて、実務への影響は小さくありません。

なぜELTが広がったのか

背景には、データを格納する基盤(データウェアハウス)の性能が大きく向上し、大量のデータを格納してから変換しても十分速く処理できるようになったことがあります。

  • 生データを残せる 後から別の切り口で加工し直せる。
  • 変更に強い 分析要件が変わっても、格納済みのデータから作り直せる。
  • 立ち上げが速い まず溜めて、加工は段階的に進められる。

方式は目的から逆算する

ELTが万能というわけではありません。扱うデータ量が小さく要件が固まっている場合は、従来のETLの方がシンプルで管理しやすいこともあります。流行ではなく、自社のデータ量と要件の変わりやすさから方式を選ぶことが大切です。