非構造化データとは

データには「構造化データ」(データベースのテーブル形式で整理された数値・テキスト)と「非構造化データ」(自由記述のテキスト・画像・音声・動画)の2種類があります。ビジネスで扱うデータの約80%が非構造化データと言われています。

ビジネスでの非構造化データ活用例

テキストデータ:顧客の問い合わせ内容・レビュー・アンケートの自由記述などをテキスト分析し、顧客の声を定量的に把握できます。感情分析・キーワード抽出・カテゴリ分類などが代表的な活用です。

画像データ:製品の外観検査・書類のOCR処理・店舗内の行動分析などに活用されます。近年は生成AIとの組み合わせで活用範囲が大きく広がっています。

非構造化データを扱うための準備

非構造化データは、構造化データよりも前処理に手間がかかります。テキストデータは前処理(不要な記号の除去・形態素解析など)が必要で、画像データはラベリング(学習用の正解データ作成)に多くの工数が発生します。

最初から自社で全工程を内製化しようとせず、既存のAIサービス(Google Natural Language API・Amazon Rekognitionなど)を活用することで、開発コストを抑えながら非構造化データの活用を始められます。