非構造化データとは、表やグラフのように整理されていないデータのことです。テキストや画像、音声、動画データなどが非構造化データの代表例にあげられます。

データクレンジング入門ガイド
〜顧客データを正し、活かすための基本・手法・ツール活用〜 データクレンジング入門ガイド
- データクレンジング概要
- データクレンジングの手法
- データクレンジング実行時のポイント
- HubSpotのAIアシスタント
今すぐダウンロードする
全てのフィールドが必須です。
現代の情報社会におけるデータの約80~90%は、非構造化データであるといわれています。AI(生成AI含む)により、この膨大な未活用データを「読み取り」「理解し」「活用する」ことが可能です。
本記事では、AIを用いた非構造化データの活用方法や具体例、非構造化データの活用を推進するポイントを解説します。
AIで非構造化データを活用する方法とは
テキストや画像、音声、動画データといった非構造化データは、企業にとって役立つ情報を多く含んでいます。しかし、整理されていない生の状態では扱いが難しく、多くの企業において非構造化データを十分に活用できていませんでした。
一方、従来のAIの機械学習では、人間によるルール設計が必要でした。近年では、AI技術の進歩により、AI自身がデータの特徴を認識して学習を進められるディープラーニング(深層学習)が登場しています。その結果、AIを用いて非構造化データから自動で法則性やルールを抽出することが可能になりました。
従来は活用されていなかった非構造化データの有効活用や、手作業で行っていた構造化作業の自動化によるコスト削減が期待できます。
AIを用いた非構造化データの活用例
ここからは、AIを用いた非構造化データの活用例として、次の6つのケースをご紹介します。
- 生成AIによる文書データの抽出
- SNSやアンケートなどの口コミ分析
- OCR機能によるデータ入力
- AIカメラによる来客分析
- コールセンターの音声感情分析
- 顧客情報の要約
生成AIによる文書データの抽出
生成 AI を活用すると、契約書や請求書などの複雑なレイアウトを持つ非構造化文書から、構造化データを迅速かつ高精度に抽出できます。事前に機械学習でトレーニングする必要がなく、文書をアップロードするだけでデータを構造化できる点が特徴です。
顧客確認や支払いフォームなど、大量のドキュメントからのデータ抽出、ドキュメント解析によるエラーや潜在的なリスクの除外などに活用可能です。
SNSやアンケートなどの口コミ分析
SNSの投稿やアンケート結果、メールの問い合わせなどのテキスト情報をAIが読み取り、ユーザーの感情や思考などを可視化できます。
投稿に登場する単語や文章から要素を抽出し、ポジティブ・ネガティブのようなラベリングやスコアリングを行うことも可能です。感情や感想だけでなく、使用シーンや属性なども分析でき、より詳細な口コミ分析に役立てられるでしょう。
OCR機能によるデータ入力
OCR(Optical Character Recognition:光学文字認識)とは、画像データに含まれるテキスト情報を、デジタルの文字データに変換する技術です。手入力による作業負担の削減、データの検索性の向上といったメリットがあります。
従来のOCRでは、手書きの文字を誤認識しやすい、複雑なレイアウトでは読み取り精度が劣る、などの欠点がありました。しかし、AIと組み合わせることで認識精度が向上します。また、読み取り位置や項目を自動で認識するため、詳細な設計も不要です。
AIカメラによる来客分析
店舗にAI搭載のカメラを設置し、来客数や来店客の属性、動線などを分析することも可能です。来客分析は、従業員やスタッフを適所に配置して人力で行うこともできますが、AIカメラを用いれば、より多角的で高度な分析が実現します。
分析した結果は、より効果的な広告施策や陳列方法の検討や属性ごとの行動パターンの把握にも役立てられます。また、顧客の行動分析だけでなく、商品の欠品も迅速に把握可能です。
コールセンターの音声感情分析
AIを利用すると、人間が話す際のスピードやトーン、抑揚などを検知し、話者の感情の分析も行えます。
このような音声分析は、特にコールセンターで利用されており、顧客満足度向上に役立てられています。会話分析により喜怒哀楽を明らかにすることで、改善すべき点や強化すべきポイントが明確になり、顧客対応の質を向上できるためです。
さらに、オペーレーターの心理状況を分析すれば、離職率の低下や適切な人材配置のための業務設計が実現します。
顧客情報の要約
AIを利用すると、CRMやSFAなどのシステム内に蓄積された顧客とのやり取りの情報をまとめることも可能です。
顧客とのメール、オンライン商談、チャットなどのコミュニケーションは、CRMやSFAなどのツールに記録されていても情報が分散しやすく、全体像をつかむのが難しくなりがちです。こうした非構造化データをAIが自動で要約・整理することで、顧客の状況やニーズを短時間で把握でき、営業活動やカスタマーサポートのスピードと精度を大きく向上させることができます。
なお、HubSpotでも、AI機能「Breeze」によって、下図のように顧客とのやり取りを要約できます。分散されたデータから顧客の情報を逐一集める必要がないため、作業の効率化や時間削減につながります。
AIで非構造化データを活用する際のポイント
AIを使って非構造化データを活用する際のポイントをご紹介します。
- 目的に合ったAIツールを選定する
- データクレンジングを行う
- 必要に応じて人間も作業する
目的に合ったAIツールを選定する
AIツールにはさまざまな種類があり、扱えるデータの形式(テキスト・画像・動画・音声)が異なります。また、既定のフォーマットへデータを入力する、感情を分析する、などの活用方法もツールによって変わるため、目的を明確にしたうえでツールを選定することが重要です。
データクレンジングを行う
文書や画像、音声データなどが、統一ルールがなく散在している状態では、AIが分析に必要なデータを見つけにくくなります。
そのため、まずはデータクレンジングを行い、元となるデータをできる限り整理することが重要です。
テキストデータは、表記ゆれを修正し、不要な記号・スペースを削除し、音声データは、文字起こしをしてテキスト化することで、AIが分析しやすくなり、アウトプットの精度が高まります。
データクレンジングについて、詳しくはこちらの記事をご覧ください。
必要に応じて人間も作業する
近年、AI自身で自動的にラベリングできるツールが登場しているものの、いまだその機能は完璧ではありません。
専門知識が求められる分野や、感情・行間を読む必要があるケースなどでは、人によるファクトチェックや丁寧なラベリングが必要です。完全にAIで自動化するのではなく、必要に応じて人間も作業を行いましょう。
適切なAIツールを選んで非構造化データを活用しよう
AI技術が発達した現代では、AIを用いることで非構造化データを効果的に活用できます。非構造化データを本格的に活用したいなら、AIが搭載されたマーケティングツールの導入がおすすめです。
HubSpotのシステムには、AI機能「Breeze」が標準搭載されています。一例として、HubSpotに蓄積された顧客情報の要約を表示するなどの活用が可能です。
顧客に関する非構造化データを活用することで、営業・マーケティング・カスタマーサービスなど、顧客と接点がある部門で業務効率化や顧客体験の向上が期待できます。無料から利用できるので、ぜひBreezeをお試しください。

