生成AIとは、「プロンプト」と呼ばれる指示文を入力することでオリジナルのコンテンツを出力するAIシステム・ツールです。
AIをもっと手軽に、Breezeを活用する
マーケティング、営業、カスタマー サービス チームを支援するために、充実したAI機能をご提供しています。
- HubSpotのCRMデータと連携
- 会話型でプロンプトを提案
- LPやブログ記事を簡単生成
- 自動リードスコアリング
近年、質問に対して自然文で回答を返す「ChatGPT」や、テキストによる指示で高品質なオリジナル画像を生成できる「Stable Diffusion」など、生成AI技術を活用したさまざまなサービスが登場しています。
生成AIをビジネスシーンに導入すると、制作業務やアイデア出しなどの効率化や、コンテンツのクオリティ向上が期待できます。ただし、生成AIをはじめとするAI技術を活用する際は、権利関係や情報の信頼性などに注意が必要です。
本記事では、生成AIの概要から仕組み、種類、ビジネスシーンでの活用例、代表的なサービスまで、包括的にご紹介します。
生成AI(Generative AI)とは
まずは、生成AIの定義やモデルの種類、従来型AIとの違いについて解説します。
機械が新たなコンテンツを生み出す人工知能の一種
生成AIとは、人間の指示に従って、機械がオリジナルコンテンツを生成する技術です。「Generative AI(ジェネレーティブAI)」ともいいます。
生成AIは、人間の知性を模倣したシステムを指すAI技術の一つです。AI技術は第一次AIブーム、第二次AIブームと続いて、現在は第三次AIブームだとされていますが、今AIといえば「機械学習」のことを指します。
機械学習とは、AIにデータを学習させ、データ内にあるパターンや法則、カテゴリ分けを覚えさせるものです。例えば、売上データから商品の売れ筋のパターンを導き出したり、猫の画像の特徴を覚えさせて「これは猫かどうか」を判断させたり、といったことができます。
機械学習にはさまざまな手法があり、主に「教師あり学習」「教師なし学習」「強化学習」があります。これらの手法を大きく進歩させ、AI技術を実用的なレベルにまで引き上げたのが「ディープラーニング」です。ディープラーニングでは人の手を介さずに大量のデータを学習できるようになり、AIができることが飛躍的に広がりました。
生成AIも、ディープラーニングの登場によって進歩した技術の一つです。
生成AIでは、プロンプトを入力することでその指示の内容を理解し、定められたタスクを実行して返します。
これを実現しているのが、大規模言語モデル(LLM)や自然言語処理(NLP)などの技術です。大量の書籍データやインターネットデータを学習させることで、単語や文の意味だけでなく前後のつながりやコンテキストを読み取り、その返答として確からしいコンテンツを生成します。
生成可能なコンテンツは、テキストや画像、音声、動画など、多岐にわたります。コンテンツ制作に関して特別な知識がなくても、質が高いオリジナルコンテンツを作成できるのがメリットです。
従来型のAI(識別系AI)との違い
生成AIは、識別系とも呼ばれる従来のAIとは「新しいコンテンツを生成する」という点で異なります。従来のAIでもタスクに合わせた結果を出力しますが、入力した内容を整理し直したものに留まります。生成AIは入力していない内容を生成できるという点で、大きな衝撃を世界に与えたとされています。
生成AIと従来のAIは、学習では部分的に同じ技術を共有しています。例えば、画像を扱うAIでは、猫の特徴を学習するまでは同じです。
従来のAIでは、猫の特徴を学習した上で、入力された画像が猫かどうかを判断します。これは実際には、例えば工場の保守に活用されています。機器の写真から劣化具合を判断し、修理・交換時期を判断することで保守の精度とコストを改善できます。
生成AIでは、猫の特徴を学習した上で、「猫の画像を作成して」と言われたときに猫の特徴を反映した画像を生成して返します。このとき、学習した猫の画像をそのまま出してくるのではなく、特徴を反映した新しいコンテンツを出力します。
このように、生成AIと従来のAIは用途や得意なシーンが異なります。ただ、生成AIはプロンプトを入力するだけで利用できるという簡易性も革命的であり、AI技術を利用するための間口が大きく広がりました。
AI技術について詳しくなくても利用できるため、さまざまなビジネスで活用できます。
非AIのITシステム、非生成のAI、生成AIの「出力」までの違い
生成AIの仕組みや機能を理解するためには、非生成AIや、AIではないITサービスと比較してみるとわかりやすくなります。
AIを含むITシステムは、利用者が何かしらの入力を行い、システムが何らかの出力を返す、という仕組みになっています。キーボードを叩けば文字が記述され、マウスを動かせばカーソルが動き、写真アプリのシャッターボタンを押せば写真が撮影される、というのもすべて入力と出力の関係です。
非AIのITシステムは、入力に対し、決まった出力を返します。
例えば、猫の写真を「猫」という名前のフォルダに入れる、猫の写真を編集して明るさを上げたりノイズを消したりする、といった操作は利用者の入力に対して決まった出力を返しています。勝手に「犬」のフォルダに入れ間違えることはないですし、明るさを1上げたいのに2上げてしまうということもありません。
非生成のAIは、非AIのITシステムとの境目がはっきりしているわけではありませんが、入力に対してAIが一定のタスクを実行した上で出力を返します。
例えば、Google で猫の画像を検索すると大量の猫の画像がヒットしますが、これはインターネット上の画像が猫であるかどうかをAIが判定し、検索ワードに対して関連性が高いものから順に並べて表示するという仕組みです。入力と出力の間にAIが何をしているか、利用者がつぶさに知ることは難しいといえます。
この仕組みであるために、猫と非常によく似た別の動物を猫と勘違いし、表示してしまうということが起こり得ます。
生成AIは、入力の後に行うタスクで生成を行い、出力にて新しいコンテンツを返します。
例えば、猫の画像を作ってと入力すると、これまでに学習した猫の画像から猫の特徴を抽出し、画像に反映させていきます。ただし、AIが猫について人間と同様に理解しているわけではないため、写実的な描写ではディテールがおかしくなってしまうことがあります。
AIがコンテンツを生成できる点で生成AIは優れていますが、人間がペイントソフトで猫を描くときには発生しないミスが起きうるのが課題だといえます。
生成AIに用いられているモデル
生成AIには、テキスト系や画像系、音声系などのサービスがあり、それぞれのサービスで使用されている生成モデルが異なります。
それぞれの製品におけるバージョンのようなもの、例えばChatGPTにおける「GPT-4o」や「GPT-4o mini」もモデルと呼びますが、ここではその技術のベースになっているAIのモデルについて解説します。
▼テキスト生成AIの代表的なモデル
- Transformerモデル
テキスト生成AIに用いられているのは、2017年にGoogle が発表した「Transformerモデル」と呼ばれるものです。これは、入力された文章をAIが理解するために重要なモデルであり、現在世に出ている製品のすべてがTransformerモデルをベースにしています。また、画像生成AIなどについても、プロンプトを理解するためにはTransformerモデルを必要とします。
Transformerモデルがテキスト生成を実現できる理由の一つが、特徴的な仕組みである「自己注意機構」です。これは入力された単語やフレーズ同士の関連性を推論する仕組みであり、離れた単語同士の結びつきも読み取ります。この仕組みにより、AIは入力されたプロンプトを理解し、それに対する回答として確からしい内容を生成できます。
▼画像生成AIの代表的なモデル
- VAE
画像生成AIの最も基本的な生成モデル。ユーザーがコンピュータに学習用データを与え、AIがデータごとの法則性を学び取る。 - GAN
学習用の正解データと、ランダム生成のデータを比較し、出力データの整合性を自動的にチェック。この作業を繰り返すことで高精度な画像の生成が可能。 - 拡散モデル
コンピュータにノイズ入りの学習データを与え、不要物を除去しながら本来の画像を復元する方法。高解像度の画像を生成できるのが特徴。
生成AIが注目されている背景
米コカ・コーラ社は、2023年9月に生成AIを活用した新たな商品パッケージを開発しました。
企業が生成AIを活用する流れが加速している背景として、次のような点があげられます。
ITの進化
ITの発展によってAI技術が高度化したことで、機械が自らコンテンツを生み出せるようになりました。コンテンツの質も向上し、ビジネスで活用できるレベルになってきたといえるでしょう。
これには、AIの進化に欠かせない「学習データ」の飛躍的な増加が深く関係しています。
例えば、テキスト生成AIの代表的なモデルであるGPT-3の場合、学習データの総量は45TBにも及びます。一度に処理できるデータ量の増加が出力精度の向上を促し、AI技術の発展を後押しした形です。
生成AIサービスの台頭
生成AI技術の土台が醸成されたことにより、関連サービスが充実してきたことも生成AIの活用が進んでいる理由の一つです。テキスト生成AIの「ChatGPT」や、画像生成AIの「Stable Diffusion」は、生成AIの代表的なサービスです。
生成AIサービスが開発された当初は、悪用のリスクがあることから、一般公開が控えられていました。しかし、OpenAI社のGPTシリーズが一般公開されたことを皮切りに、続々と関連サービスがリリースされ、2022年頃から数多くのメディアで取り上げられています。
関連サービスを通じて、生成AIが誰でも利用できるようになったことが、現在の躍進につながる大きな要因だといえるでしょう。
生成AIの種類・できること
生成AIは、種類によって対応領域や役割が異なります。それぞれの特徴は次の通りです。
- テキスト生成
テキストボックスにプロンプトを入力することで、AIがその回答結果を返す。膨大な量の良質なデータを同じく膨大な量のパラメータで学習することで、単語・フレーズの次に来る言葉を正確に予測し、人間が書いたような自然な言葉の文章を出力できる。 - メール文・記事生成
テキスト生成AIの応用。ChatGPTやGoogle Geminiなど汎用的なテキスト生成AIでもメール文や記事本文の生成は可能だが、これらの大規模言語モデル(LLM)をベースに開発されたビジネス向けのAIソリューションにより、メール文や記事作成などビジネスに特化した生成を利用できる。 - 画像生成
テキストによる指示と、出力する画像の雰囲気など、簡易的な設定を行うだけで独自の画像を生成する。短時間で高品質な画像を作成できるのが特徴。 - 動画生成
画像生成と同様、テキストによる指示でイメージに近い動画を生み出す。2024年8月時点では、短尺の動画のみ出力可能で、かつ実写に近づきすぎた映像はかえって気色悪さを感じてしまうという「不気味の谷現象」は超えられていないとされる。 - 音声生成
特定の人物の声を何度も機械に学習させ、まったく同じような声質の音声を出力可能。実際に音声生成AIのサービスを利用する際は、すでに学習済みのシステムが採用されているため、数秒程度の音声サンプルを入力するだけで済む。 - 3Dモデル生成
テキストから3Dモデルを生成する。従来、3Dモデルの生成には、数千・数万単位のモデルを作成する必要があったが、生成AI技術の場合はテキストから3Dモデルの生成が可能。
詳細については、こちらの記事で詳しく解説しています。業務によって向き・不向きが異なるため、事前に種類ごとの仕組みを把握しておきましょう。
生成AIのビジネスシーンでの活用例
生成AIは、アイデア次第で幅広いビジネスシーンでの活用が可能です。ここでは、代表的な活用方法を3つ紹介します。
- 難解な資料や論文などの要約
- キャッチコピーやタイトルのアイデア出し
- 背景素材や挿絵の作成
1. 難解な資料や論文などの要約
長文で理解が難しい資料や論文の内容を整理する際は、テキスト生成AIサービスが役立ちます。要約したい文章をテキストボックスに入力し、「この文章を要約してください」と指示を与えるだけで、短時間で文章の要約が可能です。
会議用資料の作成や、Webサイトからの情報収集などの工数削減につながります。
2. キャッチコピーやタイトルのアイデア出し
テキスト生成AIサービスは、キャッチコピーやタイトルなどのアイデアに煮詰まった際に活用できます。
商品やサービスのジャンルを指定し、出力内容の方向性をテキストで指示することで、複数の選択肢を提案してくれます。プロンプトを付け加えると、異なるアイデアの再提案も可能です。
理想的な内容が確実に出力されるとは限りませんが、出力結果を微調整するだけで、新たなキャッチコピーやタイトルの創出につながることもあります。
3. 背景素材や挿絵の作成
Webサイトや動画の背景素材、資料の挿絵などを作成する際は、画像生成AIサービスが最適です。イメージに近い内容をテキストで指示すると、短時間で複数の素材パターンを生成してくれます。SNSのオリジナルアイコンやアバターなど、幅広い用途で活用できます。
ただし、サービスによって商用利用の可否が異なる点には注意が必要です。ビジネスシーンで生成AIサービスを利用する場合、商用利用が認められているものを使用しましょう。
そのほか、生成AIの活用事例を参考にしたい方は、こちらの記事をご覧ください。
生成AIの代表的なサービス
生成AIのサービスを利用すると、学習データのインプットやプログラムの設計といった作業を行うことなく、誰でも簡単に生成AIを活用できます。
ここでは、生成AIの種類ごとに代表的なサービスを紹介します。
1. テキスト生成AIサービス
テキスト生成AIサービスは、テキストコンテンツの作成やプログラミング、チャットボットのシナリオ作成など、幅広いシーンで活用できるのが特徴です。コンテンツを生み出すだけでなく、問題解決手段や未知の情報を探す際にも活用できます。
テキスト生成AIの代表的なサービスは次の通りです。
- ChatGPT
- Google Gemini
- Microsoft Copilot
ChatGPT
ChatGPTは、OpenAIによって開発された、テキスト生成AIの代表ともいえるツールです。生成AIが広く知られるきっかけともされており、現在でもテキスト生成AIの大きなシェアを占めています。
膨大なデータを学習したことで基本性能が高く、最新モデルであるGPT-4oは回答の速さや画像・音声・テキストを一緒に入力できる「マルチモーダル」機能も話題となっています。
2024年8月現在、利用には制限がありますが、無料プランでもGPT-4oを利用可能です。
Google Gemini
Geminiは、Google によって開発されたテキスト生成AIです。
ChatGPTと同じような使い方はもちろん、Google の各種ツールとの連携や検索へのシームレスな移動などに優れ、Google エコシステムを活用できるようになっています。
Google 製のスマートフォン「Pixel」およびイヤホン「Pixel Buds」への搭載も発表され、日常生活の延長線上で利用できるよう進化しています。
Microsoft Copilot
Copilotは、Microsoftから提供されているテキスト生成AIです。MicrosoftはOpenAIへ巨額の出資を行っており、CopilotはベースのシステムとしてChatGPTを使用しています。
Copilotならではの特徴としては、Windows PCやインターネットブラウザ「Edge」から簡単にアクセスできること、WordやExcelなどMicrosoftの製品との連携に優れていることなどが挙げられます。
2. 画像生成AIサービス
画像生成AIサービスを利用すると、短時間で品質の高い画像を作成できるのがメリットです。
抽象的なイメージを具体化したり、ラフ画を加工したりと、AIによるサポートでクリエイティブ業務の時間短縮が期待できます。
画像生成AIサービスには次のような種類があります。
- Stable Diffusion
- Midjourney
- DALL-E 3
Stable Diffusion
Stable Diffusionは、画像生成AIの先駆けともいえるサービスです。
Stable AIによって開発されており、現在一部モデルは対象外ですが、オープンソースソフトウェアとして公開されているため誰でも無料で利用できます。
自身のPCで環境を構築することが難しい場合は、サードパーティが開発したツールを利用することも可能です。
Midjourney
Midjourneyは、Midjourney社によって提供されている画像生成AIです。特に高クオリティな画像が生成できるとして注目されています。有料プランのみ提供されていますが、現在主要の画像生成AIの中ではトップクラスの生成能力を誇るとされています。
通話・チャットアプリ「Discord」上で利用する点に特徴があり、専用チャットボットと対話する形で画像を生成します。
DALL-E 3
DALL-E 3は、OpenAIによって提供されている画像生成AIです。前バージョンであるDALL-E 2は独立したサービスでしたが、DALL-E 3はChatGPTの有料プランからのアクセスとなっています。
ChatGPTのプラットフォームから生成できるため、複数のアプリケーションを移動しなくてもテキスト・画像の生成ができる点が魅力です。
3. 動画生成AIサービス
2024年8月時点において、AIによって生成できる動画には多くの制限があります。
生成できる動画の長さは短尺に限り、人間のモデルを登場させた生成動画は一見実写と見紛うほどですが、不気味の谷現象により気色悪く感じてしまうことが多いといえます。すでにSNS広告やテレビCMで動画生成AIによって作られた映像が使用されていますが、批判を受けるケースは少なくありません。
動画生成AIサービスには次のような種類があり、現在も開発が進められています。
- Runway
- Dream Machine
- Sora
Runway
Runwayは、Runway社によって開発された動画生成AIです。単純に動画を生み出すためのAIというよりは、コンテンツを作る際の強力なツールとしてのコンセプトで作られており、いくつか登場している動画生成AIの中でも高い評価を受けています。
最新モデルは「Gen-3 Alpha」で、生成可能な時間は10秒までですがある程度複雑なモーションにも対応しています。
Dream Machine
Dream Machineは、Luma AIによって開発された動画生成AIです。誰でも無料プランから動画生成を利用することができ、クオリティの高さと利用しやすさから注目を集めています。
プロンプトを入力しての生成はもちろん、静止画をアップロードしてそれを元に動画化することも可能です。
Sora
Soraは、OpenAIによって開発されている動画生成AIです。
2024年8月現在では一般公開されておらず、公開時期も明らかにされていませんが、いくつか発表されているデモ映像や企業のプロモーション映像から高クオリティの動画生成ができると期待されています。
4. その他の生成AIサービス
テキストや画像、動画以外にも、生成AIサービスには幅広い種類があります。
さまざまな生成AIサービスに着目することで、対応可能な業務の領域が広がり、クリエイティブ業務全般での業務効率化に結び付きます。
代表的なサービスは次の通りです。
- DreamFusion
- Soundraw
DreamFusion
DreamFusionは、テキストから3Dモデルを生成できるサービスです。複雑なテキストの要求にも応えられる他、汎用的な形式で出力できるため、映像コンテンツ・ゲーム・AR・VRなど使用するコンテンツを問いません。
生成された3Dモデルを修正することもできるため、3Dモデル制作業務を大幅に短縮できるでしょう。
Soundraw
Soundrawは、ジャンルやテーマなどを選ぶだけでオリジナルの音楽やBGMが生成できる、日本発の音楽生成AIです。
AIの学習に使用している音楽はすべて社内で作成したものであるため、商用利用時にも著作権侵害の心配がないことを謳っています。
無料でも生成できますが、有料プランに登録することで音楽のダウンロードや商用利用が可能となります。
生成AIにできないこと
テキストや画像など、幅広いコンテンツを生み出せる生成AIですが、2024 年時点の技術では実現可能な範囲に限界があります。特に、次のような業務は、AIでの実現が困難です。
- 基盤となる情報が存在しない、一次情報を構築するための調査
- 経験や体験にもとづいたコンテンツの作成
- 主観が求められる芸術作品や商品・サービスの評価
生成AIはあくまで、すでに世の中に存在するデータをもとに、最適解へと導くよう訓練されています。そのため、新たな手法や独自の切り口からコンテンツを創出することはできません。
そのため、企業のコンテンツ制作では、生成AIに不足している個性(personality)と視点(perspective)が、より重要となります。独自性が高く、ユーザーのニーズに適ったコンテンツ制作を従来以上に意識することで、強力な競争優位性が生まれるでしょう。
なお、「基盤となる情報が存在しない、一次情報を構築するための調査」については、従来のAIが得意なケースがあります。
例えば、農作物の選果作業を機械化するシステムにおいては、大量の農作物の画像データを学習することで「大きさ」や「品質」の基準についての一次情報を構築し、AIが判定を行えるようになります。
生成AIを活用する際の注意点
登場して間もない生成AIは、安全性を保護する仕組みや法律が十分に整備されていないのが現状です。次の点には特に注意を払い、対策を講じる必要があります。
- 権利侵害に対する配慮が求められる
- 情報の真偽性を確かめる必要がある
- 企業の機密情報を入力しない
1. 権利侵害に対する配慮が求められる
生成AIによって作成したコンテンツを世の中に向けて公開する場合、著作権や商標権、意匠権などに抵触する可能性があります。
生成AIは、既存の文章や画像などを学習してコンテンツを生み出す仕組みです。そのため、学習元のコンテンツと生成物が似通ってしまい、権利侵害へと発展する可能性もゼロではありません。
ビジネスシーンで生成AIを活用する際は、各種権利が帰属する人物や適用範囲を明確にすることが大切です。
なお、生成AIについて規制する法整備は今のところありませんが、著作権侵害のラインについては文化庁が解釈を発表しています。
文化庁によると、著作権侵害になるかどうかは生成AIによって作られたコンテンツと人が作ったコンテンツで区別しないとしており、「類似性(一致しているか、似ているか)」や「依拠性(キャラクターなど既存コンテンツに基づいているか)」に触れると侵害と捉えられます。
2. 情報の真偽性を確かめる必要がある
生成AIで出力された結果は、必ずしも正確な内容とは限りません。
例えば、テキスト生成AIでは、Web上に存在する大量のテキストデータを機械が読み取ります。そもそもインプットした情報に誤りがあれば、出力結果にも誤認や情報漏れの傾向が現れます。また、単に文章を要約するだけでも、機械が言葉の意味を正確に捉えられない可能性も考えられるでしょう。
情報の真偽性を確認せず、そのままコンテンツを世の中に公開してしまうと、信頼を損なうことがあるので注意が必要です。
最近では、出力結果の根拠となる情報を表示できる生成AIサービスが徐々に増えています。特にテキスト生成AIサービスでは、AIに情報ソースやエビデンスを尋ねたり、自身で入念にファクトチェックをしたりと、情報の真偽性を確かめることが大切です。
3. 企業の機密情報を入力しない
生成AIサービスで使用するプロンプトは、AIの学習モデルに流用されることがあります。指示したテキストの内容をコンピュータが記憶し、別のユーザーの回答に使用されるようなイメージです。
企業の財務情報や技術情報、顧客の個人情報、取引先データなど、機密性の高い内容をプロンプトに使用しないよう、十分に注意しましょう。最悪の場合は機密情報の外部流出や、サイバー犯罪に悪用される恐れがあるためです。
要約のために社内向け資料や会議の議事録を利用する際は、機密情報を入力する機会が増えます。このようなケースでは特に、利用するサービスのセキュリティ面に注意しましょう。
生成AIの仕組みを理解してビジネスに取り入れよう
生成AIは、マーケティングや営業の業務に、さまざまな影響を与えることが想定されます。
特に、過去のデータを分析し、改善策を導き出すようなマーケティング活動は、AIに代替されやすいといえるでしょう。他社が簡単に真似できない独創的なアイデアを取り入れることが、AI時代のマーケターに求められる重要なスキルの一つです。
一方で生成AIは、営業活動の効率化などの良い側面もあわせ持ちます。
近年は消費者の購買行動の変化や広告費の高騰などをきっかけに、数を増やすアプローチは最善とはいえなくなってきました。施策の質を高めてアプローチしていく手法がより重要となりつつあり、生成AIは営業活動を支える役目を果たします。
生成AIは人間の創造性を補完してくれるツールであり、何かを作り出すのはあくまでも人間の役目です。この事実を念頭に置いて、自社のビジネスへの導入方法を検討しましょう。
HubSpotのCRMツールにも、生成AIの技術を活用した機能が搭載されています。
例えば、「AIアシスタント」の機能を使うと、ブログ記事のアイデア出しや営業メールの作成などの作業を、テキストによる指示で実行可能です。
「ChatSpot」では、CRMツールに蓄積された顧客情報をもとに、レコードの追加やレポート作成などの作業を自動化できます。
まずはHubSpotの無料ツールを導入し、使用感や機能性をご確認ください。