生成AIは、マーケティングの世界に革命をもたらす技術の一つです。

従来のデータ分析や市場調査の方法を大きく超え、マーケティング戦略、広告コンテンツの作成、顧客エンゲージメントの向上に至るまで、あらゆる面でビジネスに役立ちます。これから「生成AIの基礎知識」シリーズとして、生成AIの基本的な概念からマーケティングリサーチにおけるその応用例、実際にビジネスにどのような変革をもたらすかについて4回に分けて解説していきます。まず初回は、「生成AIとは何か」という基礎的な内容から始めましょう。

生成AIとは何か

「生成AI」と言われても、これまでのAIと何が違うの?と思われる方もいらっしゃるかもしれません。そこで、AIの歴史や、従来のAIと生成AIの違いを明らかすることで、生成AIの特徴について説明していきます。

AIの歴史

1950年代〜(第一次AIブーム) 

AIの歴史は1950年代にさかのぼります。この時代、AI研究の初期の焦点は、推論や探索アルゴリズムに置かれ、ゲームや数学の定理の証明に成功しました。このような初期の成功は、AIに対する期待を大きく高めましたが、これらのシステムは非常に基本的なタスクに限られていました。

1980年代〜(第二次AIブーム)

1980年代には、AI研究は新たな方向性を見せ始めます。この時代は「エキスパートシステム」の開発に焦点が置かれました。エキスパートシステムとは、膨大な専門分野の知識を与えることで、特定のタスクを人間の専門家と同様、あるいはそれ以上のレベルで行えるようにしたAIのことを意味します。さらに、1980年代には機械学習が登場し、AIシステムがデータから学習する能力を獲得しましたが、この時点ではまだ学習プロセスに人のサポートが必要でした。

2010年代〜現在(第三次AIブーム)

2010年代に入ると、ディープラーニングの技術が登場し、AIは新たな革命の時代を迎えます。ディープラーニングによる分類器の性能向上は、画像認識、自然言語処理、音声認識など、多岐にわたる分野での応用を可能にしました。この期間には、AIの発展がシンギュラリティー(技術的特異点)に至る可能性についての議論も活発になりました。

2022年以降(生成AI・元年)

2022年以降、生成AIが社会に大きな影響を与え始めたことは、AIの歴史の中でも特に注目される転換点です。生成AIは、テキスト、画像、音楽、コードなど、あらゆる種類のコンテンツを人間と見分けがつかないレベルで生成する能力を持っています。この技術の進歩は、創造性を必要とする業務や、個人の趣味の領域にまで深く浸透しています。

 

従来のAIと生成AI

従来の人工知能(AI)は、主に「分類器(Classifier)」の役割を果たす技術として認識されていました。これは、特定の入力を受け取り、それがあらかじめ定義されたカテゴリ(クラス)のどれに属するかを予測する仕組みです。例えば、メールがスパムかそうでないかを識別する、画像内の物体が何であるかを認識するといった技術です。しかし、カテゴリには常に例外がつきもののため、例外が多い分野では、分類器を使うことが困難だという弱点もありました。

出典: Giovannni Artavia, YOLO: Image Recognition Gone Fast, Medium, ( https://medium.com/@giovaartavia/yolo-image-recognition-gone-fast-45904ee46a90 ),
Feb 21, 2019

生成AIの登場は、この状況に大きな変化をもたらしました。生成AIは、ただ分類や予測を行うだけでなく、ユーザーからの指示に基づいて新しいコンテンツや情報を「生成」する能力を持ちます。これには、テキスト、画像、音楽、さらにはコードなど、様々な形式のコンテンツが含まれます。特に言語モデルにおいては、ユーザーが言語で指示を出すことで、事前に学習されていない新しい知識を取り出せるようになりました(例:Zero-shot・Few-shot)。

しかし、生成AIにも課題が存在します。その一つが「幻覚(Hallucination)」と呼ばれる問題です。これは、AIが存在しない情報や根拠のない回答を生成してしまう現象を指します。例えば、ChatGPTのようなモデルは、あくまで膨大なデータに基づいた言語計算機であり、その回答には常に正確なわけではありません。にもかかわらず、ユーザーが正確な情報や解答を期待するあまり、不正確な情報が拡散しやすくなることがあります。特に、誤情報が生まれやすい分野では、生成AIの利用に慎重なアプローチが求められます。

 

従来型AIの特徴

従来の人工知能(AI)は、リサーチャーや技術者に向けて大雑把に言えば「判別分析」を行うシステムだといえます。これは、データを分析してパターンを見つけ出し、それらを特定のカテゴリに分類することを目的としたものです。従来型AIの核心は、与えられた入力がどのような特性を持つかを判断し、それを既知のカテゴリに割り当てる能力にあります。

従来型AIを活用する際には、まず十分な量の学習データや辞書が必要となります。学習データを準備する際には、データの収集だけでなく、前処理としてのクリーニングや正規化などが必要となります。さらに、予測モデルを構築するためには、プログラミングスキルや統計学に関する深い知識が必須です。

従来型AIの出力結果はカテゴリである必要があります。連続量やスカラー値も、事実上カテゴリとして扱われることが多く、これには適切な前処理やカテゴリ分けの戦略が求められます。また、学習時に存在しなかったクラスについては、従来型AIでは予測が困難です。これはAI用語で「フレーム問題」と呼ばれ、システムが学習した内容に基づいてしか世界を認識できないという限界を持っています。

クラスをどれだけ細かく分けるか、例外をどのように扱うかは、従来型AIにおいて常に重要な問題です。細かすぎるクラス分けにより複雑になってしまった学習データや、例外の多いデータセットではモデルの一般化可能性が低下する恐れがあります。このように、従来型AIを設計し運用していくためには、データの準備からモデルの評価まで、多くの専門知識を要するとともに、さまざまな課題に対応しなければなりません。

 

生成AIの特徴

生成AIは、従来のAI技術の範疇を大きく超える、新たな地平を切り開いています。この技術は、絵柄、言い回し、雰囲気など、従来は言語化しにくかった概念や表現の「パターン」を学習し、内部化する能力に長けています。この点が、生成AIの最も顕著な特徴の一つです。

生成AIの基盤となるのは、深層学習(Deep Learning)という、旧来型AI技術の進化の副産物です。深層学習は、大量のデータから複雑なパターンを抽出し、学習する能力を持ちますが、生成AIはこれをさらに発展させ、特定の指示やキーワードに応じて、学習したパターンを基に新しいコンテンツを「生成」することが可能です。例えば、特定のスタイルで描かれた絵を生成したり、特定の文体でテキストを作成したりすることができます。

この技術の鍵は、「言葉を手がかりにして、学習したパターンを引き出す」能力にあります。生成AIは、ユーザーからの簡単な指示やキーワードを受け取ることで、それに応じたコンテンツを創出することができます。このプロセスは、人間の創造的なプロセスにある程度類似しているとも言えますが、その背後には膨大なデータと高度な計算能力が必要とされます。

生成AIは、従来のAIが持つ限界を超え、人間の感覚に近い形でのコンテンツ生成を可能にしました。これにより、デザイン、文章執筆、音楽制作など、様々なクリエイティブな分野での応用が期待されています。しかし、このような進歩は同時に、著作権や倫理的な問題など、新たな課題をもたらすことも忘れてはなりません。生成AIの特性を理解し、その潜在的な力を倫理的に、かつ効果的に活用することが、今後の技術発展における重要な課題です。

ここで、従来型AIと生成AIの違いをまとめてみましょう。

生成AIのすごいところ

生成AIで特筆すべきなのは、デジタル化されたあらゆる「パターン」を学習し、それを言語的シンボル(記号)と変換できる能力です。

例えば、画像生成AIの場合、人物や建物などの特徴的なトレース(線)を学習し、「東京スカイツリー」といった特定のキーワードに対して、多くの人がイメージする平均値的な画像を生成できます。言語モデルAIの場合、テキストに基づく質問と応答(Q&A)を学習し、特定の問いかけに対して、私たちが期待する一定の回答を提供する能力を持っています。

さらに、音楽や動画など、様々なモーダル(情報の表現形式)に対しても生成モデルが作られています。これにより、生成AIは単に画像やテキストを超えた、多様な創造的表現の領域においてもその能力を発揮しています。

また言語モデルAIは、ただテキストを生成するだけではなく、人間の感情にも影響を与えます。
たとえば、「患者の質問に対して、ChatGPTは医師よりも質が高く共感的な回答ができる」と主張する研究もあります(参照: Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social Media Forum | Health Informatics | JAMA Internal Medicine | JAMA Network https://jamanetwork.com/journals/jamainternalmedicine/article-abstract/2804309
)。この研究は、言語モデルAIが持つ潜在能力を明らかにし、特に医療コミュニケーションの分野での応用可能性の高さを示唆しています。

岐阜大下畑教授のFacebookポストより図表引用:https://m.facebook.com/story.php?story_fbid=pfbid0A7HSzdhRu9Pa1hWcUDQrFaHcMrdQkNs1L2oPuU4b3RhmuwHN66Z8ViJNwBrBpw8Ul&id=100000026903948

現代社会では、すでに多くの人がソーシャルメディア(SNS)によって感情が左右され、時には非合理な判断を下すこともあります。生成AIがこのようなプラットフォームで広く利用されるようになれば、その影響は計り知れないものになるでしょう。AIが生成するコンテンツは、人間の感情や直感に直接訴えかける力を持ち、それによって我々の行動や意思決定に影響を及ぼす可能性があります。

この進化は、マーケティングの過程自体をも根本から変える可能性を秘めています。感情に訴えかけるメッセージを効果的に生成し、消費者の心を掴むことができれば、ブランドの認知度向上や顧客のロイヤルティ獲得につながります。言語モデルAIは、顧客とのコミュニケーション方法を再定義し、よりパーソナライズされた関係を築くことが可能になります。

さらに、言語モデルAI、特にChatGPTのようなモデルは、アクセスが容易な巨大な知識ベースとしての役割もはたしています。ChatGPTを使ったことがある方は、ChatGPTの応答における単語の繋がりや文脈の把握能力に対して、「知性」を感じ取ったことがあるのではないでしょうか。この知性の源泉は、ChatGPTがこれまでに読み込んだ、一人の人間が一生かけても読み切れないほどの膨大なデータ量(約45TB!)にあります。

ChatGPTは、既に公開されている書籍、記事、ウェブサイトなどから得られる知識を基に、幅広い質問に答える能力を持っています。これにより、ユーザーは特定の主題に関する情報を瞬時に得ることができます。一方で、ChatGPTの知識はインターネット上に存在するデータに限られるため、ネット上に存在しない情報や、一般的な個人のプロフィール、地理的に局所的または辺縁的な知識については、その仕組み上把握していません。

言語モデルAIは追加の学習が可能であり、常に更新され続ける知識にアクセスすることができます。これにより、言語モデルに格納された常識的な知識はインターネット内で急速に流通し、充満することになります。結果として、言語モデルAIはただの情報検索ツールを超え、知識の普及とアクセス性の向上に寄与しています。

そこでシリーズ2回目は「生成AIの基礎知識 (2) Chat GPTとは」として、「ChatGPT」についてより深く説明しいきます。


 

アンド・ディでは生成AIの技術を用いたマーケティングリサーチに役立つサービスを開発しています。

 

アイディエータ

OpenAI社のChatGPTにも使われる大規模言語モデルのGPTを用いて、商品開発時に必要となる新しい切り口のアイデアを短時間で多数生成するAIです。

 

コーディスト

GPTモデルの活用で、アンケートの自由回答(テキスト回答)のコード化(アフターコーディング)が数分で可能です。また、集計結果はAIを用いた「まとめマップ」機能で簡単に二軸グラフに整理可能となっています。

アンド・ディは「IT導入補助金2024」の支援事業者に認定され、アンケート自由回答の分類ツール「コーディスト」が同補助金の[通常枠] ITツールに認定されています。詳しくはコチラから。