【生成AIとは】"生成AIでできること"や"生成AIのモデル"を簡単に解説

ビジネススキル・マナー

新聞やインターネットのニュースなどで「生成AI」という用語を見かけることが多くなってきましたが、この用語だけだとどんな意味なのか想像しにくいという方も少なくないのではないでしょうか。今回は、生成AIとは何か生成AIが生成できるものやモデル雇用・仕事への影響などについて解説します(※本記事のメインビジュアルはAI生成画像です)。

(※もしかしたら仕事頑張りすぎ!? ... そんな方におすすめ『仕事どうする!? 診断』)

【関連記事】「【NFTとは】暗号資産との違いや注目の理由、NFTのメリットや取引対象を解説」

1.生成AIとは

生成AIとは、テキストや画像、動画、音声などを生成できる人工知能(AI)モデルのことです。ジェネレーティブAI(Generative AI)と呼ばれることもあります。

従来のAIが一定の基準で「判別」をするものであったの対し、生成AIはコンテンツやアイディアなどを創出できることから、既存の社会構造を根本的に変えるゲームチェンジャーになる可能性があると期待されています。

post976_img1.jpg

【関連記事】「【クッキー(Cookie)とは】利用するメリットとプライバシー保護上の問題点」

今の仕事、会社がつらい...無料で相談できる転職エージェント「マイナビエージェント」に相談してみる。

はじめて転職する場合の7つのポイントを確認する。

2.生成AIが生成できるもの

2.1.画像生成

2022年8月に、画像を生成できるMidjourneyが登場して大きな話題となり、生成AIのブームが始まりました。Midjourneyは、指定したプロンプト(テキストタグ)に従って、美しい画像を出力してくれるものです。この他、Stable Diffusionなどもよく使われています。

趣味で画像を作成する「AI絵師」と呼ばれる人たちが出現しているだけでなく、ゲームや広告のグラフィック制作にも応用が始まっています。

2.2.テキスト生成

2022年11月に公開されたChatGPTが世界的に大きな話題を呼んでいます。会話のように質問を入力すると、それに回答をしてくれるばかりでなく、プログラムの生成や文章の要約などもしてくれます。

また、うまく使いこなすことでメールの返信文を生成させたり、特定のアイディアを提案させたりすることも可能です。

マイクロソフトは、Microsoft 365(Microsoft Officeのクラウド版)に同じ技術に基づいた生成AI「Copilot」を搭載することを発表しており、OfficeとCopilotを併用することで、ホワイトカラーの業務が一気に効率化されることが期待されています。

Wordで書いた文章の校正だけでなく、読みやすくするための提案をさせたり、表データの高度な統計分析が簡単にできたりするようになります。

2.3.動画生成

まだまだ進化の過程にありますが、画像生成AIと同じようにプロンプトを入力するだけで動画を生成してくれるAIも登場しています。

将来は、CM映像なども生成できるようになる可能性があり、期待が高まっています。

2.4.音声生成

短時間の音声データを入力するだけで、あたかもその人が話をしているかのような音声を生成できるようになるものです。読み上げるテキストを用意することで、ニュースの読み上げやナレーションなどにすでに応用が始まっています。

また、音声認識AIやテキスト生成AIと組み合わせることで、音声による人間の会話が可能になり、顧客サポートセンターや企業の受付業務への応用も期待されています。

post976_img2.jpg

(AI生成画像)

【関連記事】「データサイエンティストになりたい人が注目すべき資格と身につけたいスキル」

3.知っておきたい生成AIのモデル

生成AIに使われるモデルは、従来の機械学習モデルから大幅に進化をしています。技術詳細までは知る必要はないものの、生成AIの重要なモデルについては概要を押さえておく必要があります。

3.1.GAN(敵対性生成ネットワーク、Generative Adversarial Network)

画像生成AIで使われるモデルです。2つのAIモデルを敵対させて学習を進める仕組みになっています。

ひとつのモデルは画像を生成します。もうひとつのモデルは生成された画像がリアルであるかどうかを判別します。

最初は両方のモデルとも性能は低いですが、生成モデルが生成した画像を、判別モデルが判定をするということを繰り返していくことで、両方のモデルの学習が急速に進み、最後には非常に精度の高い画像が生成されるようになります。

3.2.拡散モデル(Diffusion Model)

画像生成AIで使われるモデルです。ある画像にノイズを徐々に乗せていくと最終的にテレビ放送終了後の砂嵐のようなノイズだらけの画像ができあがります。今度は、このノイズだらけの画像からノイズを徐々に除去をしていき、最終的に元の画像と近くなるようにAIを学習させます。

この学習を進め、ノイズのパラメーターをうまく制御できる仕組みを入れることにより、ノイズだらけの画像から精度の高い画像を生成できるようになるというものです。

このノイズのパラメーター制御は簡単ではなく、MidjourneyやStable Diffusionが実用的なレベルの画像を生成することに成功し、生成AIのブームが生まれています。

3.3.GPT(Generative Pre-trained Transformer)

ChatGPTで一躍有名になったAIモデルです。大量の文章を読み込み、単語と単語の関連度を学習していきます。テキストを生成する時は、ひとつの単語を使ったら、次に関連度が高い単語を選び出すことで、文章を生成しています。

GPTはChatGPTを公開したOpenAI社が開発したモデルで、一般にはLLM(Large Language Model、大規模言語モデル)と呼ばれます。LLMに関しては世界中で開発競争が始まっています。

post976_img3.jpg

【関連記事】「ChatGPTの使い方とは?実際に使用するまでの流れを解説!」

4.生成AIでできること

生成AIには無限の可能性がありますが、すぐにでもできることとして、次の3つが挙げられています。

4.1.定型業務の効率化、自動化

会議の議事録の作成、決まった質問にメールで返答する、複雑なデータの可視化、文章の要約、校正といった定型業務は多くの人が行っています。

このような定型業務が、生成AIにより大幅に効率化されるだけでなく、自動化も可能になってきます。

人間は生成AIにはできない人間同士のコミュニケーションや創造的な業務に専念できるようになります。

4.2.コンテンツのローコスト制作

社内でもさまざまなコンテンツを制作しなければならない業務があります。

例えば、商品の紹介パンフレットをつくるのであれば、特徴をわかりやすく解説した文章、性能が一目でわかる表、グラフ、イメージを膨らませるための画像、動画などが必要になります。

従来は、このようなコンテンツを制作するのに、外部の専門家に外注することが少なくありませんでした。

しかし、生成AIを使うと、このような外注が必要なくなり、社内で質の高いコンテンツを生成できるようになります。

また、修正も非常に簡単であるため、スタッフの意見を取り入れて、どんどん修正していき、質を高めることが可能になります。

また、バーチャルキャラクター、音声生成AI、テキスト生成AIなどを組み合わせることで、簡単にVtuberがつくれることになり、SNSで発信するハードルも大きく下がります。

4.3.創造的な業務の補助

生成AIは創造的な仕事のアシスタントにもなります。

例えば、ビール会社のスタッフが、ビールを飲むシーンを軸にした広告キャンペーンを展開するとき、「ビールを飲むのに最高のシーンを教えて」とテキスト生成AIに尋ねることで、さまざまなアイディアを提案してもらうことができます。

それだけで最終アイディアとして提案できるとは限りませんが、アイディアを考える時に何もないところで自分で考えるよりも、生成AIの提案を基にして考えることで、短時間で、漏れのない企画を立てることが可能になります。

post976_img4.jpg

(AI生成画像)

【関連記事】「【ディープフェイクとは】見破るための3つの対処法と情報拡散における注意点」

5.生成AIに対する主な批判内容

生成AIは社会を大きく進化させてくれる技術であることはもはや間違いありませんが、さまざまな批判も起きています。

5.1.多くの専門職が失業する可能性

専門性を持った職業、例えばイラストレーター、フォトグラファー、ライター、デザイナー、プログラマーといった職業への需要が減る可能性があります。

職業そのものが消えてなくなってしまうことはないものの、生き残れるは上位5%程度の人たちだけで、95%の人は生成AIに置き換えられてしまうと試算する人もいます。ホワイトカラーでも定型業務だけをしている人は仕事がなくなる可能性があります。

生き残った人も安心はしていられません。「AIが定型業務を代行し、人間はAIにはできない創造的な仕事に集中できる」とは言うものの、朝から晩までずっと創造的な仕事ができる人というのは一握りの人達です。

多くの人は、定型業務と創造的業務をバランスよく組み合わせながら仕事をしています。生成AIはどんどん進化をし、できることも広がっていくため、一部の人達以外は仕事がなくなる社会になると主張する人もいます。

産業革命による機械化、情報革命による自動化でも、多くの人が職を失いましたが、産業革命、情報革命により新たな職業も生まれたため、リスキリングをするなどして、異なる仕事に就くことができました。

しかし、生成AIによる知能化は広範囲の職種に及ぶため、充分な量の新たな職業が生まれるかどうかはよくわからないところがあります。

5.2.著作権の問題

生成AIがコンテンツを生成すると言っても、何もないところから生み出しているのではなく、既存のコンテンツを大量に学習し、それを模倣することでコンテンツを生み出しています。これは人間も同じことで、既存のコンテンツを学習し、新たなコンテンツを生み出していますが、独自性の割合により「盗作」と「オリジナル」に分かれます。

この境界線は微妙で、生成AIが生み出したコンテンツに対しても、既存コンテンツとの類似性が一定以上高ければ、やはり盗作として扱われることになります。

このような状況に対して、自分の作品を学習教材として利用されることを拒否するアーティスト、クリエイターも登場してくることが考えられます。生成AIがあまりに急激に進化をすると、利用できる学習教材が少なくなり、生成AIの進化も鈍化してしまうことになりかねません。

5.3.生成AIのリスク評価が追いついていない

生成AIは悪用することも可能です。すでに、ビデオ通話で友人のふりをして会話をしてお金を騙し取るという事件が起きています。生成AIにより業務が効率化、自動化するように、犯罪も同様に効率化、自動化されてしまう場合もあります。

また、イラストコンテストに生成AIで作成した画像が出品されたり、学生がレポートを生成AIに書かせたりといった問題も起きています。このままでは、生成AIの悪用や不適切な使用を禁止するという制限を強める方向に進んでしまいかねません。

問題は、生成AIのリスクをどのように評価をすればいいのか、その手法も確立をしていないということです。このリスク評価手法を確立することが急務になっています。

そのために、SpaceXやテスラを起業し、OpenAIの共同創業者でもあるイーロン・マスク氏は「AI開発を6ヶ月凍結すべきだ」と主張をしました。

また、ディープラーニングの生みの親であるカナダトロント大学の元教授であるジェフリー・ヒントン氏は、グーグルを退職してAIのリスクについて考える活動をすると宣言しました。

6.AI革命はMicrosoft 365から本格的に始まる

さまざまな批判もありますが、Microsoft 365のCopilotが利用できるようになると生成AI革命は大きな広がりを持つことになります。

普段使っているWordやExcel、Teamsなどから、ChatGPTでも使われているGPT-4が使えるようになるのがCopilotです。

日常使っているWordやExcelでさまざまな定型作業をAIに依頼をすることができるようになり、業務の効率が格段に上がり、業務の質も高くなります。

例えば、マイクロソフトのブログでも、以下のように紹介されています。

6.1.Copilot in Word

ユーザーと一緒に文章の作成、編集、要約、創作を行います。簡単な指示だけで、Copilotが必要に応じて組織内の情報を盛り込みながら、ユーザーに代わって下書きを作成します。既存のドキュメントに内容を追加することも、文章を要約することも、ドキュメントの一部または全体を書き換えて簡潔にすることも可能です。

(例)

「第3段落を簡潔にして。ドキュメントのトーンをもう少しカジュアルに変更して」

6.2.Copilot in Excel

ユーザーのそばでデータの分析と探索を支援します。Copilotに数式をたずねるだけでなく、自然言語でデータセットに関する質問をしてみてください。それに基づいてCopilotがモデルを生成し、相関関係を明らかにしたり、What-ifシナリオを提案したり、新しい数式を推奨したりしてくれます。これにより、データに手を加えることなく、掘り下げた分析が可能になります。

(例)

「<変数の変化> の影響を推定し、グラフを生成して視覚的にわかりやくして」

6.3.Copilot in Outlook

受信トレイとメッセージの画面でユーザーをサポートし、メールの選別に費やす時間を減らし、スマートに、迅速に、かつ簡単に、コミュニケーションに費やす時間を増やせるようにします。複数の人と長くやり取りして複雑になったメールスレッドを要約して、各自が書いたことの内容だけでなく、それぞれの違った視点や、まだ解決されていない問い合わせも把握することができます。

(例)

「来週木曜日の正午に実施する、新製品の発売に関する『ランチと事前調整』に全員を招待して。ランチの用意があることも記載して」

6.4.Copilot in Teams

共同作業の手間を軽減します。効果的な会議進行、スピーディな会話、主要論点の整理、重要アクションのまとめをサポートし、次に何を実行すべきかをグループ全体が把握できるようにします。チャットでは、Copilotの助けを借りて、議論の流れを妨げることなく、特定の問題に対して答えを得たり、見逃していることをキャッチアップしたりできます。

会議や会話にCopilot を追加すると、チャットの履歴に基づいて会議のアジェンダを作成したり、フォローアップのために適切な人物を特定したり、次の進捗確認のミーティングをスケジュールしたりするなど、一般的なタスクを強力にサポートしてくれるツールが手に入ります。

(例)

「<議論されているトピック> のメリットとデメリットを表にして。決定を下す前に他に考慮すべきことは?」

デスクワークで生成AIをアシスタントにできる人と、それができずに従来通り手作業で仕事をする人の間では、業務にかかる時間、成果物の品質、業務遂行の完成度において、圧倒的な差がつく可能性があります。Copilotは年内にMicrosoft 365に搭載予定です。

7.まとめ

生成AIとは、テキストや画像、動画、音声などを生成できる人工知能(AI)モデルのことです。社会のあり方を変えてしまう可能性があるゲームチェンジャーとして期待されています。

しかし、人間社会のあり方に大きなインパクトを与えるため、そのリスクも指摘され、リスク評価の仕組みを整えることが急務になっています。一方で、年内にはMicrosoft 365にCopilotが搭載され、日常の業務が大幅に効率化、自動化されることになります。

【関連情報】「生成AIとは?従来のAIとの違い、概要や種類について詳しく解説|アンドエンジニア」

原稿:牧野武文(まきの・たけふみ)

テクノロジーと生活の関係を考えるITジャーナリスト。著書に「Macの知恵の実」「ゼロからわかるインドの数学」「Googleの正体」「論語なう」「街角スローガンから見た中国人民の常識」「レトロハッカーズ」「横井軍平伝」など。

この記事をシェア

  • facebook
  • このエントリーをはてなブックマークに追加
  • X(旧Twitter)

同じカテゴリから
記事を探す

ビジネススキル・マナー

同じキーワードから
記事を探す

求人情報

TOPへ