ChatGPTとは? 知っておくべき簡単な仕組みと全体像、注意点
ここでは、調べた内容と実際に有料版(GPT-4)も使ってみての所感をもとにChatGPTに関して次のことを書いている。
- ChatGPTとは? 簡単な仕組みやちょっとした全体像
- ChatGPTの得意分野(できる)、不得意分野(できない)
- ChatGPT、使用上の注意点3つ
- ChatGPTの活用例(概要)
このサイトでは、2015年あたりからAI(人工知能)の記事をちょくちょく書いていたが、そこからだいぶ変わった感がある。特にChatGPTの存在が大きいので、まとめてみることに。
簡単にまとめるとこちらのとおり。
目次
ChatGPTとは? 簡単な仕組み、ちょっとした全体像
これから使ってみようと思う人は、こちらにアクセスすれば使える。
https://chat.openai.com/
登録は必要だが、無料でも使える。
有料版はChatGPT Plusという名称で、毎月20米ドル(1ドル135円として月2,700円)かかる。
無料版と有料版のChatGPTの違いは公式ページを見ると、
- 混み合っていても優先的に使える
- 反応が速い
- 新機能の優先利用ができる
といった記載がある。
3つめの新機能の優先利用に関しては、現状だとより新しいバージョン(GPT-4)を利用できる点がそれに当たるだろう。
現在、無料版はGPT-3.5というバージョンで、有料版だとGTP-4というバージョンが使える。
実際に使ってみないと分かりにくいとは思うが、違いははっきりと感じられる。
ChatGPTと、ChatのつかないGPTとかGPT-3.5, GPT-4などの違いについては後述。
ChatGPTの簡単な仕組みは知っておいたほうがいい
ChatGPTの仕組みなんて知らなくても使えればいいという考えもあるとは思うが、簡単で構わないのである程度は知っておいたほうがいい。
仕組みをある程度知っておくと、より効果的に使えるようになると思うので。
といっても、AIを使った製品開発をしているとか、研究しているとかそういう人ではなく、ChatGPTを利用するだけの人であれば本当に簡単にでいいと思う。
ということで、まずはどんな仕組みかについて。
ChatGPTはどうやって応答しているのか? 簡単な仕組み
ChatGPTとは名前に Chat とあるようにチャット形式(対話形式)で質問に対して答えを出してくれるAI(人工知能)。
ただ、人間と同じように意味を理解して受け答えしているわけではない(そういうふうに見えてしまうが)。
ではどうしているか?
前の文章に対してつながりがしっくりきそうな文言をつなげているというのが仕組みだ。
ChatGPTは確率的にこの文言が続きそうというのを計算して文章を紡いでいる。
なので、例えば「お魚くわえたどら猫」と来たら「追っかけて」という文言が次に来そうというのは多くの日本人に共通しているはず。
(個人的には「どら猫」なんてサザエさん以外で聞いたことがない……)
「昔むかし」ときたら「あるところにおじいさんとおばあさんが…」だし、「はっけよい」ときたら「のこった」だろう。
そうした例は極端な例だけれども、なんとなく仕組みを理解できるかと思う。
ちなに、ChatGPT(GPT-3.5)は、なんと5兆語のデータをもとに学習しているとのこと。
使ってみると分かるが、適切と思える答えが返ってくることが多い。
ただ、適当なことも言ってくるので注意が必要になる。
例えば、このサイトについて聞いてみると、以下のようにデタラメな答えが返ってくる(クオリティが高いと言ってくれるのはありがたいのだが笑)。
こうしたAIがいい加減なことを出力する現象には名前がついていて「幻覚(Hallucination)」と呼ばれる。
もっと詳しい仕組みに関しては論文が出ているので、詳しく知りたい場合はそれらを読んでみるといい。
個人的にはそこまで詳しくはは追わないので、仕組みを解説してくれている人の話を複数聞いて参考にしている。
ChatGPTの「GPT」とは?
Wikipediaを見ると、GPTのページに上記の図が載っている。
たいていの人はなんだか分からないと思う(以下、エラそうに書いているが、いろいろと調べた結果であって仕組みを詳細に理解しているわけではないのであしからず)。
要はChatGPTのGPTはGenerative Pre-trained Transformerの略で、事前に大量のデータを使って学習しておいて、その成果をベースに言葉(自然言語=人間が使う言葉)を処理するモデル。
OpenAIという非営利組織が開発している。
そして、そのGPTという自然言語処理のモデルを使ったAIのサービスとして、GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4といったようにバージョンアップされながらリリースされている。
「ChatGPT」と「GPT」の違い
では、ChatGPTというのはなんなのかというと、それまで、例えばGPT2とかGPT3などを使うにはプログラミングが必要になっていたのだが、それをブラウザを介してチャット形式で使えるようにしたのがChatGPTになる。
現状、ChatGPTでは無料版はGPT-3.5、有料版ならGPT-3.5とGPT-4の両方が使える。
もちろん、チャット形式ではなく、自分でプログラミングしてGPT-3.5やGPT-4を使うこともできる(その場合、APIを使うことになり、ChatGPTとは別な料金体系となる)。
ということで、ChatGPTとChatのつかないただの「GPT」は、完全には同じではなく区別されている。
こうしたことを知らなくても、ChatGPTを使う分にはなんの問題もないと思うが、より大きな枠で把握しておいたほうがメリットはあると思う。
ChatGPTはLLMの1つ
ChatGPTの位置づけについてもう1つ。
ChatGPTについて調べていると、LLMという用語が出てくることがある。
LLMというのはLarge Language Modelの略で、日本語だと大規模言語モデルになる。
要は大量の文章やら単語やらをインプットして学習させることによって、人間が使う言語(自然言語)を処理できるモデルだ。
例えば、文章を要約したり、文章から特定のものを抽出したり、文章を生成したりといったことができる。
「さっきのGPTと同じでは? 何が違うのか?」となりそうだが、LLMはGPTの上位概念となっている(なので、まったく同じではない)。
つまり、LLMの一種としてGPTがあるというわけだ。
そして、前述したとおりChatGPTはGPTをチャット形式でブラウザから使えるようになっている(プログラミング不要)。
より詳しく知りたい方は、LLMなどを調べるといいかと思う。ここではそこまでは追わない。
ChatGPT以外にもいろいろあるAI
LLMのAIはChatGPTに限らず、他にもいくつかある。
例えば、GoogleはBERTやLaMDA、Meta(Facebook)はOPT-175BというLLMを開発している。
LaMDAは会話のデータをもとに学習されていて、自然な会話を目指している点が特徴。
ちなみにMicrosoftの製品にGPTが使われるようになっているが、MicrosoftがGPTを開発しているわけではない(出資はしている)。
先ほども書いたとおり、GPTはOpenAIという組織が開発している。
ChatGPTを生み出した組織
すでに触れたとおり、ChatGPTはOpenAIという組織が開発している。
ここでは、もう少し詳しく見てみる。
OpenAIは株式会社ではなく、非営利組織。
創立は2015年12月で、その後、2019年から利益の上限が決まっている上限付き営利という形態に移行している。
創業者は複数いて最も有名なのはサム・アルトマン(Sam Altman)だろう。イーロン・マスクも創業者の一人。
サム・アルトマンはY Combinator という有名なベンチャーキャピタル(VC)の元代表。
Y CombinatorはAirbnbやDropbox、Stripeなど多くのIT企業に投資していることでも知られるVCだ。
なお、多額の資金を出資している会社の1つにMicrosoftがある。
Microsoftの検索エンジンであるBingにGPTを使うとか、Office製品にGPTを使うといった話が出てくるのはここに関係していると思っていいだろう。
ChatGPTの得意分野(できる)、不得意分野(できない)
SNSなどを見ていると、自分だけかもしれないが
「こんなこともできてすごい!」
みたいなのが目立つ。
実際、本当にいろいろとできるのですごいのは確かだと思う。
一方、期待値が高くなりすぎるせいか、実際に使ってみると「思ってたのと違う……」となることもある。
どうやってGoogleの検索を使うかによって得られる情報が変わるのと同じように、ChatGPTも使い方によってアウトプットが変わる。
このあたりの詳細は別の機会に。
得意分野(できる)
ChatGPTで、そもそも何ができるかというと次のようなことだ。
- 文章の要約
- 文章から情報を抽出
- 文章の言い回しの変更
- チャットでの会話
- 文章を書いてもらう
- プログラムのコードをつくる
- アイデア出し、ブレインストーミング
文章に関することならなんでもできそう。
今のところ、使っていて特に有用だと思ったのは文章要約やライティング、ブレインストーミングかなと思う。
不得意分野(できない)
ただ、先ほども書いたとおり、いい加減な結果を出すことがあるので注意。
もしかしたら意外に思うかもしれないが、ChatGPTは計算も不正確になることがある。
例えば、10,000番目に来る素数は? と聞いたところ、以下の答えが返ってきた(GPT-3.5)。
調べると分かるが、10,000番目の素数は104,729なので、違う答えが返ってきている。他の9,999番目なども間違っている。
ただ、GPT-4にすると正しい答えが返ってくる(聞き方を変えてしまったが、GPT3.5で同じ質問をしてもこうはならない)。謙虚にもなっている。
今度は、3の50乗の答えを聞いたところ、こちらの回答があった(GPT-3.5)。
計算機や計算アプリなどで計算したら分かるが、桁数は24桁になる。
計算アプリだと途中で e+23 とか E23 みたいな感じで省略表示されてしまうが、正確にはこちらのようだ。
3の50乗 = 717,897,987,691,852,588,770,249
無量大数は10の68乗(=0が68個つく)なので、全然違う数字になっている。
ちなみにGPT-4の場合はこちらになって、ちょっと正しそうに見える。717……と始まるのは正しい。
でも、桁数が全然違っている。
答えに37桁の数字を出しておきながら、すぐ後にe+23(つまり10の23乗=100,000,000,000,000,000,000,000倍するということ)というデタラメな回答をしている。
ChatGPTの苦手や間違いを知っておく
ChatGPTに上記のような計算をさせることはあまりないと思うし、そもそも計算は計算機を使えばいい。
ただ、ChatGPTは計算に関しても、間違った答えをさも正解かのように出力することがある、と知っておくのはいいと思う。
これは確率的な結果から文字を出力するAIということを知っていれば、納得できると思う。
これが、前述した簡単でもいいので仕組みを知ることは重要だという理由の1つになる。
ChatGPTの注意点
現時点でChatGPTを使う際に注意したいのは大きく3つだろう。
- 学習データは2021年9月までで最新情報は扱えない
- いい加減な結果が返ってくることがある
- 個人情報や機密情報は入力しない
学習データは2021年9月までで最新情報は扱えない
学習データが2021年まで9月というのは無料で使えるChatGPT3.5だけでなく、有料プランで使えるChatGPT4も同じ。
なので、例えば、上場企業の今の株価を聞くとか、明日の天気を聞くとか、そういうことはこの記事をかいている時点ではできない。
ただ、その点についてはプラグインで対応するケースもあるので、ChatGPTを単独で使う(ChatGPTのサイトにログインしてブラウザから使う)場合には、ということになる。
いい加減な結果が返ってくることがある
また、前述のとおり、いい加減な回答をすることもある。これも注意点のひとつ。
GPT-4にすると大きく改善されている印象だが、完璧ではない。
検索エンジンも結果としては似たような性質はあるので、今までとあまり変わらないといえばそうだろう。
個人情報や機密情報は入力しない
ChatGPTに入力した文章はAIの品質向上のために開発側(OpenAI)に使われる可能性がある。
それを拒否したい場合には、オプトアウト(サービス利用側が拒否すること)する。
現状、こちらのフォームで受け付けている。
そのフォームを読むと分かるが、入力されたデータを使うことがあると書かれていることが分かる。
OpenAIが入力したデータを悪用するとは思わないが、そもそも入力しなければ使うことは不可能であり、利用されることはない。
ということで、当たり前の話だとは思うけれども、ChatGPTには個人情報などは入力しないのが無難というわけだ。
ところで、「オプトアウトなんてしたところで本当に使わないの?」と疑う人もいるかもしれない。
ただ、それを言ってしまうと、MicrosoftやApple、GoogleはパソコンやスマホなどのOSを提供しているわけで、入力される文字はもちろん、取り込まれる写真や動画も見放題だ。
なので、信じるしかないということにはなってしまう。それか使われる覚悟でいるか、個人情報は使わないか。
ChatGPTの具体的な活用例
ChatGPTは実にさまざまな活用例が報告されている。
テキスト処理が基本とはいえ、使い方は多岐にわたる。
- 文章要約
- 文章を要約し、構造化して図示する
- アイデア出し
- 文章の雰囲気を変える
- 短いストーリーをつくる
- 英語学習
- プログラミングのコードを書いてもらう
- メールの作成
個人的には「ゼロから文章考えるの面倒!」というときに下書きしてくれるのがありがたい。
あとはたまに簡単なプログラミングをするので、例を書いてくれるのも助かる(動かないことも多々あるが)。
ただ、使い方にはコツが必要となることがあるので、このあたりは別な記事で深掘りしていく。
まとめ
最後にまとめ。
ChatGPTはLLMという自然言語処理のモデル(人間の使う言葉をコンピュータが扱うためのモデル)から生まれたAI。
確率的に次に来そうな言葉を紡いでいくことで、文章を生み出している。
開発元はOpenAIという非営利組織で、主要な出資先のひとつはMicrosoft(=Bing〈検索エンジン〉やOfficeなどのMS製品に使われる)。
文章に関することならいろいろと使えて便利。
一方、回答がいい加減、最新情報を扱えない、個人情報や機密情報は使わないほうが無難、といった注意点もある。
ChatGPTは気になるけど、まだ使っていないようなら、以下のサイトに行けば無料でも使えるので、この機会にどうぞ。
https://chat.openai.com/
いろいろなサービスに組み込まれてきているので、すでに間接的に使っているかもしれないが。