AI用語解説(和文・英文索引)

AI用語解説(和文・英文索引),アイキャッチ

ニュースや仕事でよく耳にするAIの言葉を、むずかしい表現を避けてわかりやすい説明を心がけました。和文・英数字索引から調べたい用語を探せますので、学習や業務での理解を深める際にご活用ください。

和文索引

ア行

アウトプットインジケーター

AIが学習や処理を行った結果を数値や指標として表すもの。モデルの性能を評価するときに使われる。たとえば「正答率」「誤差率」などがこれにあたる。

アクセシビリティ

障害の有無や環境にかかわらず、誰もがサービスを利用できるようにする考え方。AI分野では、音声読み上げや画像生成による支援など、利用者の多様性を支える要素として重要視されている。

アルゴリズム

問題を解決するための手順や計算方法。AIでは「どうやってデータから学ぶか」を決める仕組みのこと。レシピが料理の手順を示すように、アルゴリズムはAIにとってのレシピにあたる。

意匠権

デザインや形状を保護する法律上の権利。AIが自動生成した画像や製品デザインにも適用できるかが議論されている。AI技術そのものではなく、生成物と社会のルールを結びつける用語。

インストラクション

AIへの「指示」や「命令文」。特に生成AIでは「こういう答えを出して」と指定するテキストのことを指し、プロンプト(入力文)の一部として扱われる。

インターネットリテラシー

インターネットを安全・適切に利用するための知識や態度。AIが生成した情報を正しく理解・判断するためにも欠かせない基礎力。

インプットデータ

AIに学習させるために与える入力データ。大量の文章や画像、音声などがこれにあたり、AIの性能や出力の質は、このデータに大きく左右される。

ヴァーナー・ヴィンジ

アメリカのSF作家で、AIが人間の知能を超える未来を「技術的特異点(シンギュラリティ)」として語った人物。AI研究の社会的議論に影響を与えた。

営業秘密

企業が外部に知られないよう管理している技術やノウハウ。AIによる自動生成や解析が進む中で、情報漏洩や不正利用と関連して注目される分野。

エキスパートシステム

人間の専門家の知識をルールとして組み込み、判断を行うAIの一種。1980年代の「第二次AIブーム」を代表する技術で、現在のディープラーニングとは異なるアプローチ。

エンターテイメント

AIが活用される分野のひとつ。ゲームのNPC、映画の脚本生成、音楽やイラストの自動制作などが進んでおり、人間とAIの共創領域として注目されている。

オーバーフィッティング

AIが学習データを“覚えすぎる”ことで、新しいデータに対応できなくなる現象。練習問題は完璧でも模試に弱い受験生に例えられる。

オムニモーダルモデル

テキスト・画像・音声・動画といった複数の情報形式を同時に扱うAIモデル。従来のマルチモーダルより広範囲で、人間のように多様な情報を総合して理解・生成できるのが特徴。

重み

ニューラルネットワークにおける計算パラメータ。入力データがどのくらい重要かを数値で表し、学習によって少しずつ最適化される。

重み付け

データや特徴に対して、影響度を調整すること。AIの学習過程では、誤差を減らすために「重み」が自動で調整されていく。

音楽生成AI

メロディや伴奏を自動で作曲するAI。学習した音楽データをもとに新しい曲を生成し、作曲支援やBGM制作などで活用されている。

音声生成AI

文字データから自然な音声を合成するAI。ナビゲーション音声や読み上げ機能、キャラクターの声の自動生成など、幅広い応用がある。

カ行

回帰型ニューラルネットワーク

英語では「Recurrent Neural Network(RNN)」。文章や音声のように「順番に意味があるデータ」を扱うのが得意なAIモデル。過去の情報を記憶しながら次を予測できるため、翻訳や音声認識などに広く使われてきた。

過学習

AIが学習用データを丸暗記してしまい、新しいデータに弱くなる現象。研究では「汎化性能の低下」と表現される。オーバーフィッティングとも呼ばれ、AI研究の基本課題のひとつ。

各種の生成AI

文章・画像・音楽・動画など、さまざまな分野で用いられる生成AIの総称。ChatGPTのようなテキスト生成から、イラストや作曲まで幅広い。

画像生成AI

テキストや写真をもとに、新しい画像を作るAI。Stable DiffusionやDALL·Eが代表例。広告やデザイン支援、漫画の原案づくりなどに活用されている。

サ行

識別器

AIが「これはAかBか」を見分けるための仕組み。たとえば「猫か犬か」を分類するモデル。生成AIの世界では、識別器が生成結果を判定し、生成器と競い合う形でGANが学習する。

次元削減

大量の特徴量(データの説明要素)を、情報をできるだけ失わずに少ない次元に圧縮する方法。データを見やすくしたり、計算を軽くするために使われる。例えるなら、立体的な地図を上からの2D図に描き直すイメージ。

自己回帰モデル

過去の出力を次の入力として利用し、順番に予測をつなげていくモデル。文章を一語ずつ生成していく言語モデルなどが代表例で、ChatGPTの仕組みにも関わっている。

自己注意力

文章や画像の中で「どの部分が重要か」をAI自身が見極める仕組み。Transformerの中心技術であり、単語同士の関係を的確に捉えることができる。

自然言語処理

人間が使う自然な言葉(日本語や英語)をコンピュータに理解させる技術。翻訳、検索、要約、感情分析など幅広い応用がある。

自然言語処理タスク

自然言語処理が扱う具体的な課題のこと。文章分類、機械翻訳、質問応答、要約など、多岐にわたる。

自然言語生成

コンピュータが人間らしい文章を生み出す技術。ChatGPTはその代表例で、文章のつながりや文脈を考えながら文を作ることができる。

質問応答

ユーザーが入力した質問に対して、AIが適切な答えを返す仕組み。検索エンジンやチャットボットに応用されており、生成AIの進化で精度が大きく向上した。

シナプス

脳の神経細胞同士の接続部分。AI研究では「人工ニューロンをつなぐ仕組み」として例えられる。シナプスの概念をまねてニューラルネットワークが設計された。

出力指示

AIに「どういう形式で答えてほしいか」を伝える指示。たとえば「箇条書きでまとめて」「専門用語を使わずに説明して」といった注文。プロンプト設計の重要要素。

商標権

商品名やロゴマークを保護する権利。AIが自動生成した名称やロゴが既存商標と重なる場合、権利侵害になる可能性があり、法的に注目されている。

情報リテラシー

情報を正しく読み解き、活用する力。AIが生み出したコンテンツを信じるかどうか判断するために不可欠なスキル。

シンギュラリティ

AIが人間の知能を超え、社会や文明に大きな変化をもたらすとされる「技術的特異点」。ヴァーナー・ヴィンジやレイ・カーツワイルらが提唱し、未来予測の議論でよく登場する。

人工知能

人間の知的な働きをコンピュータで再現しようとする技術・研究分野の総称。学習、推論、認識、生成といった能力を持つ。

人工ニューロン

脳の神経細胞をまねて作られた計算単位。多数を組み合わせることでニューラルネットワークを形成し、AIの学習を支えている。

深層学習

ニューラルネットワークを多層にした学習手法。ディープラーニングとも呼ばれ、画像認識や音声認識などAIの飛躍的な進化を可能にした。

深層偽造

ディープフェイクとも呼ばれる、AIを使った偽動画や偽音声の生成技術。芸能人の顔を合成した動画などが例で、悪用のリスクが問題視されている。

スピアフィッシング

標的型の詐欺メール攻撃。個人や企業を狙い撃ちにして信頼関係を装い、情報を盗み出す。AIが偽メールを自動生成するリスクも高まっている。

制限付きボルツマンマシン

確率的に学習を行うニューラルネットワークの一種。2000年代に深層学習の基礎として注目されたが、現在はTransformer系モデルに主役の座を譲っている。

生成AIと個人情報保護

生成AIが扱うデータに個人情報が含まれる場合、その取り扱いと保護が重要になる。匿名加工や利用制限などが議論されている。

生成AIのデメリット

誤情報の生成、著作権侵害の懸念、倫理的リスクなど。AIの便利さの裏側として社会が直面している課題。

生成AIのメリット

効率的な文章や画像の作成、業務の自動化、創作支援など。専門知識がなくても高度な表現が可能になる点が大きい。

生成AIによる生成物と意匠権

AIが作ったデザインが法律上「意匠」として保護されるかどうかの議論。創作者がAIか人間かが法的に争点になる。

生成AIによる生成物と肖像権

AIが人物の顔を模倣・生成する場合、その人の肖像権を侵害する恐れがある。ディープフェイクが典型例。

生成AIによる生成物と商標権

AIが自動生成したロゴやブランド名が既存の商標と衝突する可能性。知財分野の新たな課題。

生成AIによる生成物と著作権

AI生成物に「著作権」が認められるかどうかは世界的に議論中。多くの国では「人間が創作したものに限る」とされ、AI単独の生成物には著作権が与えられないケースが多い。

生成AIによる生成物と特許権

AIが考案した技術やアイデアに特許権を認めるかどうか。特許制度は「発明者=人間」という前提で設計されており、AI発明をどう扱うかは未解決の問題。

タ行

ダートマス会議

1956年にアメリカ・ダートマス大学で開かれた研究会。ここで「人工知能(AI)」という言葉が初めて提案され、AI研究の出発点となった歴史的な出来事。

第一次AIブーム

1950年代後半〜1960年代にかけてのAI研究の盛り上がり。単純な推論やゲーム(チェスなど)が可能になり「AIはすぐに人間を超える」と期待された時期。ただし計算資源やデータが不足し、すぐに停滞した。

第二次AIブーム

1980年代のエキスパートシステムを中心とした時代。人間の知識をルールとして組み込み、専門的判断を行えるようにしたが、開発コストやメンテナンスが膨大になり限界を迎えた。

第三次AIブーム

2010年代に始まったディープラーニングの台頭によるAIの大進化。画像認識や音声認識の精度が飛躍的に向上し、現在のChatGPTのような大規模モデルにつながっている。

畳み込みニューラルネットワーク

英語では「Convolutional Neural Network(CNN)」。画像処理に強いAIモデルで、写真の中から顔を認識したり、物体を分類したりできる。スマホの顔認証など身近な応用も多い。

知的財産権

発明・デザイン・著作物など、創作活動から生まれた成果を守る権利の総称。AIが生み出した生成物をどう扱うかが大きな社会的論点になっている。

知的財産権の種類

著作権、特許権、意匠権、商標権などの分類。生成AIの普及によって、これら従来の法律がどこまでAI生成物に適用されるかが問題視されている。

長期記憶

AIにおける記憶の仕組みのひとつ。従来のモデルは「短期的に文脈を覚える」だけだったが、長期記憶を持たせる研究も進んでいる。人間が過去の経験を長く覚えているのと似た発想。

著作権

小説・音楽・映像などの創作物を守る権利。AI生成物が「著作物」といえるかどうか、そして学習データとして既存作品を利用することが合法かどうかが議論されている。

ディープフェイク

AIによって作られる偽の映像や音声。たとえば「実在しない人物が話している動画」を生成できる。エンタメや研究には使える一方、なりすまし詐欺や偽ニュースへの悪用が懸念される。

ディープラーニング

多層のニューラルネットワークを使った学習方法。AIブームを再加速させた立役者であり、画像認識・音声認識・翻訳・文章生成など幅広く利用されている。

ディスインフォメーション

意図的に流される虚偽情報。AIが生成した偽ニュース記事や改ざん画像もディスインフォメーションの一種とされる。

データセット

AIの学習に使う大量のデータのまとまり。AIの性能はデータセットの質と量に強く依存するため、どんなデータを集めるかが研究の鍵になる。

テキスト生成AI

文章を自動で作るAI。ChatGPTやClaudeなどが代表例で、ニュース記事の要約、キャッチコピー作成、シナリオ生成などに使われている。

テキスト契約

契約書を文章データとして処理し、AIが解析・自動生成する取り組み。法務分野で業務効率化を進める活用事例のひとつ。

敵対的生成ネットワーク

英語では「GAN(Generative Adversarial Network)」。生成器と識別器という2つのAIを競わせることで、高精度な画像や音声を生み出す手法。画像生成AIの基盤技術のひとつ。

デコーダー

入力を理解して出力に変換する部分の仕組み。翻訳AIやTransformerモデルの一部として使われる。逆に「エンコーダー」は入力を内部表現に変える役割を持つ。

デジタル市民権

デジタル社会で市民が持つべき権利や責任を示す考え方。AIやインターネットを正しく使いこなすことも、この市民権の一部とされる。

特徴学習

AIがデータの重要な特徴を自動的に見つけ出すこと。従来は人間が「何を学習させるか」を選んでいたが、ディープラーニングではAI自身が特徴を抽出できるようになった。

動画生成AI

テキストや画像から動画を生成するAI。静止画を動かしたり、新しい映像を作るなどの研究が進んでおり、広告・映画制作にも応用が期待される。

匿名加工情報

個人が特定されないように加工されたデータ。AIが学習するとき、個人情報を直接含まない形にしてプライバシーを守る仕組みとして使われる。

特許権

発明を守る法律上の権利。AIが発明した技術に特許を与えるべきかどうかが国際的に議論されている。

ドロップアウト

ニューラルネットワークの学習で、ランダムに一部のノードを無効にする手法。過学習を防ぎ、モデルの汎化性能を高めるためによく用いられる。

ナ行

偽情報

事実とは異なる情報のこと。意図的に広められるものは「ディスインフォメーション」と呼ばれる。AIが自動生成した文章や画像が誤解を生むケースも増えており、情報の真偽を見極める力が求められている。

ニューラルネットワーク

人間の脳の神経細胞(ニューロン)の仕組みを模した計算モデル。多数の人工ニューロンを層状に結びつけて、データからパターンを学習する。ディープラーニングの基盤技術であり、現代AIの中心的な仕組み。

人間中心のAI社会原則

日本政府などが掲げる、AIの開発・利用において人間の尊厳や社会の利益を最優先にする考え方。公平性・説明責任・プライバシー保護など、倫理的なガイドラインの柱となっている。

ノード

ニューラルネットワークを構成する基本単位で、入力を受け取り計算を行い、次に伝える役割を担う。人工ニューロンとほぼ同義。たくさんのノードがつながることで複雑な学習が可能になる。

ノーフリーランチ定理

「どんな問題にも万能に対応できる学習アルゴリズムは存在しない」という定理。つまり、AIの手法は課題ごとに最適なものを選ぶ必要がある、ということを示している。

ハ行

ハイパーパラメータ

AIモデルの学習に関わる設定値のこと。学習率や層の数、バッチサイズなど、人間があらかじめ決める必要がある。料理でいえば「火加減」や「調味料の分量」のようなもので、結果に大きく影響する。

パブリシティ権

有名人や個人が、自分の名前や顔、声といった「商業的価値」を守る権利。AIが人物の画像や音声を生成する場合、この権利を侵害する恐れがある。

パラメータ

ニューラルネットワーク内部で学習される数値。入力の重要度を表す「重み」などが該当する。ChatGPTのような大規模モデルは数千億単位のパラメータを持っている。

ハルシネーション

生成AIがもっともらしいが事実ではない答えを出す現象。例えば「存在しない論文を引用する」といったケース。モデルの仕組みによる限界であり、研究者や利用者の課題になっている。

半教師あり学習

データの一部だけに正解ラベルが付いていて、残りはラベルなしという状況で学習させる方法。ラベル付きデータを減らせるため、コスト削減や効率化に役立つ。

ピクセル

画像を構成する最小単位の点。AIが画像を処理するときは、このピクセルのパターンを解析して特徴を抽出する。

ファインチューニング

すでに学習済みのモデルを、特定の目的やデータに合わせて追加学習する手法。たとえば汎用AIに医療データを与えて「医療相談に特化したAI」にするような使い方。

フィッシング詐欺

実在の企業やサービスを装い、パスワードやクレジット情報を盗み出す手口。AIで本物そっくりのメールや偽サイトが簡単に作れるようになり、リスクが増している。

不正競争の類型

競争相手を不当に害する行為のパターン。営業秘密の持ち出し、商品表示の模倣など。AI生成物がこれに該当するかどうかが新しい論点になっている。

不正競争防止法

不正な競争行為を取り締まる日本の法律。生成AIが作ったコンテンツを悪用した場合、この法律が適用される可能性がある。

マ行

マルウェア

コンピュータに害を与える目的で作られた不正プログラムの総称。ウイルスやスパイウェア、ランサムウェアなども含む。AIそのものの仕組みとは直接関係ないが、AI技術を使って検出したり、逆にマルウェア生成に悪用されたりする可能性がある。

マルウェア対策

マルウェアの侵入や被害を防ぐための取り組み。ウイルス対策ソフトやファイアウォールに加えて、最近ではAIを利用した不審な動作の検知も行われている。

マルチモーダル

テキスト・画像・音声など複数の種類のデータを同時に扱うAI。たとえば「写真を見て、その説明文を作る」といった処理が可能。ChatGPTやClaudeの最新モデルでも、この方向に進化している。

命令

AIに与える指示のこと。プロンプト(入力文)の形で与える場合が多い。「要約して」「専門用語を使わずに説明して」といった命令によって、AIの出力が変わる。

ヤ行

要配慮個人情報

人種、信条、病歴、犯罪歴など、特にデリケートで取扱いに注意が必要な個人情報のこと。AIが学習や出力に使う場合、誤用や漏洩が大きな人権侵害につながるため、法的にも厳しく規制されている。

ラ行

ランサムウェア

感染したPCやサーバーのデータを暗号化し、「元に戻したければ金を払え」と脅迫するマルウェアの一種。AI自体の仕組みではないが、セキュリティ分野でAIが攻撃検知や対策に活用されている。

ルールベース

人間があらかじめ定めた「もしAならB」という規則に従って動くAIの仕組み。第二次AIブームの中心だったエキスパートシステムが代表例。現代のディープラーニングとは対照的に、知識の更新や柔軟性が課題となった。

レイ・カーツワイル

アメリカの発明家・未来学者。AIの進化によって2045年頃にシンギュラリティ(技術的特異点)が到来すると予測したことで有名。AI研究の未来像を語る上で欠かせない人物。

ワ行

脆弱性

コンピュータやソフトウェアに存在するセキュリティ上の弱点。AIシステムにも脆弱性があり、攻撃者に悪用されると不正アクセスや情報漏洩につながる。

プライバシー

個人の生活や情報を他人に勝手に利用されない権利。AIが収集・分析するデータには個人情報が含まれることが多く、プライバシーの尊重が重要になる。

プライバシー設定

SNSやアプリで、自分の情報をどこまで公開するかを決める仕組み。AIサービスを利用する際にも、自分のデータが学習に使われるかどうかを確認することが大切。

プライバシー保護

個人情報や利用履歴を適切に扱い、利用者の権利を守る取り組み。AIの開発・運用では、匿名化や暗号化などの技術的対策と、法律や倫理の両面からの配慮が求められる。

ブラックメール

脅迫や恐喝を目的としたメールのこと。AIで自然な文章を生成できるようになったため、本物らしい脅迫メールが自動で作られるリスクが増大している。

プレテキスト

ソーシャルエンジニアリング攻撃の一種。虚偽の理由(プレテキスト)を使って相手をだまし、情報を引き出す手口。AIによるなりすましにも応用される懸念がある。

プレトレーニング

大規模なデータを使って、AIモデルを事前に学習させること。ChatGPTのような生成AIはこの工程を経て、一般的な知識を獲得している。その後に特定分野向けの追加学習(ファインチューニング)が行われる。

プロンプティング

AIに「どう答えてほしいか」を指示するテクニック。質問の仕方や指示の工夫によって、出力の質が大きく変わる。生成AIを活用するうえで利用者が身につけたいスキルのひとつ。

プロンプト

AIに与える入力文や指示文そのもの。ChatGPTの場合、ユーザーが入力するテキストがプロンプトにあたる。「要約して」「物語風に書いて」などが例。

文書生成

AIが文章を自動で作ること。ニュース記事、広告コピー、小説の一部など、人間の書く作業を支援する形で使われている。

文書分類

大量のテキストをテーマごとに仕分ける技術。スパムメールの判定やレビューの自動分類などに使われている。

文脈

言葉や文章の前後関係のこと。AIが文脈を理解することで、適切で自然な返答や翻訳が可能になる。

ベイト攻撃

「おとり」を使った攻撃手法。たとえば、感染ファイルをUSBメモリに偽装して置き、それを拾った人がPCに差し込むことで被害を受ける。AIが直接関わるわけではないが、セキュリティの脅威として理解が必要。

英数字索引(A〜Z行)

A行

AGI

「Artificial General Intelligence(汎用人工知能)」の略。特定の作業に限らず、人間のように幅広い知識や能力を発揮できるAIを指す。現行のAIはまだ「特化型(Narrow AI)」にとどまっている。

AI

「人工知能(Artificial Intelligence)」の略称。人間の知的活動をコンピュータで模倣・再現しようとする技術や研究分野を指す。

AIガイドライン

AIの開発・利用において守るべき原則をまとめた指針。日本やEUなど各国で定められており、公平性・透明性・プライバシー保護といったテーマが盛り込まれる。

AI効果

「AIと呼ばれているものが実現されると、それはAIではないとみなされがち」という現象。たとえば、昔はAIとされたチェスプログラムも、今では単なるソフトとして扱われる。

AI社会原則

日本政府が定めたAI利用のための基本原則。人間中心、プライバシー尊重、説明責任、公平性などを掲げ、社会にAIを受け入れる枠組みを示している。

AI生成物と不正競争防止法

AIが作り出した文章や画像が、営業秘密の不正利用や混同を招く場合、不正競争防止法が適用され得る。新しい法律解釈が必要とされる領域。

AIと社会との関係

AIの発展が雇用、教育、倫理など社会に与える影響を考える視点。利便性とリスクをどう両立するかが議論の焦点になっている。

AIとロボットの相違

AIは「知能」に関する技術、ロボットは「身体」を持つ機械。AIを搭載したロボットもあるが、両者は必ずしも同じではない。

AIとロボットの連携

ロボットにAIを組み込むことで、自律的な動作や高度な判断が可能になる。工場の自動化や介護ロボットなどがその例。

AIの活用分野

医療、教育、金融、エンタメなど、幅広い領域で応用が進んでいる。生成AIは特にコンテンツ制作や業務効率化で注目を集めている。

AIのデメリット

誤情報の拡散、偏見の助長、著作権侵害、雇用への影響など。便利さと同時に社会的課題も抱えている。

AIの利益に関するルール

AIによって得られる利益を誰が享受するかをめぐるルール。学習データの提供者や開発者、利用者の間での配分が議論されている。

AIのレベル分類

AIの発展段階を示す考え方。特化型AI(Narrow AI)、汎用AI(AGI)、超知能(ASI)の3段階に分けられることが多い。

ALBERT

「A Lite BERT」の略で、Googleが開発した軽量化版BERTモデル。パラメータ共有や次文予測タスク削除などで効率化を図り、性能を維持しつつ計算資源を削減した。

A Lite BERT

ALBERTの正式名称。BERTを小型化したモデルのこと。

ANI

「Artificial Narrow Intelligence(特化型人工知能)」の略。翻訳や画像認識のように、特定の作業だけを得意とするAIを指す。現在のAIはほとんどがこの段階にある。

B行

BERTモデル

Googleが2018年に発表した自然言語処理モデル。Transformer構造を利用し、文脈を双方向に理解できるのが特徴。検索や翻訳などに広く応用されている。

C行

ChatGPT

OpenAIが開発した対話型AI。大規模言語モデルを基盤に、人間らしい文章を理解・生成できる。質問応答や文章作成、プログラミング支援など多用途に使われている。

Claude

Anthropic社が開発した対話型AI。安全性や倫理面に配慮した設計が特徴で、長文処理や精度の高さからChatGPTと並んで注目されている。

CNN

「Convolutional Neural Network(畳み込みニューラルネットワーク)」の略。画像認識を得意とするモデルで、顔認証や自動運転のカメラ解析に使われる。

Code Interpreter

ChatGPTに搭載されている機能のひとつで、コードを実行して計算やデータ分析を行う。プログラミング知識がなくても高度な処理を依頼できる。

Context

文脈や前後関係を意味する。AIが文脈を正しく捉えることで、より自然で適切な応答が可能になる。

F行

Few-Shotプロンプティング

少数の例を与えてAIに学習させる指示方法。たとえば「この質問にはこう答える」という例を2〜3個見せてから本題を投げると、AIの出力が安定しやすい。大量のデータが不要な点がメリット。

G行

GAN

「Generative Adversarial Network(敵対的生成ネットワーク)」の略。生成器と識別器という2つのAIを競わせることで、リアルな画像や音声を生み出す仕組み。ディープフェイクや画像生成AIの基盤技術。

Gemini

Googleが開発している大規模AIモデル群。言語理解・推論・マルチモーダル処理に強みを持ち、ChatGPTやClaudeと並ぶ最新世代のモデルとされている。

GPTモデル

「Generative Pre-trained Transformer」の略。Transformer構造を基盤とし、大量のテキストを事前学習した上で自然な文章を生成できる。ChatGPTの核となる仕組み。

GPT-1

OpenAIが2018年に発表した初代GPTモデル。大規模言語モデルの概念を提示したが、性能は限定的だった。

GPT-2

2019年に公開されたGPTシリーズの第2世代。文章生成の自然さが大きく進歩し、「偽ニュースを量産できるのでは」と懸念され公開が段階的に行われた。

GPT-3

2020年に発表された第3世代GPT。1750億のパラメータを持ち、少数の例を与えるだけで多様なタスクに対応できる「Few-Shot学習」が実現した。

GPT-3.5

GPT-3を改良したモデルで、ChatGPTの初期バージョンに搭載。会話の自然さが向上し、広く一般に使われるきっかけとなった。

GPT-4

2023年に登場した第4世代モデル。推論力・安全性・多言語対応が大幅に強化され、複雑な課題解決に対応可能になった。

GPT-4o

OpenAIが発表したマルチモーダル対応モデル。テキストだけでなく音声や画像も統合的に扱え、リアルタイム対話にも対応する。

GPTs

ChatGPT内でユーザーが独自に作れる「カスタムAIアシスタント」のこと。特定の指示や知識を組み込み、自分専用のGPTを構築できる。

I行

Input Data

AIに学習させる入力データのこと。テキスト・画像・音声などが含まれる。AIの性能はこのデータの質と量に大きく左右されるため「どんなデータを食べさせるか」が極めて重要。

InstructGPT

OpenAIが開発した、指示(インストラクション)に従って出力するよう訓練されたモデル。人間のフィードバックを使って調整され、後のChatGPTに大きくつながった。

Instruction

AIに与える命令や指示文のこと。単なる質問ではなく「要約して」「例を交えて説明して」といった形で与えることで、出力の方向性をコントロールできる。

L行

LLM

「Large Language Model(大規模言語モデル)」の略。大量のテキストを学習し、自然な文章を理解・生成できるAI。GPTやClaude、Geminiなどが代表例。

LSTM

「Long Short-Term Memory(長短期記憶)」の略。RNNの改良型で、長い文章の文脈を覚えるのが得意。翻訳や音声認識などで広く使われた。Transformer登場以前の主流手法。

M行

Malware

不正な目的で作られたソフトウェアの総称。ウイルスやスパイウェアを含む。AIはその検知や防御に活用される一方、攻撃側に悪用されるリスクもある。

Masked Language Model

BERTの学習方法のひとつ。文章中の単語を一部マスク(隠す)して、AIに「何が入るか」を当てさせる。これにより文脈理解の力が身につく。

MIDIファイル

音楽データを記録する形式のひとつ。AIによる音楽生成では、MIDIを扱うことで楽譜のようにメロディやリズムを生成・編集できる。

MLM

「Masked Language Model」の略称。BERT系列の学習方式を指す。

N行

Next Sentence Prediction

次の文が前の文に続くかどうかを判定するタスク。BERTの学習で用いられ、文脈を理解する力を養うために使われた。

NLP

「Natural Language Processing(自然言語処理)」の略。人間の言葉を理解・処理するAI技術。翻訳、要約、質問応答などの幅広い応用を支えている。

NSP

「Next Sentence Prediction」の略。BERTの学習に使われたタスクで、ある文の後に別の文が自然につながるかどうかを判定する。文と文の関係を理解する力を強化する役割を持っていた。

O行

Output Indicator

AIの出力結果を示す指標のこと。正答率や精度、損失関数の値など、AIがどれだけうまく動いているかを数値で表す。モデルの性能評価に欠かせない。

Q行

QRコード

二次元バーコードの一種。AIとは直接関係ないが、画像認識技術で読み取られることが多い。近年ではAIを使ってQRコードのデザインを生成する試みもある。

R行

Reinforcement Learning from Human Feedback

略して RLHF。人間の評価をフィードバックとして取り入れ、AIを望ましい出力に近づける学習手法。ChatGPTの性能を大きく高めた技術として知られる。

RLHF

「Reinforcement Learning from Human Feedback」の略。人間が「良い答え・悪い答え」を評価し、その結果を強化学習に利用する方法。AIをより人間に合わせる訓練法。

RNN

「Recurrent Neural Network(回帰型ニューラルネットワーク)」の略。文章や音声など時系列データを扱うのに適したモデル。LSTMなどの発展系がある。

RoBERTa

Facebook(現Meta)が開発した自然言語処理モデル。BERTを改良し、学習データ量や時間を増やして性能を大幅に向上させた。文章理解タスクで高精度を示す。

S行

Self-Attention

文章やデータの中で「どの部分が重要か」をAIが自分で判断する仕組み。Transformerの中心技術で、単語同士の関係性を的確にとらえることができる。これにより長文の理解や自然な翻訳が可能になった。

T行

Temperature

生成AIが文章を作る際の「ランダムさ」を調整するパラメータ。数値が低いと答えが安定して無難になり、高いと多様で意外性のある答えが出やすい。

Top-p

生成AIの出力を調整する仕組みのひとつ。「確率の高い単語から順に足し合わせてp(例:0.9)を超えるまで候補を選ぶ」という方法で、出力の多様性を制御する。

Transformerモデル

2017年にGoogleが発表したモデル構造。Self-Attentionを使い、従来のRNNより効率的に文脈を理解できる。BERTやGPTをはじめ、現在の大規模言語モデルの土台になっている。

Transformerモデル以降の派生モデル

BERT、GPT、RoBERTa、ALBERTなど、Transformerをベースにした多様な派生モデル。自然言語処理の性能を飛躍的に向上させ、AI研究の主流となった。

V行

VAE

「Variational Autoencoder(変分オートエンコーダ)」の略。データを圧縮しつつ新しいデータを生成できるモデル。画像生成などで使われ、GANと並ぶ生成モデルのひとつ。

W行

Wi-Fi

無線通信規格のひとつ。AIそのものとは直接関係ないが、AI機能を使う端末やIoT機器の通信基盤として欠かせない存在。

Z行

Zero-Shotプロンプティング

例をひとつも与えずにAIにタスクをやらせる方法。「この文章を英語に翻訳して」と直接指示するだけでAIが対応できるのは、大規模言語モデルの力によるもの。

数字索引

2045年問題

未来学者レイ・カーツワイルらが提唱した予測で、2045年頃にAIが人間の知能を超え、社会が大きく変わるとされるシナリオ。シンギュラリティ(技術的特異点)の代表的な年としてよく言及される。

関連記事