「AIが自信満々に間違ったことを言ってきた」「存在しない論文を引用された」——生成AIを業務で使い始めると、誰もが一度はこの現象に遭遇します。これがハルシネーションです。
この記事では、ハルシネーションがなぜ起きるのか(4つの原因)、どんなパターンがあるのか(4つの種類)、そしてどう軽減するか(実務での対策)を体系的に解説します。内容は、当スクールが法人研修・オンラインコースで実際に使っている基礎講義(Foundation)をベースにしています。
生成AIの仕組み(次トークン予測)から理解したい方は 生成AIとは?法人の業務自動化ガイド を先に読むのがおすすめです。
この記事でわかること
- ハルシネーションとは何か — 「バグ」ではなく「構造的な特性」
- なぜ起きるのか — 4つの原因
- ハルシネーションの4つの種類と、特に危険な「引用の捏造」
- 軽減策4つとプロンプトでの具体的な対策例
- ハルシネーションとの付き合い方 — 検証・疑問・得意分野の活用
- AIの得意分野・苦手分野の使い分け
ハルシネーションとは — もっともらしいウソ
ハルシネーションとは、LLM(大規模言語モデル)が事実に基づかない情報をもっともらしく生成する現象です。存在しない論文を引用したり、架空の人物のプロフィールを詳細に語ったりします。
重要な前提があります。LLMは「正確さ」を保証しません。どんなに高性能なモデルでも、事実と異なることを自信満々に言うことがあります。これはバグではなく、LLMの構造的な特性です。
人間の脳にたとえると分かりやすいでしょう。私たちも記憶のすき間を「それっぽい情報」で埋めてしまうことがあります。「確かあの映画は2015年公開だったはず」と自信を持って言ったら実は2017年だった——LLMもこれと似ています。学習していない情報や曖昧な情報について聞かれると、「それっぽい」回答を生成してしまうのです。

なぜハルシネーションは起きるのか — 4つの原因
ハルシネーションが発生する主な原因は4つあります。
| 原因 | 内容 |
|---|---|
| 1. 統計的パターンマッチング | LLMが人間と同じ意味で「理解」しているかは研究者の間でも議論が続いています。基本的には「この単語の次にはこの単語が来やすい」という統計的パターンを学習しており、「正しい」かどうかではなく「自然な文章になるか」を基準に生成する傾向があります |
| 2. 訓練データの問題 | インターネット上のデータには誤った情報も含まれます。また、学習後の新しい情報(知識のカットオフ)は知りません |
| 3. 不確実性の表現が不十分 | 初期のLLMには不確実性を表明する訓練が不十分でした。RLHF(人間のフィードバックによる強化学習)等の手法で改善が進んでいますが、それでも「わかりません」と答えるより、何か答えを生成する方向に最適化される傾向が残っています |
| 4. 評価指標の問題 | 「詳細な回答」が良いとされる評価では、不確かでも具体的に答えた方が高評価になりがちです。「わかりません」は低評価になることもあります |

つまり、ハルシネーションは「モデルの欠陥」ではなく、「自然な文章を作る」ことに最適化された仕組みの副産物です。だからモデルの性能が上がっても、ゼロにはなりません。
ハルシネーションの4つの種類
代表的なパターンは4つに分類できます。
| 種類 | 内容 | 例 |
|---|---|---|
| 事実の捏造 | 存在しない事実を作り出す | 「東京タワーは1920年に建設されました」(実際は1958年) |
| 事実の混同 | 別の事実を混ぜてしまう | 「夏目漱石は『こころ』で芥川賞を受賞しました」(芥川賞は漱石の死後に創設) |
| 引用の捏造 | 存在しない論文や書籍を引用 | 「Smith et al. (2023) "AI Ethics Review" によると…」(この論文は存在しない) |
| 自己矛盾 | 自分の回答と矛盾する | 「Aは3つの要素があります: X, Y, Z, W」(3つと言いながら4つ挙げている) |
特に危険なのは「引用の捏造」
4種類の中で最も危険なのが引用の捏造です。
- もっともらしい著者名・年・タイトルを生成する
- もっともらしいDOIやURLまで生成することがある
- 検証しないと本物と区別がつかない
レポートや提案資料にそのまま転記してしまうと、後から「出典が存在しない」ことが発覚し、信頼を大きく損ないます。引用・参照は必ず原典の存在を確認する習慣をつけましょう。
ハルシネーションの軽減策4つ
| 対策 | 内容 |
|---|---|
| 1. RAGを使う | 外部知識を検索して参照させる。出典を明示できる |
| 2. 具体的な質問をする | 曖昧な質問は避け、明確で具体的に聞く |
| 3. Chain of Thought(考えの連鎖) | 「ステップバイステップで」と指示し、推論過程を見せる |
| 4. 検証の習慣 | AIの出力を鵜呑みにせず、必ず検証する |
このうちRAG(検索拡張生成)は、社内文書や信頼できる資料を検索して「見ながら回答」させる仕組みで、出典付きの回答が可能になるため法人利用では特に有効です。仕組みの詳細は RAGとは?仕組み4ステップとベクトルDB で解説しています。
プロンプトでの対策例
不確実性の扱いを指示に明文化するだけでも、ハルシネーション耐性は大きく変わります。教材で使っている対策プロンプトの例です。
以下の質問に答えてください。
重要な指示:
- 確信が持てない場合は「不確かですが」と前置きしてください
- 情報源がない場合は「確認が必要です」と明記してください
- 知らないことは「わかりません」と正直に答えてください
- 推測の場合は「推測ですが」と明示してください
質問: {ユーザーの質問}
こうした指示設計の基本は プロンプトエンジニアリング実践入門 も参考にしてください。
ハルシネーションとの付き合い方
ハルシネーションは「バグ」ではなく「特性」です。なくすことを目指すのではなく、適切に付き合うことが重要です。実践すべき姿勢は3つあります。
- 検証する — 重要な情報は必ず原典を確認する。複数の情報源でクロスチェックする。引用・参照は必ず存在確認する
- 疑問を持つ — 「本当かな?」と常に疑う姿勢を持つ。自信満々な回答ほど要注意。具体的な数字や日付は特に確認する
- 得意分野で活用する — 正確性より創造性が重要な作業(アイデア出し・ブレスト・文章の下書き・推敲)で使う
AIの得意・苦手の使い分け
| 得意(ハルシネーションが問題になりにくい) | 苦手(検証必須) |
|---|---|
| アイデア出し・ブレインストーミング | 具体的な事実・数値・日付 |
| 文章のリライト・校正 | 論文・書籍の引用 |
| コードの雛形生成 | 最新情報(カットオフ後) |
| 要約・構造化 | 専門的な法律・医療知識 |
「自信満々な回答ほど疑う」——これが生成AIを業務で使う側の基本姿勢です。この使い分けを社内ルールとして明文化しておくと、チーム全体で安全に活用できます。チームでまとめて習得したい場合は 法人向けAIエージェント研修 でハンズオン形式の導入が可能です。
よくある質問
Q. ハルシネーションとは何ですか? A. LLM(大規模言語モデル)が事実に基づかない情報をもっともらしく生成する現象です。存在しない論文を引用したり、架空のプロフィールを詳細に語ったりします。重要なのは、これがバグではなくLLMの構造的な特性だという点です。LLMは「正しいか」ではなく「自然な文章になるか」を基準に生成しているため、どんなに高性能なモデルでも完全にはなくなりません。
Q. ハルシネーションはなぜ起きるのですか? A. 主な原因は4つです。第一に、LLMは統計的パターン(この単語の次にはこの単語が来やすい)をもとに「自然さ」を基準に生成していること。第二に、訓練データに誤情報が含まれ、学習後の情報(カットオフ以降)を知らないこと。第三に、「わかりません」と答えるより何かを答える方向に最適化される傾向が残っていること。第四に、評価指標上、不確かでも具体的に答えた方が高評価になりがちなことです。
Q. 一番危険なハルシネーションはどれですか? A. 引用の捏造です。存在しない論文や書籍について、もっともらしい著者名・発行年・タイトル、場合によってはDOIやURLまで生成するため、検証しないと本物と区別がつきません。レポートや提案資料に転記すると後から出典の不存在が発覚し、信頼を損ないます。引用・参照は必ず原典の存在を確認してから使うことを運用ルールにしましょう。
Q. ハルシネーションを減らす方法はありますか? A. 4つの軽減策が有効です。①RAGで外部知識を検索・参照させ、出典付きで回答させる、②曖昧な質問を避けて具体的に聞く、③「ステップバイステップで考えて」と指示して推論過程を見せる(Chain of Thought)、④出力を鵜呑みにせず検証する習慣を持つ。さらにプロンプトに「不確かな場合は『不確かですが』と前置きする」「知らないことは『わかりません』と答える」と明記するだけでも耐性が大きく変わります。
Q. ハルシネーションがあるなら、業務でAIを使うのは危険ではありませんか? A. 使い分ければ問題ありません。アイデア出し・ブレスト・文章の下書きやリライト・要約・コードの雛形生成など、創造性が重要でハルシネーションが問題になりにくい作業では強力に活躍します。一方、具体的な事実・数値・日付、論文の引用、最新情報、専門的な法律・医療判断では検証を必須にします。「得意分野で使い、苦手分野では人間が検証する」という運用設計が業務活用の基本です。
関連記事
- 生成AIとは?法人の業務自動化・AIエージェント活用ガイド
- RAGとは?仕組み4ステップとベクトルDB・活用法
- プロンプトエンジニアリングとは?実践入門
- トークン・コンテキストウィンドウ入門
- 法人向けAIエージェント研修(ハンズオン)
最終確認日: 2026-06-10