# 教育・研修における評価の種類に関する完全ガイド

> 教育・研修における評価の種類について疑問をお持ちですか？形成的評価、総括的評価、診断的評価など、さまざまな評価方法を分かりやすく解説します。

**Author:** Alex Hey  
**Published:** 2026-03-29  
**Categories:** Instructional Designers, L&D Teams

---

教育や研修において、評価はしばしば最終段階、つまり授業が完了した後に行われるものと見なされがちです。しかし、評価は単なる最終チェックポイント以上のものです。学習者の学習方法、指導者の指導方法、そして学習進捗の測定方法に影響を与えるのです。

だからこそ、さまざまな種類の評価方法を理解することが重要なのです。評価方法の中には、学習を促進するために設計されたものもあれば、最終的な理解度を測定するものもあり、また、指導が始まる前に理解のギャップを特定するものもあります。

この完全ガイドでは、教育・研修における主な評価方法とその適切な適用方法について解説します。

## **教育・訓練における評価とは何ですか？**

教育・研修における評価は、学習を測定し支援するために用いられるツールです。評価は、教育者、研修担当者、そして組織が、学習者が何を知っているか、何ができるか、そしてどこを改善する必要があるかを理解するのに役立ちます。

これには、小テスト、課題、プロジェクト、実演、ディスカッション、観察、およびパフォーマンス課題が含まれます。

教育において、評価は教師が指導方法を調整するのに役立ちます。多くの生徒が特定の概念を理解するのに苦労している場合、教師はその概念を改めて教える必要があると認識します。これは、医療、製造、金融、テクノロジーといった、ミスが深刻な結果を招く可能性のある分野では特に重要です。

## **教育・訓練における5種類の評価方法**

様々な評価方法はそれぞれ異なる目的を持っています。これらは互換性のあるものではありません。混同してしまうと、評価はストレスの多いものになり、効果も薄れてしまいます。それぞれの評価方法を明確に解説していきましょう。

### **1. 診断評価**

診断的評価は、指導が始まる前に行われます。その目的は、学習者がすでに何を知っているかを特定し、 [スキルギャップが存在する場所](https://www.coursebox.ai/ja/blog/sukirugiyatupuping-jia)生徒に成績をつけるのではなく、基準値を設定する。

教師はこの情報をもとに、授業計画を調整したり、生徒を適切にグループ分けしたり、基礎概念を再確認したりします。企業研修では、診断チェックによって、従業員が初心者向け指導を必要とするのか、上級者向け指導を必要とするのかを判断します。

早期診断は時間の浪費や長期的な遅れを防ぐため重要です。例えば、全国的な読解力評価では、基礎的なスキルに大きなギャップがあることが明らかになっています。これは特に2022年に顕著でした。 [米国の小学4年生の37％](https://www.nationsreportcard.gov/reading/nation/achievement/) 読解力において、NAEPの「基礎」レベルを下回る成績だった。

_**ソース**: [各国の成績表](https://www.nationsreportcard.gov/reading/nation/achievement/)_

### **2. 形成的評価**

[形成的評価](https://www.coursebox.ai/ja/blog/xing-cheng-de-ping-jia-tozong-gua-de-ping-jia) これは学習のための評価です。学習者がまだ学習している最中に実施されます。この評価の目的は、学習者が間違いを修正し、教師が指導方法を調整するのに役立つ、タイムリーで有益なフィードバックを提供することです。

形成的評価の手法を一貫して用いることで、学習が活発に行われている最中にフィードバックループが閉じられるため、学習効果が向上する。

研究もこのアプローチを支持している。研究によると、効果的な形成的評価の実践は、 [学生の成績](https://www.cambridgeinternational.org/Images/271179-assessment-for-learning.pdf) 標準偏差で0.4～0.7倍の改善が見られた。これは教育研究において大きな進歩とみなされている。

_**ソース**: [ケンブリッジ国際](https://www.cambridgeinternational.org/Images/271179-assessment-for-learning.pdf)_

### **3. 総括的評価**

総括的評価は、コースや単元の最後に実施されます。その目的は、全体的な学習成果を測定することです。一般的な例としては、期末試験、資格試験、学期末プロジェクトなどがあります。

この種の評価は、学習者が設定された学習目標を達成したかどうかを判断するものです。多くの場合、成績、資格認定、昇進の決定に影響を与えます。

総括的評価は、全体的なパフォーマンスと習熟度を把握するためのものです。学習目標が達成されたかどうかを確認するのに役立ち、資格認定、進級決定、またはプログラム評価に利用できます。

### **4. 基準参照型評価**

基準参照型評価とは、学習者の成績を他の学習者と比較する評価方法です。固定された基準に基づいて評価するのではなく、グループ内の個々の学習者を順位付けします。例えば、標準化された大学入学試験では、パーセンタイルがよく用いられます。

学生が85パーセンタイルの成績を収めた場合、それは比較対象グループの85%よりも優れた成績を収めたことを意味します。

実際、最近のSAT試験では、 [受験者の7％](https://www.ontocollege.com/guide-to-the-sat-test/) 1400点以上のスコアを獲得した彼らは、全国的に見ても最高レベルの成績を収めた生徒の一人です。これは、基準参照型評価がいかに集団内における相対的な順位と地位を明確に示すかを示しています。

_**ソース**: [大学へ進学](https://www.ontocollege.com/guide-to-the-sat-test/)_

### **5. 基準参照型評価**

[基準参照型評価](https://www.coursebox.ai/ja/blog/kijun-sansho-shiji) 特定の、事前に定義された学習目標または基準に対するパフォーマンスを測定する

これは、学習者が他者の成績に関係なく、特定の学習目標を達成したかどうかを問うものです。例としては、運転免許試験、資格試験、技能実演など、明確な基準を満たす必要がある場合が挙げられます。

このタイプは習熟度を重視しています。学習者が求められるレベルのパフォーマンスまたは理解度を達成したかどうかという問いに答えるものです。そのため、研修プログラム、資格認定、能力ベースの評価に最適です。

## **正式な評価と非公式な評価**

教育・訓練における評価は、大きく分けて公式評価と非公式評価の2つに分類できる。どちらも重要な役割を果たすが、構造、実施時期、結果の活用方法において違いがある。

以下に、両者の違いを理解するのに役立つ明確な比較を示します。

| 側面 | 正式な評価 | 非公式評価 |
| --- | --- | --- |
| 構造 | 明確なフォーマットで構造化され、事前に計画されている | 柔軟で、しばしば自発的 |
| 目的 | 達成度または習熟度を測定する | 学習中の理解度をモニタリングする |
| 例 | 期末試験、標準テスト、資格試験、および評価対象となるプロジェクト | 授業でのディスカッション、簡単な小テスト、観察、質疑応答 |
| 採点 | 通常は採点され記録される | 正式な採点や記録は行われないことが多い |
| タイミング | 特定の時点（単元、学期、またはプログラムの終了時）で発生します。 | 授業中に継続的に発生する |
| 文書 | 結果は正式に文書化される | 結果は通常、即時フィードバックに使用されます。 |
| 使用事例 | 認証、昇進、コンプライアンス、説明責任 | 指導方法を調整し、リアルタイムで学習を支援する |

_実際には、効果的な教育と訓練は、この両方を組み合わせたものである。非公式な評価は学習の過程を導くのに役立ち、公式な評価は重要な節目における全体的な達成度を確認する。_

## **教育者やトレーナーが一般的に使用する評価方法**

教育者やトレーナーは、学習者に何を実証させたいかに応じて、さまざまな評価方法を用います。以下に、最も一般的に使用されている評価方法をご紹介します。ぜひ試してみてください。

### **1. 筆記試験**

筆記試験は、最も伝統的で広く用いられている評価方法の一つです。試験、エッセイ、短答式問題、構造化された小テストなどが含まれます。この形式は、知識、論理的思考力、思考の明晰さを評価する場合に効果的です。

学術的な環境では、筆記試験で分析的思考力や論理的な議論能力が問われることが多い。職場研修プログラムでは、実務作業の前に、安全手順や規制基準に関する知識を確認するために筆記試験が実施されることがよくある。

大規模な筆記試験は世界的に重要な役割を果たしている。OECDによると、 [69万人の学生](https://www.acer.org/my/news/article/pisa-2022-australian-student-performance-stabilises-while-oecd-average-falls) 2022年のPISA筆記試験には、81カ国が参加しました。この試験では、標準化された筆記課題を用いて、読み書き能力、数学力、科学力といった学力レベルを国際的に比較します。

_**ソース**: [エイサーニュース](https://www.acer.org/my/news/article/pisa-2022-australian-student-performance-stabilises-while-oecd-average-falls)_

### **2. プロジェクトベースの評価**

プロジェクト型評価では、短い回答から長期的な応用へと焦点が移ります。学習者は、計画、調査、創造性、問題解決能力を長期間にわたって必要とする課題に取り組みます。

学生は、個別の質問に答えるのではなく、事業計画書を作成したり、モバイルアプリケーションを開発したりするかもしれません。このプロセスは、草稿作成、修正、結果の発表など、複数の段階を含むことがよくあります。

この方法は、学習者がアイデアを結びつける必要があるため、より深い学習意欲を促します。共同作業はプロジェクトベースの評価に組み込まれることが多く、教科の習熟度を高めるだけでなく、チームワークやコミュニケーション能力の育成にも役立ちます。

### **3. プレゼンテーションに基づく評価**

プレゼンテーション形式の評価は、学習者がアイデアをどれだけ効果的に伝達できるかを評価するものです。この評価では、書面による回答を提出する代わりに、構造化された形式で概念を口頭で説明することが求められます。

これは、ビジネスプログラムにおけるプレゼンテーションで、研究成果の発表や擁護のために頻繁に用いられます。教員養成においては、候補者が指導能力を示すために授業計画を発表することがあります。

平 [リーダーシッププログラム](https://www.coursebox.ai/ja/blog/ridashipputoreningu-to-wa) 多くの場合、参加者に解決策を発表させることで、学習成果を示すことができる。ここで重要な評価要素としては、明瞭さ、構成、自信、そして聴衆の関心度などが挙げられる。

### **4. 実践的な評価**

実技評価では、学習者は自身の技能を身体的または技術的に示すことが求められます。ここでは、学習者は単に手順を説明するだけでなく、実際に技能を披露する必要があります。

その完璧な例の一つは [医療従事者向け研修](https://www.coursebox.ai/ja/blog/herusukeakonpuraiansutoreninguwomasutasurufang-fa)看護学生は、指導監督下で臨床処置を実施する際に評価されることがある。技術教育においては、見習い整備士は、エンジン部品を実際に修理することで評価されることがある。

キャリア教育や技術教育プログラムは、しばしばこの方法に依存している。 [NCESの報告](https://nces.ed.gov/programs/coe/indicator/cha) 2021年には780万人以上の学生が職業技術教育プログラムに登録していた。これらのプログラムの多くは、実践的な評価を用いて能力を検証している。

_**ソース**: [NCES](https://nces.ed.gov/programs/coe/indicator/cha)_

### **5. パフォーマンスに基づく評価**

最後に、最もよく用いられる評価方法は、パフォーマンスベースの評価です。これは、学習者を現実のタスクをシミュレートした現実的なシナリオに置くものです。この評価では、参加者は特定の状況にどのように対応するかを示す必要があります。

具体例としては、緊急対応訓練、ビジネス交渉シミュレーション、法廷模擬裁判、フライトシミュレーター訓練などが挙げられる。これらの評価は、プレッシャーのかかる状況下での判断力、適応力、実践的な実行能力を測定するものである。

この評価方法は最も優れたものの1つであり、シミュレーションで練習したスキルは実際の環境でも応用されやすい。

> **_これらの評価をどう管理すればいいのか分からない？_**
>
> _Courseboxがあなたをサポートします。プロセス全体を簡素化し、 [AIを活用した評価ツール](https://www.coursebox.ai/ja/aikuizuzienereta)教育者やトレーナーは、数分以内に筆記式の小テスト、自由記述式の質問、構造化された評価を作成できます。_

## **適切な評価方法を選択する際に考慮すべき事項**

適切な評価方法を選ぶことは、無作為に行うべきではありません。学習者に示してほしいこと、行ってほしいこと、実証してほしいことに合致している必要があります。以下の要素は、正確で有用な結果が得られる評価方法を決定するのに役立ちます。

### **1. 学習成果**

まず、学習者が何を達成する必要があるのかを明確にすることから始めましょう。

_あなたは理解力、スキルの応用力、批判的思考力、それとも事実の記憶力を測定しているのですか？_

深い理解と知識の伝達を目的とする場合は、説明や問題解決を必要とする評価方法が最適です。基本的な知識の想起であれば、短い小テストでも問題ないでしょう。評価方法の選択は、常に学習成果に基づいて行うべきです。

### **2. 学習レベル**

学習者の習熟度と経験は重要です。初心者には、基礎知識を確認するためのシンプルで支援的な評価が必要かもしれませんが、上級者には、複雑な応用問題や問題解決型の評価で挑戦させるべきです。

初期段階で難しすぎる評価は学習者の意欲を削ぎ、後になって簡単すぎる評価は学習者の能力を伸ばすことができない。

例えば、新人看護師は基本的な安全スキルについて評価される一方、経験豊富な看護師は複雑な患者事例について評価される場合がある。

### **3. クラスの人数**

_あなたは何人の学習者を評価していますか？_

大人数のグループでは、多肢選択式テストや [自動採点ツール](https://www.coursebox.ai/ja/blog/zui-gao-nozi-dong-cai-dian-sisutemu) 最も効果的です。少人数のクラスや研修では、詳細なレポート作成、プレゼンテーション、パフォーマンス評価など、より柔軟な対応が可能です。

大規模なオンライン学習環境においては、自動評価ツールは洞察力を損なうことなく効率性を向上させることができる。

### **4. コンプライアンス要件**

特定の分野では、法律や安全基準に基づき、特別な評価が義務付けられています。医療、航空、金融、技術職などでは、多くの場合、能力評価が必須となっています。これらの評価は通常、基準参照型であり、学習者は事前に定められた基準を満たす必要があります。

例えば、医療分野の専門家は、免許や資格を維持するために、標準化された試験に合格しなければならないことが多い。

### **5. 利用可能な時間とリソース**

評価は、実施、採点、解釈に時間がかかる。

パフォーマンスポートフォリオやプロジェクトなど、一部の評価方法は、講師の時間とフィードバックをより多く必要とします。一方、オンラインの多肢選択式クイズのような評価方法は、最小限の手間で済みます。

利用可能な時間を評価することで、実用的で持続可能な方法を選択することができます。

## **評価作成をより効果的にする**

適切な評価方法を選ぶことは、最初のステップに過ぎません。評価方法を設計し、一貫性のある採点を行い、すべてを整理整頓しておくことこそ、多くの教育者やトレーナーが途方に暮れてしまう部分なのです。

しかし、もうそんな心配は無用です。体系的な評価の作成に苦労しているなら、Courseboxがお役に立ちます。

それは [AIクイズジェネレーター](https://www.coursebox.ai/ja/aikuizuzienereta) 数秒で自由回答形式の質問を作成できます。 [AIを活用した採点システム](https://www.coursebox.ai/ja/ai-grading) これは、あなたの採点基準に基づいて回答を評価し、手作業の負担を軽減します。

_[Courseboxを今すぐ無料でお試しください](https://www.coursebox.ai/ja/)!_

## **よくある質問**