reference

適性検査用語集:採用担当が使うすべての用語

適性検査ベンダーはそれぞれ独自の語彙を発明または採用しており、使用される用語はベンダー間でほとんど正確に対応しません。このグロッサリーはベンダーのドキュメント、雇用主のメール、フォームの議論で目にする用語を、統計学者ではなく受験者のために書いたものです。用語が見当たらない場合は、おそらく単一ベンダー固有のものであり、一般的な準備のために暗記する価値はありません。

By Junaid Khalid, updated 2026-04-18

Key takeaways

  • パーセンタイルは適性検査で最も重要な言葉です。
  • 速度テストと能力テストは正反対の戦略を要求します。
  • 妥当性はテストがパフォーマンスをどれだけうまく予測するかを測ります。
  • 信頼性はテストが試行間でどれだけ一貫しているかを測ります。
  • 適応型テストは難易度を調整します。静的テストは調整しません。

適応型テスト

適応型テストは前の問題への回答に基づいて次の問題の難易度を調整します。正解すると次の問題は難しくなります。不正解だと次の問題は易しくなります。SHL Verify InteractiveとTalent Q Elementsは採用における最も有名な適応型テストです。

適応型テストは静的テストよりも早くあなたの能力レベルに収束し、通常20から30問以内です。また戦略的な計算も変えます。スキップや空白は通常不正解として扱われ、静的テストで機能するスキップして戻る戦術を排除します。

粗点

粗点は正解数です。最も単純な採点方法であり、単独では最も情報が少ないものです。50問のテストで28点の粗点は、規範グループなしでは意味がありません。誰が他にテストを受けたかによって60パーセンタイルにも90パーセンタイルにもなりえます。

粗点を解釈しようとする前に、常にパーセンタイルや役割にマッピングされた目標スコアに変換してください。

パーセンタイル

パーセンタイルは規範グループに対するあなたの順位です。70パーセンタイルは比較対象の集団の70パーセントよりも高いスコアを取ったことを意味します。これはテスト間や規範グループ間で比較可能であるため、雇用主がほとんどの採用決定に使用する数字です。

パーセンタイルスコアは上位で圧縮されます。95パーセンタイルと97パーセンタイルの差は、50パーセンタイルと52パーセンタイルの差よりもはるかに大きな粗点の差を表します。高いスコアを解釈する際にはこの点を念頭に置いてください。

規範グループ

規範グループはパーセンタイルを生成するために粗点が比較される参照母集団です。規範グループは一般的な応募者、役割別の応募者、国別の応募者、または雇用主が定義するカスタムサブグループになりえます。

規範グループの選択は非常に重要です。一般的な応募者の規範グループに対する70パーセンタイルは、MBAのみの規範グループに対する70パーセンタイルとは同じではありません。スコアを比較する際には、常に基礎となる規範グループについて尋ねてください。

カットオフスコア

カットオフスコアは採用プロセスを進めるために必要な最低スコアです。カットオフ以下では、あなたの応募は終了します。カットオフは通常非公開で候補者には開示されませんが、ベンダーが公開している役割ファミリーバンドは合理的な推定を提供します。

カットオフは粗点の閾値、パーセンタイルの閾値、または役割にマッピングされた目標スコアとして設定できます。基礎となる論理は同じです。継続するためにクリアしなければならないゲートです。

状況判断テスト(SJT)

状況判断テストは職場のシナリオを提示し、回答を選んだり順位付けしたりするよう求めます。SJTはコンサルティング、専門サービス、および新卒採用でよく見られます。技術的には認知能力テストではありませんが、しばしば認知能力テストと並んで登場します。

SJTは通常、専門家のコンセンサスによって開発された弁護可能な正解を持っていますが、採点は受け入れ可能だが最適ではない回答を選んだ場合に部分的な正解を評価することがあります。

速度テスト

速度テストは、ほとんどの受験者が時間制限内に終わらせることができないテストです。CCAT、Wonderlic、PI Cognitiveはすべて速度テストです。デザインの意図は速度と正確さの両方を測ることです。

速度テストはペーシング戦略、スキップの規律、迅速なトリアージを報いいます。余裕がない状態で速度テストを終わらせようとするのは通常負け戦略です。速いペースでは正確さが崩壊するからです。

能力テスト

能力テストは時間が豊富ですが問題の難易度が増加するテストです。デザインの意図は速度ではなく最大能力を測ることです。Watson-Glazerは時間制限がほとんどの速度テストよりも寛大なので、能力テストに近い傾向があります。

純粋な能力テストは長さの関係で採用では珍しいです。ほとんどの認知テストは主に速度テストで、最も難しい問題に能力テストの要素があります。

妥当性

妥当性はテストが予測すると主張することをどれだけうまく予測するかを測ります。採用において最も重要な種類は予測妥当性です。テストスコアが職務上のパフォーマンスをどれだけうまく予測するかです。

認知能力テストはあらゆる採用ツールの中で最も高い予測妥当性を持ち、メタ分析での妥当性係数は約0.51です。面接は約0.4です。リファレンスチェックは0.3以下です。性格テストは特性と役割によって0.1から0.4まで変わります。

信頼性

信頼性はテストが別々の試行で同じ受験者に対して同様のスコアを一貫して生成するかどうかを測ります。主要なベンダーは通常0.85以上の信頼性係数を公開しており、これはテストスコアが合理的な時間枠で安定していることを意味します。

テストは信頼性なしに予測妥当性を持つことができません。信頼性の低いテストは何も有用なことを予測できないノイズの多いスコアを生成します。

監視付きテストと非監視テスト

監視付きテストはライブの人間またはAIモニタリングによって監督されます。非監視テストは自己管理され、通常は自宅でライブ監督なしで行われます。非監視テストは結果を確認するために監視付き検証が後に続くことがよくあります。

監視付きテストはより厳しい環境要件があり、非監視テストは気を散らすリスクが高いため、この区別は重要です。どちらもスコアの整合性に関する考慮事項があります。

FAQs

語彙は学べます。テストは学べます。

一度練習するとグロッサリーが直感的に理解できるようになります。

無料練習を始める