アンケートを送信し、40人から回答を得ました。しかし、目の前に広がるのは、ほとんど何も分からない数字の羅列。多くの場合、問題はテーマではなく、アンケートの質問形式にあります。適切な形式を選べば、同じテーマでも明確で実用的なデータが得られます。逆に、間違った形式だと、せっかくのテーマが埋もれてしまいます。このガイドでは、最もよく使われる8種類のアンケート質問形式について、それぞれの例と、どのような場合に効果的なのかを解説します。
各タイプについて、いつ使用すべきか、どのような利点があるか、そして注意すべき点を解説します。研修評価、従業員からのフィードバック、イベントアンケート、顧客調査など、幅広い用途に対応しています。回答の選択肢がすべてあらかじめ決められているクローズドエンド形式から、自由記述式の回答を収集するオープンエンド形式まで、様々なタイプがあり、簡単な状況把握から本格的なアンケートまで、あらゆる場面で活用できます。

1. 複数選択

多肢選択式質問では、あらかじめ定義された回答選択肢が提示されます。単一選択式では、回答者は1つの選択肢しか選べませんが、複数選択式では、回答者は複数の選択肢を選ぶことができます。
人口統計、行動セグメンテーション、選択肢が既知の嗜好に関する質問に最適です。例:
「どの研修形式がお好みですか?(対面式/オンライン/自己学習型/ブレンド型)」
「今後のセッションで取り上げてほしいトピックはどれですか?(該当するものをすべて選択してください)」
回答者が不正確な回答を強いられるような、不完全な選択肢には注意してください。あらゆる可能性を網羅できていないと確信できない場合は、必ず「その他(具体的に記入してください)」という選択肢を含めてください。回答者が常に最初または最後の選択肢を選ぶ傾向(ポジションバイアス)を軽減するために、選択肢の順序をランダム化してください。
2. 評価尺度

評価尺度は、回答者に何かを数値の連続体(通常は1~5、1~7、または1~10)に沿って評価してもらうものです。満足度、品質、および可能性を定量化し、時間の経過に伴う比較や追跡を容易にします。
満足度、パフォーマンス、およびエクスペリエンスの測定に最適です。最も一般的な専門的な用途は、フレッド・ライヒヘルドが2003年のハーバード・ビジネス・レビューの記事で紹介したネット・プロモーター・スコア(NPS)です[1]。NPSは、推奨する可能性を測定するために0~10のスケールを使用します。例:
「今日のワークショップにご満足いただけましたか?(1~5)」
「この研修を同僚に勧める可能性はどのくらいですか?(0~10)」
常に明確なラベルで終点を固定してください。「1 = 非常に不満、5 = 非常に満足」。ラベルのない尺度は、回答者が数値を異なるように解釈する原因となります。NPS の標準スコアリングでは、回答者を推奨者 (9~10)、中立者 (7~8)、批判者 (0~6) に分類します [1]。
3. リッカート尺度

リッカート尺度は、回答者が「強く反対」から「強く賛成」までの連続的な尺度で同意度を評価する、宣言的な記述を提示する尺度です。厳密には評価尺度の一種ですが、専門的な調査ではよく用いられるため、ここでは別個に扱います。
複数の関連する側面における態度、意見、認識を測定するのに最適です。従業員のエンゲージメント調査や研修評価など、人々が特定の経験の側面についてどれほど強く感じているかを測定したい場合に最適です。例:
「研修内容は私の職務に直接関連するものでした。」
リッカート尺度の項目が連続して多すぎると、アンケート疲れを引き起こす可能性があるので注意してください。アンケートの満足化に関する研究では、リッカート尺度のグリッドは1ブロックあたり10行以下にすることを推奨しています。それ以上になると、回答者は注意深く読まずにすべての項目に対して同じ回答を選択し始める傾向があります[2]。長いリッカート尺度のセクションは、他の種類の質問で分割してください。
4. 自由回答形式の質問

自由記述式の質問は、あらかじめ選択肢が決められていないため、回答者の自由記述を促します。構造化された質問では捉えきれない、質的な文脈を捉えることができるのです。
定量データの背後にある「理由」を理解したり、予期せぬテーマを明らかにしたり、回答者自身の言葉で提案を捉えたりするのに最適です。例:
「今回のセッションで最も有益だった点は何ですか?」
「あなたの体験を最も向上させる変更点は何ですか?」
アンケートごとに1つか2つに絞り、構造化された質問の後に最後に配置してください。自由記述式の質問は回答に手間がかかるため、回答率が低下します。また、分析にはテーマ別のコーディングが必要となり、サンプル数が多い場合は時間がかかります。ライブセッションで手軽に済ませるには、回答を声に出して読み上げ、最も頻繁に出てくるテーマについてグループで話し合ってもらうと良いでしょう。
5. ランキングに関する質問

順位付け質問では、回答者に優先順位、好み、または重要度に基づいて項目を順序付けしてもらいます。多肢選択式とは異なり、順位付け質問はトレードオフを強いるため、他の選択肢と比較して何が最も重要かが明らかになります。
順位付け質問は、アンケート設計における強制選択形式です。回答者が何も考えずにすべてを「非常に重要」とマークするのを防ぎ、優先順位を決めさせることで、真の優先順位が明らかになります。
優先順位付けの練習や相対的な好みの理解に最適です。例:
「以下の研修テーマを、あなたの役割にとっての重要度順にランク付けしてください:AIリテラシー、コミュニケーションスキル、リーダーシップ開発、サイバーセキュリティ意識、データリテラシー。」
認知負荷に注意してください。5~7項目以上をランク付けすると、ストレスが溜まり、信頼性の低いデータしか得られません。リストは短くし、明確に区別できる選択肢を使用してください。
6. マトリックス問題

マトリックス形式の質問では、行が項目、列が共通の尺度となるグリッド形式を使用します。これにより、回答者は質問形式を繰り返すことなく、関連する複数の項目を同じ尺度で評価できます。
同じ体験の複数の側面における評価を比較するのに最適です。具体的な例としては、研修後の評価マトリックスがあり、「コンテンツの関連性」「講師の専門性」「研修のペース」「教材の質」の各項目を5段階の満足度で評価します。4つの評価項目を1つの画面で表示できます。
モバイル端末では、視覚的な複雑さに注意してください。大きなマトリックスは小さな画面では読みにくく、意図しない反応を引き起こす可能性があります。マトリックスは最大でも5~6行に抑え、より多くのユーザーに展開する前にモバイル端末でテストしてください。
7. 二者択一式(はい/いいえ)の質問


二者択一式の質問は、通常「はい/いいえ」または「真/偽」の2つの選択肢しかありません。質問の作成と回答の両方において、最も迅速な質問形式です。
スクリーニング、フィルタリング、迅速な事実確認に最適です。例:
「研修セッションに全て参加しましたか?(はい/いいえ)」
「研修後、新しいソフトウェアを使用しましたか?(はい/いいえ)」
これらは、回答者の回答に基づいて異なるフォローアップ質問へと誘導する論理ゲートとして効果的に機能します。例えば、出席していないと回答した場合は、セッション評価をスキップして、直接人口統計情報セクションに誘導することができます。
単純化しすぎないように注意しましょう。「いいえ」だけでは、その理由は何もわかりません。二者択一式の質問の後には、簡潔な自由回答式の質問や評価尺度を続けて、重要な部分の掘り下げを捉えましょう。
8. 人口統計に関する質問

人口統計に関する質問は、回答者の背景情報を収集し、セグメント別の分析を可能にする。一般的な項目には、所属部署、役職、勤続年数、勤務地、経験レベルなどがある。
クロス集計やグループ比較に最適です。ある部署の従業員が研修効果を会社全体の平均よりも著しく低く評価していることが分かれば、単一の総合スコアよりもはるかに具体的な対策を講じやすくなります。
人口統計に関する質問は任意とし、データ収集の理由を説明し、個人を特定できるほど小さなセグメントを避けることで匿名性を保護してください。グループレベルのデータを報告する前に、各セグメントの回答者数が5人以上であることが一般的な目安です。
すべてをまとめる:アンケートの流れを設計する
適切に構成されたアンケートは、論理的な流れに沿って進められます。まず、回答者が気軽に質問できるよう、簡単なスクリーニング質問や人口統計に関する質問から始めましょう。次に、評価尺度、リッカート尺度、マトリックス質問など、主要な測定質問へと進みます。最後に、質的な深みを測るために、自由記述式の質問を1つか2つ設けて締めくくります。
回答にかかる時間は5分から7分以内に抑えましょう。SurveyMonkeyの調査によると、7分未満のアンケートは7分を超えるアンケートよりも回答率が大幅に高く、12分を過ぎると離脱率が急激に上昇します[3]。これは、質問の種類にもよりますが、およそ10~15問に相当します。
よくある間違いは避けるために
適切な質問形式を選んだとしても、いくつかの設計上の習慣が、回答の質を静かに損なう可能性がある。
1. 二重の質問をする
2つの項目が混在する質問は、「研修内容は適切で、教材は分かりやすかった」のように、2つの異なる考えを1つの項目に詰め込んでいます。内容は適切だったが教材が分かりにくかったと回答した人は、正直な答えを出すことができません。複合的な記述はすべて個別の質問に分けましょう。これは、リッカート尺度を用いたアンケートでよく見られる傾向で、作成者が複数の考えをまとめて効率化しようとするためです。
2. リード言語の使用
期待される回答を誘導するような質問は、肯定的な評価を過大評価させ、長期的にはベンチマークを無意味なものにしてしまいます。「今日のセッションはどの程度楽しかったですか?」という質問は、楽しかったという前提を含んでいます。「今日のセッション全体をどのように評価しますか?」という質問は、そうではありません。すべての質問を見直し、好ましい回答を暗示するような言葉がないか確認し、中立的な表現に置き換えてください。
3. 不均衡な回答オプションを提供する
肯定的な選択肢が4つと否定的な選択肢が1つある評価尺度(「非常に良い/良い/普通/悪い/悪い」)はバランスが取れていません。否定的な意見を持つ回答者の選択肢が限られてしまうため、実際の経験に関わらず平均値が上がってしまう可能性があります。否定的な意見から肯定的な意見までの範囲を示す尺度では、中間点の両側の選択肢の数を一致させるようにしてください。標準的な5段階尺度(否定的な選択肢2つ、中立的な選択肢1つ、肯定的な選択肢2つ)が適しています。中立的な中間点を設けたくない場合は、回答に方向性を持たせる偶数個の選択肢(4つまたは6つ)からなる尺度を使用してください。
4. 最も重要な質問を埋もれさせる
アンケート疲れは実際に存在し、アンケートの長さが長くなるにつれて回答者のエンゲージメントは低下します。最も重要な質問が15問中14問目にある場合、回答者のかなりの割合が、その質問に十分な注意を払って回答しない、あるいは全く回答しない可能性があります。最優先事項の質問はアンケートの前半に配置しましょう。人口統計情報や任意回答の自由記述式質問は、離脱率の影響が少ない後半に配置してください。
よくある質問
アンケートにはいくつの質問を含めるべきか?
研修評価やイベント後のフィードバックには、8~12問が適切な範囲です。これは通常、回答に5~7分程度かかることを意味し、回答率が最も高くなる範囲です。アンケートがこれより長い場合は、すべての質問が実際に意思決定に影響を与えるかどうかを検討してください。誰も活用しないデータしか得られない質問は削除する価値があります。アンケートを最終決定する前に、各質問について、それがどのような意思決定や行動に役立つかを書き出してみると良いでしょう。それができない場合は、おそらくその質問は不要です。こうすることで、アンケートを送信する前に、その目的を明確にすることができます。
評価尺度とリッカート尺度の違いは何ですか?
評価尺度は、評価に数値を割り当てます。「1から5の尺度で評価してください」。リッカート尺度は、記述を提示し、回答者がどの程度同意するかを尋ねます。「ファシリテーターは概念を明確に説明しました。(強く反対する~強く賛成する)」。どちらも順序尺度ですが、リッカート尺度の項目は常に記述と対になっているのに対し、評価尺度はほぼあらゆる評価タスクに適用できます。
構造化された質問ではなく、自由回答形式の質問を使うべきなのはどのような場合ですか?
どのカテゴリーが重要かまだわからない場合や、構造化された選択肢では全体像を捉えきれないと思われる場合は、自由回答形式の質問を使用してください。新しいプログラムの開始後、評価フレームワークを構築するのに十分なデータが揃う前に、何が際立っているかを把握したい場合に、自由回答形式の質問は非常に有効です。安定したテーマに関する定期的なアンケートでは、構造化された質問の方が分析が速く、経時的な追跡も容易です。実践的なアプローチとしては、新しいアンケートの最初のラウンドで1つか2つの自由回答形式の質問を実施し、最も多く出現するテーマを特定し、それらのテーマを今後のラウンドで使用するための構造化された選択肢に変換する方法があります。
AhaSlidesでアンケートを実施する
適切な質問形式を選ぶだけでは、半分しか達成できません。回答者が実際にアンケートに回答し、完了してくれることも必要です。
AhaSlidesは、多肢選択式、評価尺度、自由記述式、ランキング形式の質問など、あらゆる形式の質問に対応したオールインワンのオーディエンスエンゲージメントプラットフォームです。セッションの途中で3つの質問からなるパルスを作成し、参加者全員がまだ一緒にいる間に結果を画面に表示し、その結果に基づいて後半のセッションを調整できます。別途アンケートツールは必要ありません。

特に研修評価においては、参加者の反応をその場で確認することで、評価の雰囲気が大きく変わります。データそのものよりも、その後の議論の方が価値がある場合が多いのです。結果を一緒に確認したチームは、それに基づいて行動を起こす傾向がありますが、要約レポートを受け取っただけのチームは、ほとんど行動を起こしません。
ソース
[1] ライヒヘルド、F.(2003年12月)「成長に必要な唯一の数字」 ハーバード·ビジネス·レビュー. https://hbr.org/2003/12/the-one-number-you-need-to-grow
[2] クロスニック, JA (1991). 「調査における態度測定の認知的要求に対処するための応答戦略」 応用認知心理学、5(3)、213 – 236。 https://doi.org/10.1002/acp.2350050305
[3] SurveyMonkey。「アンケートの長さはどのくらいが適切ですか?」 https://www.surveymonkey.com/curiosity/survey_completion_times/






