
質的比較分析ソフトの使い方
文書情報
言語 | Japanese |
フォーマット | |
サイズ | 1.97 MB |
著者 | 森 大輔 |
文書タイプ | 解説記事 |
概要
I.質的比較分析 QCA ソフトウェアを用いた分析手法
本稿では、質的比較分析 (QCA) のためのソフトウェア、ソフトウェア名1 と ソフトウェア名2 を用いた分析手法を解説します。クリスプ集合とファジィ集合の両方を扱いますが、本稿(1)ではクリスプ集合に基づく基本的な分析に焦点を当てます。次回(2)ではファジィ集合を用いた高度な分析を扱います。これらのソフトウェアは、真理表を用いて必要条件分析と十分条件分析を行います。特に、ソフトウェア名2 は中間解の導出機能が充実している点が大きな特徴です。事例研究に適しており、少ない事例数でも有効な分析が可能です。米国連邦最高裁判所の判例データ(森(2016:308)の表4の一部)を用いた具体例を交えて解説します。
1. 質的比較分析 QCA の概要
本稿では、因果関係の分析に用いられる質的比較分析(QCA)の手法と、それを支えるソフトウェアについて解説します。QCAは、回帰分析などの統計的手法とは異なり、集合論と論理学に基づいた手法です。原因条件の集合と結果の集合間の部分集合関係に着目し、因果関係を判断します。個々の事例を重視する点が特徴で、統計的手法と比べて少ない事例数でも有効な分析が可能です。近年、分析ソフトウェアの充実により、QCAはデータ分析手法として注目を集めています。しかし、日本語での解説は少ないため、本稿では主要なソフトウェアの使い方を具体例を用いて解説します。本稿では、主にソフトウェア(5)とソフトウェア(6)のパッケージ(7)(およびその発展版であるパッケージ(8))の2つを扱います。本稿(1)ではクリスプ集合を用いた基本的な分析を、次回(2)ではファジィ集合を用いた分析や発展的事項を扱います。事例として、1930年代から1960年代前半の米国連邦最高裁判所の弁護人依頼権に関する裁判例データ(森(2016:308)の表4の一部)を用います。
2. 使用ソフトウェアの紹介
現在、QCAを行うためのソフトウェアは複数存在します(4)。本稿では、(5)と(6)の2つのソフトウェアパッケージに焦点を当てて解説します。(5)はレイガンが確立した手法を基に開発された歴史の古いソフトウェアで、QCA分析において最も基本的なソフトウェアの一つと言えます。(6)のパッケージ(7)とその発展版であるパッケージ(8)は、統計分析のための高機能なフリーソフトウェアです。世界中の研究者が様々なパッケージを提供しており、(6)もその一つです。ソフトウェア(5)のバージョン3.0は、プログラムの安定性向上、インストール不要化、さらに( )への対応など、多くの改善がなされていますが、ソフトウェアの内容自体は大きな変更がないため、バージョン2.0に基づいたマニュアル(森訳2010a)も使用可能です。データファイルは、結果集合(0か1の値)と事例番号または事例名を最低限含んでいれば良く、事例番号や名前を含むと後の分析が容易になります(12)。使用するデータファイルは、森(2016:308)の表4の一部で、米国連邦最高裁判所の弁護人依頼権に関する裁判例データです。
3. QCA分析における集合と変数の扱い
統計データにおける「変数」は、QCAでは「集合」と呼ばれます。しかし、統計データも扱う研究者が多いことから、「変数」と呼ばれることも多く、本稿でも「集合」と「変数」の両方を用います。ただし、「集合の否定」「集合の論理和」は言いますが、「変数の否定」「変数の論理和」とは言わない点に注意が必要です(13)。ソフトウェア(5)では、集合の一覧が表示され、チルダ(~)が付いているものは否定を表します。原因条件として使用する集合とその否定を選択し、真理表を作成します。真理表の各行には、整合度を表す値が表示され(19)、値が1であればその行に属する全ての事例の結果が1であることを意味します。 また、事例の番号や名前の情報は、ソフトウェア(5)では現在(2017年5月31日時点)保存されないため、手作業で転記する必要があります(18)。ソフトウェア(6)の方がこの点では扱いやすいです。取るに足らない必要条件(例えば、米国大統領になるという結果に対して米国出生であるという条件)についても触れており(17)、分析者の関心によっては重要度が変わる点を指摘しています。
4. 分析結果の解釈 複雑解 簡潔解 中間解
QCAソフトウェアでは、複雑解、簡潔解、中間解という3種類の解が導出されます。複雑解は、論理的残余を使用せず、事例が存在する真理表の行のみを用いて導出された解です。簡潔解は、論理式をできる限り単純化するために、論理的残余の行をいくつか使用した解です(26,27)。この単純化の仮定はソフトウェア(5)では確認できませんが、ソフトウェア(6)では確認可能です。中間解は、簡潔解に、方向性予想に基づいて含めることがもっともらしくないと判断された行(困難な反事実的仮定)を除いて作成された解です。被覆度(カバーされている事例数の割合)と整合度(各行の整合度)を用いて、各解の相対的な重要性や、解によって説明できていない事例の有無を評価します。被覆度が低い場合、原因条件を増やすなどの対処が必要となる場合があります。簡潔解は論理式が単純なため、必要不可欠な原因条件を検討する際に役立ちますが、単純化の仮定が含まれるため、最終的な解としては慎重に解釈する必要があります(27)。中間解は通常最も解釈しやすい解と言えます。
II.g
ソフトウェア名1 を使用したQCA分析の基本手順を説明します。必要条件分析では、原因条件集合と結果集合間の関係を真理表を用いて分析し、整合度に基づいて必要条件を抽出します。十分条件分析も同様の手順で行います。複雑解、簡潔解、中間解の3種類の解が導出され、それぞれ被覆度、整合度などの指標で評価します。簡潔解は論理式を単純化するために単純化の仮定を用いるため、解釈には注意が必要です。中間解は解釈が容易で、推奨されます。 真理表のソート機能や、矛盾のある行への処理方法についても解説します。
1. 必要条件分析の手順
ソフトウェア(5)を用いた必要条件分析では、まず真理表を作成します。そのためには、データファイルから「結果」として使用する集合と、「原因条件」として使用する複数の集合を指定します。ソフトウェアのプルダウンメニューから集合を選択し、矢印をクリックすることで、原因条件を指定します。原因条件とその否定を全て指定する必要があります。 指定した集合に基づいて真理表が作成され、各行には整合度が表示されます。整合度は、各行に属する事例の結果が全て1である場合、1となり、そうでない場合は1より小さな値になります(19)。この真理表から、必要条件を分析します。必要条件の分析コマンドでは、ファイルに代入した変数名、「結果」集合名、「原因条件」集合名、そして必要条件の整合度の閾値を指定します(44,45)。閾値は0.9以上を推奨しており、閾値以上の整合度を持つものが全て出力されます(48)。集合の否定はチルダ(~)で表現するか、大文字と小文字で区別できます(46)。真理表は、整合度に基づいてソートすることが可能です。出力結果には、集合名、必要条件の整合度、被覆度が表示されます(47)。
2. 十分条件分析と真理表
十分条件分析は、必要条件分析と同様の手順で行います。まず、1)〜8)と同様に、十分条件の分析を進めて、真理表を表示します。真理表の結果集合の列で、整合度を見ながら数字を入力します(1.2.2の9)と同様)。ただし、整合度が0.5の小数になっている行が存在する場合があります。これは矛盾のある行と呼ばれ(32)、処理方法が2つあります。一つは、整合度の閾値を設定し、閾値以上なら1、以下なら0を入力する方法です。真理表を整合度順にソートすると作業しやすくなります。もう一つの方法は、ソフトウェアに処理させる方法です。この場合、主項表と呼ばれる表が必要となり、複雑な場合もあります。主項表では、同じ列にある色の付いたセル(例えば2列目にある複数のセル)のいずれか一方、もしくは両方にチェックを入れることで、その列の色が全て変わります。全ての列の色が変わると、右下のボタンを押せるようになり、分析が完了します。結果として、例えば、⇔となり、解整合度、解被覆度はともに1になります。
3. 解の導出と解釈 複雑解 簡潔解 中間解
ソフトウェア(5)では、複雑解、簡潔解、中間解の3種類の解が導出されます。複雑解は、論理的残余を用いず、事例が存在する真理表の行のみを用いて導出されます。簡潔解は、論理式を単純化するために論理的残余の行をいくつか用いた解で(26)、単純化の仮定に基づいています(27)。この単純化の仮定が具体的にどの行についてなされているかは、このソフトウェアでは確認できません。中間解は、簡潔解に、方向性予想に基づいて含めることがもっともらしくないと判断された行(困難な反事実的仮定)を除いて作成された解です。それぞれの解について、粗被覆度、固有被覆度、整合度、解整合度、解被覆度などの指標が算出されます。被覆度は、解の項でカバーされている事例数の割合を表し、解全体の重要性を示します。解被覆度は、結果が1の事例全体のうち、解でカバーされている事例数の割合を示します。 簡潔解は論理式が単純ですが、単純化の仮定が含まれるため、注意が必要です(27)。中間解は通常最も解釈しやすい解です。
4. 仮説検証と分析結果の活用
ソフトウェア(5)では、導出された解(複雑解、簡潔解、中間解)と、事前に立てた仮説を比較検証することができます。仮説は、論理式の左辺のみを書き、原因条件は全て大文字で表し、括弧を使わず展開した形で、否定がある場合はチルダ(~)を使用します。比較コマンドでは、仮説の変数、解の変数、「結果」変数を指定します。中間解を比較する場合には、コマンドに特定の記述を追加します。仮説と解の比較結果を分析することで、理論の修正や発展に繋げることが期待できます。 本稿で用いた米国連邦最高裁判所の判例データを用いた分析例では、複雑解、簡潔解、中間解の導出と解釈方法、そして矛盾のある行の処理方法について解説しています。矛盾のある行の処理は、整合度の閾値を用いる方法や、原因条件を追加して分析を行う方法があります。これらの分析手法は、法学の判例研究における「区別」という方法と類似性があると指摘されています(33)。
III.g
ソフトウェア名2 は、豊富な機能を持つフリーソフトウェアで、様々なパッケージを追加できます。本稿では、QCA分析に特化したパッケージについて解説します。ソフトウェア名1と同様、必要条件分析と十分条件分析を行い、真理表を作成します。しかし、矛盾のある行の処理において、整合度の閾値を設定することで柔軟な分析が可能です。また、簡潔解が複数存在する場合、全てを表示する点がソフトウェア名1 と異なります。単純化の仮定や困難な反事実的仮定の確認も容易に行えます。
1. ソフトウェア 6 の概要と特徴
ソフトウェア(6)のパッケージ(7)(およびその発展版であるパッケージ(8))は、統計分析のための高機能なフリーソフトウェアです(38)。大きな特徴として、パッケージという形で自由に機能を追加できる点が挙げられます。世界中の研究者が様々なパッケージを提供しており、QCA分析に特化したパッケージもその一つです(39)。このソフトウェアは、ソフトウェア名1と比較して、より高度な分析や、ソフトウェア名1では困難な分析も実行可能です。また、様々な統計的手法のパッケージと連動させたり、独自のプログラムを追加するなど、発展性にも富んでいます。インストール不要で、ダウンロードしたフォルダ内の実行ファイルを実行するだけで使用できます。バージョン3.0では、プログラムの安定性向上、( )への対応など、改善が加えられています。
2. 必要条件 十分条件分析の手順
ソフトウェア(6)を用いた必要条件・十分条件分析の手順は、ソフトウェア(5)と基本的には同様です。まず、データファイルを読み込み、真理表を作成します。真理表において、「結果」集合と「原因条件」集合を指定し、原因条件とその否定を全て指定する必要があります。ソフトウェア(6)では、真理表の整合度( )の列に最初から数字が入っており、整合度が0.5の行は結果が0と1の両方を含む矛盾のある行( )となります。この矛盾のある行の処理方法は、整合度の閾値を設定する方法と、原因条件を追加して分析を行う方法があります(32)。閾値を設定する場合は、閾値以上を1、以下を0と入力します。真理表は整合度順にソートすることも可能です。ソフトウェア(6)は、整合度の閾値を柔軟に設定できるため、分析に柔軟性を持たせることができます。コマンドで、複雑解、簡潔解、中間解を求めることができますが、整合度の閾値はデフォルトで1です。閾値を変更したい場合はコマンドに指定を加えます。例えば、整合度の閾値を0.8に設定するにはコマンド内に 0.8 を追加します。
3. 解の導出と解釈 簡潔解の多様性と中間解
ソフトウェア(6)では、複雑解、簡潔解、中間解が導出されます。複雑解と中間解の出力の読み方はソフトウェア(5)と同様です。しかし、簡潔解において、ソフトウェア(5)とは異なる点があります。ソフトウェア(5)では、主項表で選択を行う必要がありましたが、ソフトウェア(6)では主項表での選択を必要とせず、ありうる全ての論理式が表示されます。分析者はそれらの中から最も妥当なものを選択します。例えば、簡潔解が2つ存在する場合、ソフトウェア(6)は両方を表示します。中間解は、簡潔解に含まれる論理的残余の行のうち、方向性予想に基づいて含めることがもっともらしくないと判断された行(困難な反事実的仮定)を除いて作成されます。そのため、前提となる簡潔解が異なれば、中間解も異なる可能性があります。ソフトウェア(6)では、簡潔解の単純化の仮定や、容易・困難な反事実的仮定を個別に確認することが可能です。これはソフトウェア(5)では確認できない点です。
4. ソフトウェア 6 の利点とファイル形式
ソフトウェア(6)には、いくつかの利点があります。一つ目は、機能が豊富で、ソフトウェア(5)では行いにくい分析も可能になっている点です。二つ目は、様々な統計的手法のパッケージと連動させたり、自分で追加のプログラムを組むことができる発展性に富んでいる点です。データファイルは、ソフトウェア(5)と同様に、結果集合と事例番号または事例名を含む必要があります。 本稿では、説明の容易さと汎用性の高さから、ファイル形式名形式を使用します。このファイル形式は、後の分析においても読み込みやすい形式です。ソフトウェア(6)では、二項検定を使った方法も使用できますが、事例数が多くないと適切に機能せず、ファジィ集合では使用できないため、本稿では扱いません(54)。
IV.その他有用なソフトウェアとファイル形式
本稿では主に**ソフトウェア名1** と ソフトウェア名2 を扱いますが、他にも**ソフトウェア名3、ソフトウェア名4などのソフトウェアが存在します。(3)に記載されている英語文献( ) ( )にも様々なソフトウェアの使い方が解説されています。データファイル形式として、汎用性の高いファイル形式名**を使用することを推奨します。このファイル形式は、後述の分析においても読み込みやすい形式です。
1. 本稿で扱わないその他のソフトウェア
本稿では、主にソフトウェア(5)とソフトウェア(6)のパッケージを扱いますが、他にも多くのQCAソフトウェアが存在します(4)。例えば、( )、( )、統計ソフト( )のファイルなどがあります。これらのソフトウェアは有用であり、独自の機能も提供していますが、本稿では中間解の導出機能など、いくつかの重要な機能が備わっていないため、扱いません。これらのソフトウェアの詳細は、それぞれのウェブサイトのソフトウェア紹介ページなどを参照してください。英語文献(3)では、( )の付録である( )において、様々なソフトウェアの使い方が解説されています。
2. データファイル形式の推奨 CSV形式
本稿では、データファイル形式としてCSV形式を使用することを推奨します。CSV形式は、後述のソフトウェア(5)およびソフトウェア(6)の分析においても読み込みやすい形式であり、汎用性が高いファイル形式です。 ソフトウェア(5)やソフトウェア(6)においても、CSV形式でデータを作成・表示することが可能です。 ソフトウェア名1では(2017年5月31日時点)事例の番号や名前についての情報は保存されないという欠点があります(18)。そのため、事例の番号や名前については、ボタンを押して表示されたものをファイルに手作業で転記する必要があります。ソフトウェア(6)のパッケージの方がこの点では楽です。 本稿で用いられるデータファイルは、森(2016:308)の表4の一部で、1930年代から1960年代前半の米国連邦最高裁判所の弁護人依頼権に関する裁判例データです。