導讀
全書各部分簡介
序言
術語錶
第一部分 原 理
第1章 導論 1
1.1 基本概念 4
1.1.1 什麼是測驗 5
1.1.2 測驗的類型 6
1.2 本書概要 8
1.2.1 心理測驗的原理 8
1.2.2 心理測驗的應用 8
1.2.3 心理測驗的問題 9
1.3 曆史迴顧 9
1.3.1 早期發展 9
1.3.2 達爾文和個體差異 10
1.3.3 實驗心理學和心理物理測量 10
1.3.4 智力的演變和標準化成就測驗 11
1.3.5 人格測驗:1920~1940 14
1.3.6 人格測驗新方法的齣現 16
1.3.7 測驗地位快速變化時期 16
1.3.8 當前的環境 18
1.4 小結 19
第2章 測驗常模和基本統計 20
2.1 我們為什麼需要統計 20
2.2 測驗量錶 21
2.2.1 量錶的特徵 22
2.2.2 量錶的類型 23
2.2.3 可進行的運算 24
2.3 頻數分布 24
2.4 百分等級 27
2.5 百分位數 30
2.6 描述分數分布 31
2.6.1 平均數 31
2.6.2 標準差 32
2.6.3 Z分數 33
2.6.4 標準正態分布 34
2.6.5 麥柯爾T分數 40
2.6.6 四分位數和十分位數 41
2.7 常模 42
2.7.1 年齡常模 44
2.7.2 軌跡 45
2.7.3 標準參照測驗 46
2.8 小結 49
第3章 相關與迴歸 52
3.1 散點圖 53
3.2 相關 54
3.3 迴歸 55
3.3.1 迴歸直綫 55
3.3.2 最優擬閤直綫 56
3.3.3 相關係數的統計顯著性檢驗 62
3.3.4 如何解釋迴歸圖形 63
3.4 其他相關係數 65
3.5 相關分析中的術語和爭議 67
3.5.1 殘差 67
3.5.2 估計的標準誤 68
3.5.3 決定係數 68
3.5.4 不相關係數 68
3.5.5 收縮率 68
3.5.6 交叉驗證 69
3.5.7 相關-因果問題 69
3.5.8 第三變量解釋 70
3.5.9 範圍受限 70
3.6 多元分析 71
3.6.1 一般方法 71
3.6.2 多元迴歸應用舉例 72
3.6.3 判彆分析 73
3.6.4 因素分析 73
3.7 小結 76
附錄3A 迴歸方程和相關係數的計算 77
3A.1 迴歸方程的計算 78
3A.2 相關係數的計算 79
第4章 信度 81
4.1 信度的曆史和理論 82
4.1.1 誤差的概念 82
4.1.2 斯皮爾曼的早期研究 82
4.1.3 測驗分數理論的基礎 83
4.2 領域抽樣模型 84
4.3 項目反應理論 85
4.4 信度模型 86
4.4.1 誤差來源 87
4.4.2 時間取樣:重測法 87
4.4.3 項目取樣:復本法 89
4.4.4 分半法 89
4.4.5 KR20公式 91
4.4.6 a係數 92
4.4.7 差異分數的信度 93
4.5 行為觀察研究中的信度 94
4.6 與信度評估方法相關的誤差來源 97
4.7 信度信息的使用 100
4.7.1 測量標準誤和彈性碼尺 100
4.7.2 什麼樣的信度是可信的 101
4.7.3 麵對信度低怎麼辦 102
4.8 小結 104
附錄4A 測驗的兩部分方差不同時利用a
係統來估計分半信度 105
附錄4B 利用KR20計算信度 105
第5章 效度 107
5.1 效度的定義 108
5.2 效度的各方麵 109
5.2.1 錶麵效度 109
5.2.2 與內容有關的效度證據 109
5.2.3 與標準有關的效度證據 111
5.2.4 與構想有關的效度證據 120
5.2.5 信度與效度的關係 126
5.3 小結 126
第6章 測驗項目的編寫和評價 128
6.1 項目編寫 128
6.1.1 項目形式 129
6.1.2 其他可能性 136
6.2 項目分析 139
6.2.1 項目難度 139
6.2.2 區分度 140
6.2.3 項目特徵圖 142
6.2.4 不同測量的鏈接 147
6.2.5 標準參照測驗的項目 148
6.2.6 項目分析的局限性 149
6.3 小結 149
第7章 測驗的實施 151
7.1 主試和被試 151
7.1.1 主試和被試的關係 151
7.1.2 主試的種族 152
7.1.3 被試的語言 154
7.1.4 施測者的培訓 154
7.1.5 期望效應 154
7.1.6 對反應強化的影響 156
7.1.7 計算機輔助測驗的實施 158
7.1.8 施測模式 159
7.1.9 被試變量 160
7.2 行為評估的方法學 161
7.2.1 反應性 161
7.2.2 偏離 162
7.2.3 期望 162
7.2.4 欺騙 162
7.2.5 評定誤差的統計控製 163
7.3 小結 164
第二部分 應 用
第8章 訪談技術 165
8.1 作為測驗的訪談 168
8.2 訪談的交互性質 168
8.3 有效訪談的原則 169
8.3.1 閤適的態度 169
8.3.2 應當避免的反應 170
8.3.3 有效的反應 171
8.3.4 保持互動順利的反應 172
8.3.5 對理解的測量 175
8.4 訪談的類型 176
8.4.1 評價性訪談 177
8.4.2 結構化臨床訪談 177
8.4.3 個案曆史訪談 181
8.4.4 心理狀態檢查 182
8.4.5 提高訪談技能 183
8.5 訪談的誤差來源 183
8.5.1 訪談的效度 183
8.5.2 訪談的信度 185
8.6 小結 186
第9章 智力理論和比奈量錶 188
9.1 智力的界定問題 188
9.2 比奈的測驗建構原理 190
9.2.1 原理1:年齡分化 190
9.2.2 原理2:一般心理能力 191
9.3 斯皮爾曼的一般心理能力模型 191
9.3.1 一般心理智力(g)的含義 192
9.3.2 智力的gf-gc理論 192
9.4 早期的比奈量錶 193
9.4.1 1905年比奈-西濛量錶 193
9.4.2 1908年量錶 194
9.5 推孟的斯坦福-比奈智力量錶 195
9.5.1 1916年斯坦福-比奈智力量錶 195
9.5.2 智力商數(IQ) 196
9.5.3 1937年量錶 196
9.5.4 1960年修訂版斯坦福-比奈量錶和
離差智商(SB-LM) 198
9.6 現代比奈智力量錶 199
9.6.1 第4和第5版比奈智力量錶的模型 199
9.6.2 1986年修訂版的特徵 199
9.6.3 2003年第5版的特徵 202
9.6.4 2003年第5版的心理測量學特性 203
9.6.5 中位數效度 204
9.7 小結 204
第10章 韋剋斯勒智力量錶:WAIS-III,WISC-IV和WPPSI-III 205
10.1 韋剋斯勒智力量錶 206
點量錶和操作量錶的概念 206
10.2 從韋剋斯勒-貝爾韋智力量錶到
WAIS-III 208
10.3 量錶、分測驗和WAIS-III的指數 208
10.3.1 語言分測驗 209
10.3.2 原始分數、量錶分數和言語智商 212
10.3.3 操作分測驗 213
10.3.4 操作智商 214
10.3.5 全量錶IQ 214
10.3.6 指數分數 214
10.4 韋剋斯勒智力測驗的解釋特徵 215
10.4.1 言語智商和操作智商比較 215
10.4.2 模式分析 216
10.4.3 假設性案例研究 216
10.5 韋剋斯勒成人量錶的心理測量學
特性 217
10.5.1 標準化 217
10.5.2 信度 217
10.5.3 效度 218
10.6 對韋剋斯勒成人量錶的評價 218
10.7 WAIS-III的嚮下拓展:WISC-IV
和WPPSI-III 219
10.7.1 韋剋斯勒兒童智力量錶WISC-IV 219
10.7.2 韋剋斯勒幼兒與學齡初智力量錶
WPPSI-III 222
10.8 小結 223
第11章 教育和特殊教育中的其他個體
能力測驗 225
11.1 其他個體能力測驗與比奈量錶和
韋剋斯勒量錶的比較 226
11.2 其他量錶之間的相互比較 227
11.3 特殊的個體能力測驗 228
11.3.1 嬰兒量錶 229
11.3.2 適閤年幼兒童的主要量錶 234
11.3.3 用於殘疾人和特殊人群的一般
個體能力測驗 239
11.4 學習障礙測驗 242
11.4.1 視覺圖形測驗 246
11.4.2 創造力:托蘭斯創造性思維測驗 247
11.4.3 個體成就測驗:廣泛成就測驗
第三版(WRAT-3) 248
11.5 小結 249
第12章 教育、公共服務及軍隊中所
使用的標準化測驗 250
12.1 團體和個體能力測驗的比較 251
12.1.1 個體測驗的優點 252
12.1.2 團體測驗的優點 252
12.2 團體測驗概述 253
12.2.1 團體測驗的特徵 253
12.2.2 團體測驗的選擇 253
12.2.3 團體測驗的使用 254
12.3 學校中的團體測驗:從幼兒園到
12年級 254
12.3.1 成就測驗與能力傾嚮測驗的比較 254
12.3.2 團體成就測驗 255
12.3.3 心智能力(智力)的團體測驗 257
12.4 大學入學測驗 259
12.4.1 SAT推理測驗 259
12.4.2 中學和大學聯閤能力測驗 261
12.4.3 美國大學測驗 261
12.5 研究生和專業學院入學測驗 261
12.5.1 研究生入學考試能力傾嚮測驗 262
12.5.2 米勒類比測驗 266
12.5.3 法學院入學測驗 267
12.6 非語言團體能力測驗 268
12.6.1 瑞文漸進矩陣 268
12.6.2 古德依諾-哈裏斯畫人測驗 271
12.6.3 文化公平智力測驗 272
12.6.4 美國公民服務係統中的標準化
測驗 272
12.6.5 美國軍隊標準化測驗:軍人職業
能力傾嚮成套測驗 273
12.7 小結 274
第13章 臨床和谘詢中的應用 275
13.1 結構化人格測驗的編製方法 277
13.1.1 推理法 277
13.1.2 實證法 278
13.1.3 有待討論的測驗的選擇標準 279
13.2 邏輯內容法 279
13.2.1 伍德沃斯個人資料錶 279
13.2.2 早期的多維邏輯內容量錶 280
13.2.3 穆尼問題檢核錶 280
13.2.4 對邏輯內容法的批評 280
13.3 效標團體法 281
13.3.1 明尼蘇達多相人格測驗 281
13.3.2 加利福尼亞心理測驗-第3版 290
13.4 因素分析法 291
13.4.1 吉爾福特的早期探索 292
13.4.2 卡特爾的貢獻 292
13.4.3 因素分析方法的問題 294
13.5 理論推導法 295
13.5.1 愛德華個性偏好測驗(EPPS) 295
13.5.2 人格研究量錶(PRF)和傑剋森
人格調查錶(JPI) 297
13.5.3 自我概念 297
13.6 綜閤法 299
13.6.1 積極人格測量和大五人格調查錶-
修訂版 299
13.6.2 大五人格調查錶(NEO-PI-R) 300
13.7 積極人格特徵的常用測量方法 302
13.7.1 羅森伯格自尊量錶 303
13.7.2 一般自我效能量錶(GSE) 303
13.7.3 自我復原力量錶 303
13.7.4 氣質復原力量錶(DRS) 303
13.7.5 希望量錶 303
13.7.6 生活導嚮量錶-修訂版(LOT-R) 304
13.7.7 生活滿意度量錶(SWLS) 304
13.7.8 積極和消極情感清單(PANAS) 305
13.7.9 壓力情境應對乾預(CISS) 305
13.7.10 核心自我評價 305
13.8 積極人格特徵研究的未來 306
13.9 小結 307
第14章 投射性人格測驗 309
14.1 投射假說 310
14.2 羅夏墨跡測驗 311
14.2.1 曆史上的先行者 312
14.2.2 刺激物、施測和解釋 312
14.2.3 心理測量學特性 318
14.3 其他墨跡測驗: 霍茲曼測驗 324
14.4 主題統覺測驗 325
14.4.1 刺激物、施測和解釋 326
14.4.2 心理測量學特性 328
14.5 其他統覺法 329
14.6 非圖形投射法 330
14.6.1 詞語聯想測驗 330
14.6.2 句子完成任務 331
14.6.3 畫圖測驗 331
14.7 小結 332
第15章 計算機和基礎心理科學測驗 334
15.1 認知行為評價法 335
15.1.1 認知行為評價的原理 335
15.1.2 基於操作性條件反射的程序 337
15.1.3 自陳技術 339
15.1.4 坎弗和薩思洛的功能法 342
15.1.5 功能障礙態度問捲 343
15.1.6 非理性信念測驗 344
15.1.7 認知功能分析 344
15.2 心理生理法 346
15.2.1 與治療有關的生理變量 346
15.2.2 對心理生理法的評價 346
15.3 計算機和心理測驗 347
15.3.1 計算機輔助訪談 348
15.3.2 計算機施測的測驗 349
15.3.3 計算機診斷、計分及結果報告 349
15.3.4 互聯網在心理測驗中的應用 351
15.3.5 計算機化的認知-行為評價 352
15.3.6 隻能用計算機進行的測驗 353
15.3.7 計算機自適應測驗 354
15.3.8 心理生理和信號檢測法 355
15.4 小結 357
第16章 谘詢心理學中的測驗 359
16.1 興趣的測量 360
16.1.1 斯特朗職業興趣錶 360
16.1.2 斯特朗-坎貝爾興趣調查錶 361
16.1.3 坎貝爾興趣和技能調查錶 363
16.1.4 斯特朗興趣量錶的再熱 364
16.1.5 庫德職業興趣調查錶 367
16.1.6 職業評估調查錶 369
16.1.7 自我定嚮探測 369
16.1.8 消除興趣測量中的性彆偏嚮 370
16.1.9 態度和興趣 371
16.2 工作安置中的個性特徵測量 371
16.2.1 特質因子取嚮:奧斯普的
職業維度 371
16.2.2 人格特質是穩定的嗎 372
16.3 小結 373
第17章 健康心理學和保健測驗 374
17.1 神經心理學評定 374
17.1.1 臨床神經心理學 374
17.1.2 發展神經心理學 379
17.1.3 成人神經心理學 383
17.1.4 加州言語學習測驗 387
17.1.5 自主神經心理測驗 389
17.1.6 焦慮和應激評估 390
17.1.7 應激和焦慮 390
17.1.8 狀態-特質焦慮調查錶 391
17.1.9 測驗焦慮的測量 392
17.1.10 應對的測量 395
17.1.11 生態學瞬時評定 396
17.2 生活質量評定 397
17.2.1 什麼是同健康有關的生活質量 397
17.2.2 生活質量測量的常用方法 398
17.3 小結 400
第18章 工業和商業場所的測驗 402
18.1 人事心理學—雇員選拔 403
招聘麵試 403
18.2 基準率和命中率 404
18.2.1 泰勒-羅素錶 408
18.2.2 效用理論與決策分析 412
18.2.3 增益效度 413
18.3 雇員視角的人事心理學:人職匹配 415
18.3.1 邁爾斯-布裏格斯類型指標 415
18.3.2 工業用的測驗:溫德利人事測驗 416
18.4 對工作場閤特性的測量 416
18.4.1 社會-生態學方法 416
18.4.2 環境的分類 418
18.5 職務分析 420
18.6 人與情境的交互作用的測量 422
18.7 小結 425
第三部分 問 題
第19章 測驗偏嚮 426
19.1 測驗偏嚮為何會有爭議 426
19.2 測驗公平與法律 430
19.3 測驗的傳統防衛 431
19.3.1 與內容有關的效度證據 432
19.3.2 與校標有關的偏嚮來源 434
19.4 測驗少數族群成員的其他方法 437
19.4.1 無知還是愚鈍 437
19.4.2 Chitling測驗 439
19.4.3 文化同質黑人智力測驗 440
19.4.4 多元文化多重評估係統 441
19.5 解決建議 444
19.5.1 道德關注與測驗偏嚮的界定 444
19.5.2 不同的思考:發現對數據的
新解釋 447
19.5.3 發展不同的效標 449
19.6 改變社會環境 451
19.7 小結 453
第20章 測驗與法律 456
20.1 控製測驗使用的法律 458
20.1.1 聯邦的權利 458
20.1.2 特彆法 464
20.1.3 不讓一個孩子掉隊 466
20.2 影響心理測驗的主要訴訟案件 467
20.2.1 早期的取消種族隔離案件 467
20.2.2 高等教育中的平權法案 480
20.2.3 人事案例 483
20.2.4 與美國殘疾人法案有關的案例 487
20.2.5 對條例的批判性思考 488
20.3 小結 489
第21章 心理測驗的倫理及未來 490
21.1 測驗領域的爭議 490
21.1.1 專業爭議 491
21.1.2 道德爭議 494
21.1.3 社會爭議 498
21.2 當前趨勢 500
21.2.1 新測驗的湧現 500
21.2.2 提高標準改進技術使之更加
客觀 501
21.2.3 更強烈的公眾意識及其影響 501
21.2.4 測驗的計算機化 502
21.2.5 互聯網上的測驗 503
21.3 未來趨勢 503
21.3.1 測驗領域的未來前景是大有
希望的 503
21.3.2 新的、改進測驗的湧現將繼續
下去 504
21.3.3 分歧、爭論和變化將持續下去 505
21.3.4 認知科學、計算機科學的整閤將
導緻測驗領域內的幾種革新 505
21.4 小結 505
附錄1 標準正態分布的麵積 507
附錄2 a=0.05和a=0.001時積差相關
係數R的臨界值(雙側檢驗) 509
附錄3 t臨界值錶 510
附錄4 教育中公平測驗應用準則 512
參考文獻 517
Contents
Part I: Principles
Chapter 1: Introduction 1
Basic Concepts 4
Overview of the Book 8
Historical Perspective 9
Summary 19
Chapter 2: Norms and Basic Statistics for Testing 20
Why We Need Statistics 20
Scales of Measurement 21
Frequency Distributions 24
Percentile Ranks 27
Percentiles 30
Describing Distributions 31
Norms 42
Summary 49
Chapter 3: Correlation and Regression 52
The Scatter Diagram 53
Correlation 54
Regression 55
Other Correlation Coefficients 65
Terms and Issues in the Use of Correlation 67
Multivariate Analysis (Optional) 71
Summary 76
Appendix 3.1: Calculation of a Regression Equation and a Correlation Coefficient 77
Chapter 4: Reliability 81
History and Theory of Reliability 82
The Domain Sampling Model 84
Item Response Theory 85
Models of Reliability 86
Reliability in Behavioral Observation Studies 94
Connecting Sources of Error with Reliability Assessment Method 97
Using Reliability Information 100
Summary 104
Appendix 4.1: Using Coefficient Alpha to Estimate Split-Half Reliability When the Variances for the Two Halves of the Test Are Unequal 105
Appendix 4.2: The Calculation of Reliability Using KR20 105
Chapter 5: Validity 107
Defining Validity 108
Aspects of Validity 109
Summary 126
Chapter 6: Writing and Evaluating Test Items 128
Item Writing 128
Item Analysis 139
Summary 149
Chapter 7: Test Administration 151
The Examiner and the Subject 151
Behavioral Assessment Methodology 161
Summary 164
Part II: Applications
Chapter 8: Interviewing Techniques 165
The Interview as a Test 168
Reciprocal Nature of Interviewing 168
Principles of Effective Interviewing 169
Types of Interviews 176
Sources of Error in the Interview 183
Summary 186
Chapter 9: Theories of Intelligence and the Binet Scales 188
The Problem of Defining Intelligence 188
Binet誷 Principles of Test Construction 190
Spearman誷 Model of General Mental Ability 191
The Early Binet Scales 193
Terman誷 Stanford-Binet Intelligence Scale 195
The Modern Binet Scale 199
Summary 204
Chapter 10: The Wechsler Intelligence Scales: WAIS-III, WISC-IV, and WPPSI-III 205
The Wechsler Intelligence Scales 206
From the Wechsler-Bellevue Intelligence Scale to the WAIS-III 208
Scales, Subtests, and Indexes of the WAIS-III 208
Interpretive Features of the Wechsler Tests 215
Psychometric Properties of the Wechsler Adult Scale 217
Evaluation of the Wechsler Adult Scales 218
Downward Extensions of the WAIS-III: The WISC-IV and the WPPSI-III 219
Summary 223
Chapter 11: Other Individual Tests of Ability in Education and Special Education 225
Alternative Individual Ability Tests Compared with the Binet and Wechsler Scales 226
Alternatives Compared with One Another 227
Specific Individual Ability Tests 228
Testing Learning Disabilities 242
Summary 249
Chapter 12: Standardized Tests in Education, Civil Service, and the Military 250
Comparison of Group and Individual Ability Tests 251
Overview of Group Tests 253
Group Tests in the Schools: Kindergarten Through 12th Grade 254
College Entrance Tests 259
Graduate and Professional School Entrance Tests 261
Nonverbal Group Ability Tests 268
Summary 274
Chapter 13: Applications in Clinical and Counseling Settings 275
Strategies of Structured Personality-Test Construction 277
The Logical-Content Strategy 279
The Criterion-Group Strategy 281
The Factor Analytic Strategy 291
The Theoretical Strategy 295
Combination Strategies 299
Frequently Used Measures of Positive Personality Traits 302
Future of Positive Personality Research 306
Summary 307
Chapter 14: Projective Personality Tests 309
The Projective Hypothesis 310
The Rorschach Inkblot Test 311
An Alternative Inkblot Test: The Holtzman 324
The Thematic Apperception Test 325
Alternative Apperception Procedures 329
Nonpictorial Projective Procedures 330
Summary 332
Chapter 15: Computers and Basic Psychological Science in Testing 334
Cognitive-Behavioral Assessment Procedures 335
Psychophysiological Procedures 346
Computers and Psychological Testing 347
Summary 357
Chapter 16: Testing in Counseling Psychology 359
Measuring Interests 360
Measuring Personal Characteristics for Job Placement 371
Summary 373
Chapter 17: Testing in Health Psychology and Health Care 374
Neuropsychological Assessment 374
Quality-of-Life Assessment 397
Summary 400
Chapter 18: Testing in Industrial and Business Settings 402
Personnel Psychology—The Selection of Employees 403
Base Rates and Hit Rates 404
Personnel Psychology from the Employee誷 Perspective: Fitting People to Jobs 415
Measuring Characteristics of the Work Setting 416
Job Analysis 420
Measuring the Person-Situation Interaction 422
Summary 425
Part III: Issues
Chapter 19: Test Bias 426
Why Is Test Bias Controversial? 426
Test Fairness and the Law 430
The Traditional Defense of Testing 431
Other Approaches to Testing Minority Group Members 437
Suggestions for Solutions 444
Changing the Social Environment 451
Summary 453
Chapter 20: Testing and the Law 456
Laws Governing the Use of Tests 458
Major Lawsuits That Have Affected Psychological Testing 467
Summary 489
Chapter 21: Ethics and the Future of Psychological Testing 490
Issues Shaping the Field of Testing 490
Current Trends 500
Future Trends 503
Summary 505
Appendix 1: Areas of a Standard Normal Distribution 507
Appendix 2: Critical Values of r for a = .05 and a = .01 (Two-Tailed Test) 509
Appendix 3: Critical Values of t 510
Appendix 4: Code of Fair Testing Practices in Education 512
References 517
· · · · · · (
收起)