量表编制:理论与应用(原书第3版) pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:重庆大学出版社

作者:罗伯特·F.德威利斯 (Robert F.DeVellis)

出品人:

页数:218

译者:席仲恩

出版时间:2016-10-1

价格:34.00元

装帧:平装

isbn号码:9787568901727

丛书系列:万卷方法

图书标签:

量表
社会学
测量学
心理测量
心理学
研究方法
案例
Statistics
量表编制
心理测量
统计学
问卷设计
研究方法
社会科学
数据分析
信效度
测量理论
调查研究

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

本书揭开社会测量的神秘面纱，联系常人的生活经历强调对测量概念的理解，弱化对测量的严格数学定义。全书分为7章，从测量的历史渊源、潜变量、量表的信度和效度、量表的编制步骤等多个方面讲解如何编制出有效、好用的量表。

探究量表编制的奥秘：理论基石与实践指南量表，作为衡量心理、社会、教育及其他领域复杂概念的有力工具，其科学性和有效性直接关乎研究结果的可靠性与应用价值。本书《量表编制：理论与应用》并非一本简单的操作手册，而是深入剖析了量表编制背后深邃的理论框架，并以详实的案例和清晰的步骤，指导读者掌握从概念界定到最终量表形成的完整流程。它不仅是心理测量学领域经典理论的集大成者，更是面向所有希望创建、优化或理解量表的研究者、教育工作者、临床工作者以及政策制定者的权威指南。理论基石：构建严谨的量表测量体系本书的首要篇幅致力于构建量表编制的理论基石，为后续的实践操作奠定坚实的学术基础。作者首先带领读者深入理解“测量”的本质，探讨心理与社会现象如何能够被量化，以及不同测量尺度（定类、定序、定距、定比）的特性与应用场景。这部分内容至关重要，它帮助读者认识到，量表编制并非主观臆断，而是一个严谨的科学过程，其有效性建立在对概念的清晰界定和对潜在误差的控制之上。随后，本书详细阐述了信度与效度这两个量表编制的核心概念。信度，即测量的稳定性与一致性，本书将从不同维度进行解读，包括重测信度、复本信度、内部一致性信度（如克朗巴赫系数、折半信度）以及评分者信度。读者将学习如何设计实验来评估和提高量表的信度，并理解不同信度指标所代表的意义，例如，高信度意味着在重复测量时，个体得分的变化更多地归因于真实的个体差异，而非测量工具本身的不稳定。效度，即测量工具是否真正测量到了它声称要测量的概念，本书则将其分解为多种类型，并提供了详尽的检验方法。内容效度强调量表项目是否充分覆盖了目标构念的各个方面，这通常需要专家审议和理论分析。效标效度则关注量表得分与外部效标（其他已建立的测量工具或实际行为表现）之间的关联性，包括同时效度（与当前效标的关联）和预测效度（与未来效标的关联）。构念效度作为最高层次的效度，则探讨量表是否能准确地测量理论上的抽象构念，本书将深入讲解区分效度（测量不同构念的能力）和聚合效度（测量相同构念的相似性），以及如何通过因素分析等统计技术来支持构念效度的论证。读者将明白，一个高信度的量表不一定具有高效度，但高信度是高效度的必要条件。除了基础的信度与效度，本书还探讨了测验公平性（test fairness）和项目反应理论（Item Response Theory, IRT）等更高级的理论。测验公平性关注量表是否对不同群体（如不同性别、种族、文化背景）具有公正的测量结果，避免出现系统性偏差。项目反应理论则提供了一种更为精细的测量模型，能够更准确地评估被试的潜在特质水平，并对项目本身的难度、区分度和猜测参数进行建模，这为量表的设计和优化提供了更强大的技术支持。实践指南：从构思到落地的量表开发流程在牢固掌握了理论基础之后，本书的核心价值在于其系统而详尽的量表编制实践指南。作者清晰地勾勒出从零开始开发一个量表的完整流程，每个步骤都辅以丰富的案例分析和可操作的建议。第一步：明确研究目的与概念界定。量表编制的起点在于清晰地定义研究问题以及需要测量的核心概念（构念）。本书会指导读者如何将模糊的心理社会现象转化为具体、可操作的构念，并探讨构念的层次性（如高层概念与低层概念）以及维度结构。例如，如果研究目的是测量“工作满意度”，那么就需要进一步明确工作满意度的具体维度，如薪酬满意度、工作内容满意度、同事关系满意度等。第二步：文献回顾与理论框架构建。在概念界定之后，详细的文献回顾是必不可少的。本书强调通过梳理现有研究，了解已有关于该构念的定义、测量方法和相关理论，从而构建一个初步的理论框架。这有助于避免重复劳动，并为后续的项目编写提供理论依据。第三步：项目编写与草案形成。这是量表编制过程中最核心的创意环节。本书提供了详尽的项目编写原则，包括语言的清晰性、避免引导性问题、选择合适的题型（如李克特量表、等级量表、选择题等）以及控制项目数量。作者会分享各种实用的技巧，如从理论推导、已有量表改编、专家访谈或焦点小组讨论中提取项目。同时，还会强调项目之间的区分度，避免冗余和含义重叠的项目。第四步：预试与项目筛选。编制出的项目草案需要通过预试来检验其初步的有效性。本书详细介绍了预试的设计，包括样本选择、施测过程以及数据收集。在预试数据收集后，作者将指导读者如何对项目进行初步筛选，运用统计方法（如项目难度、项目区分度分析、信度分析）来识别和剔除不合格的项目，保留最能有效测量构念的项目。第五步：正式施测与信效度检验。经过项目筛选后，形成初步的量表版本，需要进行正式施测，并进行严谨的信效度检验。本书将详细介绍如何设计正式施测的样本，并重点讲解如何运用各种统计分析技术来评估量表的信度和效度。这包括但不限于：信度分析：计算内部一致性信度（Cronbach's alpha）、重测信度等。效度分析：内容效度：通过专家评审进行评估。效标效度：通过与相关效标的测量进行相关性分析。构念效度：运用因素分析（探索性因素分析EFA和验证性因素分析CFA）来检验量表的维度结构，以及计算聚合效度和区分效度。本书会深入讲解因素分析的原理、实施步骤和结果解释，帮助读者理解量表内部各项目之间的关系，以及它们是否能清晰地归属于预期的维度。第六步：量表修订与标准化。基于信效度检验的结果，对量表进行必要的修订，包括删除、修改或增加项目，并可能需要进行多轮的迭代。最终，当量表达到理想的信效度水平后，需要对其进行标准化，建立常模，为量表的广泛应用奠定基础。这部分内容会涉及如何选择和处理常模样本，以及如何计算标准分数（如Z分数、T分数），使得不同个体得分能够具有可比性。第七步：量表的应用与伦理考量。本书的最后一部分强调了量表的实际应用，并对其使用过程中涉及的伦理问题进行了讨论。这包括量表的报告规范、解释量表结果的注意事项、以及在不同研究和实践领域（如临床诊断、教育评估、人力资源管理）中的具体应用策略。同时，作者也提醒读者，量表并非万能，其应用需要结合具体情境，并始终关注被试的权利与尊严。谁将受益于本书？《量表编制：理论与应用》适用于广泛的读者群体。学术研究者：无论是心理学、教育学、社会学、医学还是管理学领域的博士生、硕士生和教授，只要涉及测量研究，本书都是不可或缺的参考。它将帮助他们设计出高质量的研究工具，从而提升研究的科学性和影响力。教育工作者与评估专家：在教育领域，教师和评估专家需要编制各种测验和问卷来评估学生的学习效果、教师的教学质量或课程的有效性。本书提供了科学的方法论，帮助他们设计出公平、有效、可靠的评估工具。临床工作者与咨询师：心理治疗师、咨询师和精神科医生常常需要使用量表来评估患者的心理健康状况、诊断疾病、监测治疗进展。本书将帮助他们更深入地理解所使用的量表的原理，甚至为他们提供开发定制化评估工具的思路。人力资源与组织发展专家：在企业招聘、员工绩效评估、人才发展等领域，量表扮演着重要角色。本书将为他们提供科学依据，设计出更精准、更有效的选拔和评估工具，从而优化人才管理。政策制定者与社会科学家：在进行社会调查、政策评估时，高质量的量表是获取真实数据的关键。本书能帮助他们理解如何设计和评估用于大型调查的测量工具，从而做出更明智的决策。总而言之，《量表编制：理论与应用》是一本集理论深度与实践指导于一体的力作。它不仅系统地梳理了量表编制的科学原理，更以严谨的逻辑和丰富的实例，为读者提供了一条清晰、可行的量表开发之路。阅读本书，将使您对量表的科学性有更深刻的认识，并掌握创建、选择和解读量表的必备技能，从而在您的研究与实践领域取得更卓越的成就。

作者简介

罗伯特•F.德威利斯

美国北卡罗来纳大学教堂山分校公共卫生学院卫生行为和卫生教育系教授。拥有30多年的关于心理和社会测量的实践经验。他是美国国立卫生研究院《患者结局报告测量信息系统》路线图项目中的活跃分子。他曾担任过美国心理学协会第38分会心理卫生分会的理事，参加过美国关节炎基金会临床/结局/治疗研究组的工作，参加过美国老兵事务测量计划。此外，他还担任过《关节炎护理与研究》学刊的副主编以及二十几本学术刊物的客座主编、客座副主编、审稿人等。目前，德维利斯博士的研究兴趣有：配偶及其他亲密关系对病情的不良影响，与健康和病情有关的社会变量及行为变量的测量。

席仲恩

重庆邮电大学教授，主要从事心理测验和教育测量研究、翻译理论与翻译教学研究、国际学术论文写作规范与教学研究等工作，有丰富的学术翻译、学术写作、以及论文润色和修改经验。关于心理测验和教育测量，席博士近期的主要研究兴趣是其中的计量学原理。

杜珏

重庆邮电大学教师，主要从事语言测试和外语教学研究。

目录信息

1概貌
测量概述
社会科学中的测量史源
几个早期的例子
统计方法的出现和智力测验的作用
心理物理学的作用
测量的后继发展
基本概念的演进
智力测验的演进
心理统计方法领域的扩展
测量在社会科学中的作用
理论与测量的关系
理论量度与非理论量度
量表
量表并非个个造来平等
劣质测量的代价
小结与预览
2解读潜变量
构念及其量度
作为项目得分假设原因的潜变量
路径图
图示约定
量表编制过程中的路径图
测量模型的进一步讨论
经典测量模型的假定
平行测试
其他模型
3信度
基于方差分析的方法
连续值项目与二值项目
内部一致性
阿尔法系数
协方差矩阵
多项目量表的协方差矩阵
阿尔法系数与协方差矩阵
另外一个阿尔法系数公式
对阿尔法系数的批评
基于量表分数相关程度的信度
信度系数的复本进路
信度系数的折半进路
信度系数的项目成绩标准化进路
评分者间一致性
信度系数的历时进路
信度系数与统计力度
概化理论
4效度
内容效度
效标关联效度
效标关联效度与正确性
构念效度
构念效度与效标关联效度的区别
相关系数的衰减
相关系数多高才算展现了构念效度
多特质一多方法矩阵
表面效度又是怎么回事儿
5量表编制指南
第1步：明确你到底要测量什么
理论有助于明确所测内容
特定性有助于明确所测内容
明确量表应包括的内容
第2步：建立一个项目池
选择反映量表目的的项目
项目冗余
项目数量
开始编写项目
优良项目与劣质项目的特性
正面表述的项目与负面表述的项目
小结
第3步：决定项目形式
瑟斯顿治标法
古特曼治标法
由等权项目构成的量表
备择反应选项的最佳个数
反应形式的具体类型
第4步：请专家评审最初项目池中的项目
第5步：考虑把效验性项目包括进去
第6步：在样本身上施测项目
第7步：评价项目
对项目表现情况的初步检查
因素分析
阿尔法系数
第8步：优化量表长度
量表长度对信度的影响
“差”项目对量表的影响
调整量表长度
分裂样本
6因素分析
因素分析概貌
因素分析概念类比
因素分析的概念
提取因素
因素旋转
因素解释
主成分与共同因素
成分与因素的异同
确认性因素分析
量表编制中因素分析的使用
样本大小
7项目反应理论概述
项目难度
项目区分度
猜测度
项目特征曲线
IRT应用于多反应项目
IRT的复杂性
8广阔研究背景下的测量
编制量表之前
寻找现存工具
在受测总体背景下审视构念
决定量表的施测模式
在其他量表或程序的背景下考虑所开发量表
量表施测之后
数据分析
数据解释
概括性
最后的思考
参考文献
附录：现行效度理论的外延和内涵
序言
布赫瓦尔德（Buchwald，2006）在其关于测量结果偏差及其对知识的影响的评论中指出，在1660年代后几年和1670年代前几年，还是二十几岁的艾萨克•牛顿就显然首次使用了平均多次观测结果的方法。牛顿的目的是，在自己关于天文现象的观察值之间有差异时，用各次观测结果的平均值代表观测结果，以得到一个更为准确的测量结果。有趣的是，牛顿在其原初报告中并没有记述自己使用平均值这一做法，而且一直隐瞒了几十年。这一隐瞒，与其说是学术诚信问题，不如说是当年人们对于误差及其在测量中作用理解的局限问题。在评论另一位近代天文学家隐瞒自己观测结果的偏差时，艾尔德（Alder，2002）指出，即使到了1700年代后期，隐瞒观测结果偏差这一做法“不仅普遍，而且被看作智者的特权；而把误差却看作道德的欠失”（P. 301）。
在1600年代晚期和1700年代早期，需要对自然现象进行系统观测的科学家当中不仅有天文学家，还有其他方面的。1660年代，在根据英格兰罕不什尔郡的洗礼及葬礼记录编制当地的出生率和死亡率时，约翰•格朗特（John Graunt）就使用了平均值（这种方法现在已不常用）来总结自己的发现。根据布赫瓦尔德（Buchwald，2006）的记述，格朗特使用平均值的动机，是要捕获住那瞬息可变的“真”值。当时他的想法是，出生率与死亡率之比遵循某种自然法则，但是，那些发生在任何一个年度的不可预测事件可能会掩盖那一基本事实。这种关于观察是通往自然真理的有缺陷窗口的观点间接表明，当时人们对于测量的看法已经变得越来越成熟：除了观察者的局限之外，其他因素也可能败坏经验信息；因此，对观测值的适当调整处理，可能会更准确地反映出所感兴趣自然现象的真实情况。
尽管有这些早期的洞见卓识，但只是在牛顿首次使用平均值一个世纪之后，科学家才开始广泛地认识到，凡测量皆有误差，平均值能使该误差降到最小（Buchwald，2006）。根据物理学家及科普作家列纳德•蒙洛迪诺（Leonard Mlodinow, 2008）记述，在18世纪后期和19世纪早期，天文学和物理学的发展，迫使当时的科学家更加系统地对待随机误差问题，因此也导致了数理统计学科的诞生。到了1777年时，丹尼尔•伯努利（更著名的雅克布•伯努利的侄子）对天文观测结果的分布和射箭飞行轨迹的分布进行了对比发现，两者都是围绕着某个中心分布，距中心越近分布的密度越大，距中心越远分布的结果越稀少。尽管说关于该观察结果的理论处理在某些方面是错误的，但它标志着对测量误差进行形式分析的开始（Mlodinow, 2008）。布赫瓦尔德（Buchwald，2006）指出，18世纪的这种对于测量误差的解读，存在一个基本缺陷。那就是，未能区分随机误差和系统误差。直到19世纪初，人们才更深刻地理解了随机性问题。随着人们对随机性理解的加深，测量也有了长足的进展。随着测量的发展，科学也向前迈进了一步。
文摘
版权页：
是的，语法结构相似或其他表面特征相似可能造成我们所不想要的内容上的相似。那些与拟测构念并不完全无关的冗余，在有些情况下也会带来一些问题。在一组项目中，如果某些项目与其他项目在特定性方面存在差异，这样就会带来问题。举个例子来说明一下。假想有一个要用来测量宠物爱好者态度的量表工具。这个量表可能包括多种不同的项目。之外的其他项目虽然与我们所感兴趣的构念有关，但是由于太具体，因此也太冗余，而不能发挥作用。“非洲灰鹦鹉爱好者心地善良”和“我认为喜欢非洲灰鹦鹉的人是好人”这两个项目太相似了，其原因不仅仅是因为它们的语法结构相似，还因为两者有潜在的关联性，更因为两者明显共享着同样的具体内容。这样的项目可能使全体项目在总体上偏离我们旨在测量的潜变量（即，对于宠物爱好者的态度），而偏向另外一个更为具体的潜变量（即，对于非洲灰鹦鹉爱好者的态度）。由于宠物种类繁多，两个关于某具体且不常见宠物的项目，就显得扎眼地相似，因此很可能毁坏我们编制该量表工具的初衷。
更一般地，构念的笼统性和具体性程度可能会改变冗余性的影响程度。虽然这个非洲灰鹦鹉例子有点极端，在量表中包括那些与旨测构念特定性不匹配的项目，在一些没有上例那么极端的场合中是可能发生的。例如，在一个设计用来全方位测量情感的量表里，如果有几个关于焦虑的项目，这就会带来问题。这几个关于焦虑的项目之间的相关程度，可能会高于这几个项目分别跟其他非关于焦虑的项目之间的相关。结果，这几个项目就会在所有关于情感这些广阔的项目中间，形成一个关于焦虑这一特定情感的小聚团儿。这会引起一系列的问题。首先，这会摧毁量表的单维性（如果研究者旨在编制一个测量单维变量的量表，这就构成了问题）。其次，这会造成一个不想要的聚焦点，结果会是那些更像关于焦虑问题的项目显得比其他项目表现更好。
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

语言风格的差异性让我阅读体验极差，仿佛是几个不同背景的作者拼凑起来的一本书。前半部分，尤其是关于理论基础的章节，语言严谨、逻辑清晰，充满了严谨的学术气息，每一个论证都小心翼翼，生怕出错，读起来需要高度集中注意力。但是，一进入到具体的操作步骤或者软件应用的部分，语气突然变得非常口语化，甚至出现了一些带有强烈个人色彩的断言，缺乏应有的客观性和规范性。这种风格的剧烈跳跃，使得读者在处理信息时必须不断地进行“模式切换”。一会儿是沉重的学术论述，一会儿是轻松的“小贴士”，让人很难保持一个连贯的思维流。此外，书中术语的使用也不够一致，同一个概念在不同章节有时使用不同的英文缩写或中文表述，这在高度依赖精确术语的测量学领域，是一个严重的疏忽，极大地增加了理解的难度和误读的风险。

评分☆☆☆☆☆

这本书的案例分析部分简直是形同虚设，完全无法提供我所需要的实践指导。作者提供的所有“范例”，都建立在一些高度理想化、数据完美正态分布的假设情境下。现实中的量表编制，充满了各种遗漏值、异常值、文化差异带来的偏差，以及样本代表性不足的困境。然而，在书中对这些“脏数据”的处理，几乎是零提及。我尤其想知道，当一个潜在大维度因子载荷在0.35而不是期望的0.5以上时，到底该如何取舍项目？书中对此没有给出任何建设性的讨论，只是一味地展示了“成功”的、数据拟合得近乎完美的例子。这种单向度的展示，极大地削弱了本书的工具书价值。如果我是一个初学者，我会被这些过于美好的案例误导，以为量表编制是一条平坦大道。对于那些真正需要面对复杂数据挑战的硕士或博士研究生来说，这本书提供的帮助微乎其微，它更像是一份“教科书式的展示”，而非“实验室中的实操指南”。

评分☆☆☆☆☆

这本书的排版和装帧简直是灾难，纸张的质感非常粗糙，拿到手里就能感觉到廉价感，完全对不起它在专业书籍里不算低的定价。内页的字体大小不一，有的地方像是扫描后强行拉伸过一样，边缘模糊不清，阅读起来非常吃力。更别提那些图表和公式，简直是排版事故的重灾区，线条错位、数据重叠，很多关键信息根本无法准确识别。我花了大量时间去猜测作者到底想表达什么，而不是专注于理解内容本身。这种制作水准，让人不禁怀疑出版社是否对“学术书籍”这个概念有什么误解，或者仅仅是把读者当成了可以敷衍的受众。如果只是想随便翻阅一下，也许可以忍受，但对于需要反复研读、反复查阅的专业人士来说，这样的实体书简直是一种折磨。我甚至考虑是不是应该去买电子版，哪怕电子版的阅读体验也可能因为内容质量而大打折扣，但至少在清晰度上可能略胜一筹。这本书的硬件条件，绝对是劝退读者的第一道坎。

评分☆☆☆☆☆

这本书的内容组织结构显得有些散乱和过时。它试图涵盖从基础理论到具体操作的方方面面，但由于跨度太大，很多关键概念的深入探讨都被一笔带过，显得浮于表面。比如在谈论信效度检验时，它用了大量的篇幅去解释一些非常基础的统计学概念，而对于当代量表编制中越来越重要的项目反应理论（IRT）的实际应用，介绍得却异常简略，甚至有些概念的阐述带着明显的时代烙印，缺乏对近十年量表发展趋势的关注。感觉作者的知识体系更像是停留在上一个世纪末期，虽然打下了基础，但对于现代心理测量学和教育测量学的前沿动态，几乎没有涉猎。我期待的“应用”部分，更多的是停留在“如何填写表格”的层面，而非“如何根据数据驱动决策”的策略层面。对于有一定经验的研究者来说，这本书的价值更多是作为一个“基础名词解释词典”，而非一个能够指导复杂研究的实战手册。我不得不频繁地在外部寻找更前沿的文献来补充这些知识盲区。

评分☆☆☆☆☆

本书的翻译质量实在令人不敢恭维，简直是信达雅的全面崩塌。很多技术名词的直译生硬到令人发指，完全没有考虑到其在中文测量学界公认的习惯用法。例如，某个关键的“construct validity”的翻译，如果按照上下文理解应该是“结构效度”，但在书中却被直译成了非常拗口的“构造有效性”，让原本就晦涩的概念更加难以理解。更糟糕的是，一些关键的句子，明显是把英文的语序和句式直接搬了过来，导致中文表达极其不自然，甚至出现语法错误，需要读者花费极大的精力去逆向还原它最初想表达的英文原意。专业书籍的翻译，理应做到“忠实于原文的科学内涵，符合目标语言的表达习惯”，但这本书的翻译显然只做到了第一点，并且完成得也不算好，而完全忽略了第二点。对于非母语是英语的读者来说，这本书的翻译质量无疑是雪上加霜，使得学习效率直线下降。

评分☆☆☆☆☆

挺好的，很實用，介於操作手冊和理論概論之間的小工具書，非常適合像我這樣的需要編制量表但是對理論和實操一無所知的小白，工作中可以隨時借鑒。

评分☆☆☆☆☆

翻译有待改进。

评分☆☆☆☆☆

翻译有待改进。

评分☆☆☆☆☆

翻译有待改进。