Tests in Print

Tests in Print pdf epub mobi txt 电子书 下载 2026

出版者:
作者:Murphy, Linda L. (EDT)/ Impara, James C. (EDT)/ Plake, Barbara S. (EDT)/ Buros Institute of Mental M
出品人:
页数:1800
译者:
出版时间:1999-6
价格:$ 459.06
装帧:
isbn号码:9780910674515
丛书系列:
图书标签:
  • 测试
  • 评估
  • 教育测量
  • 心理测量
  • 学术研究
  • 参考工具
  • 图书目录
  • 专业测试
  • 心理学
  • 教育学
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

Customers who place a standing order for the Tests in Print series or the Mental Measurements Yearbook series will receive a 10% discount on every volume. To place your standing order, please call 1-800-848-6224 (in the U.S.) or 919-966-7449 (outside the U.S.). Designed to complement the" Mental Measurements Yearbooks," "Tests in Print" fills a pressing need for a comprehensive bibliography of all commercially available English language tests in print. Although these volumes are useful in and of themselves, their maximum usefulness requires the availability and use of the "Mental Measurements Yearbooks." Although information on available tests and specific test bibliographies is valuable, the greatest service which "Tests in Print" can perform is to encourage test users to choose tests more wisely by consulting the "MMY" test reviews, test reviews from journals, and the professional literature on the construction, use, and validity of the tests being considered. Although information on available tests and specific test bibliographies is valuable, the greatest service which "Tests in Print" can perform is to encourage test users to choose tests more wisely by consulting the "MMY" test reviews, the excerpted test reviews from journals, and the professional literature on the construction, use, and validity of the tests being considered. "Tests in Print V" contains information on over four thousand instruments. Along with a brief description, entries include population, scoring, pricing, publisher information, and a reference list of professional literature citing articles relevant to individual instruments. Indexes of titles, classified subjects, names, and scores, as well as a publishers directory and index are included, with notations for out-of-print instruments. Information is given for tests in a wide range of areas, including education, psychology, counseling, management, health care, career planning, sociology, personnel, child development, social science, and research. "Tests in Print V" also provides a comprehensive index to the "Mental Measurements Yearbook" by directing readers to the appropriate volume or volumes for reviews of specific tests.

《测试中的指南:探索心理测量学的边界》 图书简介 《测试中的指南:探索心理测量学的边界》并非一本关于特定测试手册的汇编,而是一部深刻剖析当代心理测量学理论、方法论进步与实践挑战的权威著作。本书旨在为教育、临床、工业组织心理学等领域的专业人士,以及对心理健康评估和能力测量抱有严谨态度的研究者,提供一个全面且批判性的视角,审视“测量”本身在复杂人类特质领域所面临的困境与机遇。 本书的核心焦点在于“测量的不确定性”与“应用的伦理”这两个互为表里的主题。在信息爆炸与技术飞速迭代的今天,我们比以往任何时候都更频繁地使用标准化工具来量化人类心智的构建(Constructs),但对这些工具的有效性、可靠性以及潜在的偏见审查却日益严苛。本书力求超越对单一测试的描述,深入探讨支撑这些测量的基本范式。 第一部分:范式的变迁与基础的重构 本部分将追溯心理测量学从经典测验理论(Classical Test Theory, CTT)向项目反应理论(Item Response Theory, IRT)乃至更现代的认知诊断模型(Cognitive Diagnostic Models, CDM)演进的完整轨迹。我们详细分析了CTT的局限性,尤其是在处理测试项目异质性和分数解释的局限性。 随后,本书深入剖析了IRT的三大核心优势:项目参数的独立性、测验信息函数(Test Information Function)的可视化,以及针对不同能力水平个体提供差异化信息的能力。我们不仅展示了如何应用两参数或三参数逻辑斯谛模型(2PL/3PL),更探讨了在低信度和高风险情境下,如何审慎地运用更复杂的混合效应模型(Mixed-Effects Models)来处理测试情境中的随机效应。 关键章节聚焦: 效度论的回归与扩展: 不再仅仅停留在内容效度、结构效度、效标效度这“三驾马车”的描述,而是将现代心理测量学的效度论框架(如Messick的整合效度观)置于社会正义和问责制的语境下进行再审视。重点讨论了如何利用结构方程模型(SEM)来检验复杂的理论结构与观察分数之间的关系,以及如何处理潜在变量与测量误差的交互作用。 测量不变性与跨文化应用: 随着全球化研究的深入,测试的跨文化适用性成为核心议题。本章详尽阐述了多群组分析(Multigroup Analysis)在检验测量不变性(Measurement Invariance)中的作用,从组间参照点(Reference Group)的选择到参数差异的精确量化,为跨文化研究者提供了严格的工具箱。 第二部分:适应性测试与大数据环境下的新挑战 本部分将目光投向技术前沿,探讨计算机化自适应测试(Computerized Adaptive Testing, CAT)对传统测试模式的颠覆性影响。我们细致地分析了CAT系统背后的算法逻辑——项目池的管理、信息最大化的项目选择策略,以及如何应对“项目暴露”和“项目池枯竭”的实际操作难题。 更为前沿的讨论集中在“认知诊断”领域。与传统测试仅提供一个能力总分不同,认知诊断模型(CDM)旨在揭示个体掌握特定知识点的“画像”。本书通过对DINA(Deterministic Inputs, Non-deterministic Outputs)模型、HMM(Hidden Markov Models)等模型的深入解析,展示了如何从诊断性评估中提取出对教学干预具有直接指导意义的信息。 本部分还关注了新兴的数据源与方法的融合: 反应时数据的整合: 在传统测验中,仅反应的对错被记录。但现代研究越来越重视反应时间(Response Time)作为认知资源分配和动机状态的有效指标。本书讨论了如何将反应时纳入IRT或贝叶斯模型中,以获得更全面的行为数据。 非结构化数据的测量: 随着自然语言处理(NLP)技术的发展,对开放式回答、论文写作甚至社交媒体数据的分析成为可能。本书批判性地评估了如何将这些“软数据”转化为可量化的指标,并探讨了其与传统测试信度之间的权衡。 第三部分:伦理、偏见与问责制 心理测量学的最高责任在于公正地评估个体,但工具本身并非价值中立。本书的第三部分是对评估实践中伦理困境的深刻反思。 偏见识别与矫正: 我们详细介绍了差异项目功能(Differential Item Functioning, DIF)的检测方法,从卡方检验到更稳健的似然比检验。但本书更进一步,探讨了DIF的来源——是真正的测量偏见,还是潜在能力结构在不同群体间的差异体现?我们强调,仅仅识别统计学上的DIF是不够的,必须结合背景知识进行审慎的理论解释。 信度与效度的社会影响: 探讨了高风险测试(High-Stakes Testing)的社会后果,包括分数误用(Misinterpretation)和对教育机会分配的影响。我们分析了在资源分配或资格认定中使用概率模型时,如何量化和沟通决策的风险边界。例如,在面对能力分布重叠的群体时,任何基于测试分数的二元分类(通过/不通过)都必然伴随着可接受的假阳性与假阴性率,这要求测试设计者承担起更重的社会责任。 评估的透明度与可解释性(Explainability): 随着模型复杂性的增加(例如,深度学习在评分中的应用),测试结果的可解释性成为了一个关键的伦理问题。本书强调,一个“高科技”的测量模型如果不能被用户和受测者理解其决策逻辑,那么它在伦理上就存在缺陷。我们呼吁回归到对基本假设的清晰陈述,确保任何测量工具的输出都是可被论证和质疑的。 结语:面向未来的测量蓝图 《测试中的指南:探索心理测量学的边界》总结了从理论基础到前沿应用的完整图景,强调了心理测量学并非静态的学科,而是与社会需求、技术进步和伦理思辨不断互动、持续进化的科学。本书提供给读者的,不是一套即插即用的测试方案,而是一种审慎、批判和负责任的测量思维模式,以应对未来人类行为与心智复杂测量的挑战。它要求从业者在追求精度的同时,永远将公平性置于核心考量。

作者简介

目录信息

读后感

评分

评分

评分

评分

评分

用户评价

评分

这本厚厚的《Tests in Print》实在是让我有点摸不着头脑,说实话,我本来是想找一本关于如何高效进行软件测试的书籍,毕竟工作需要,希望能从中学习到一些实用的技巧和框架。然而,当我翻开第一页,映入眼帘的却是密密麻麻的、看起来像是某种学术文献的列表和描述。我花了好大力气才弄明白,这似乎是一个专门收录和索引各种心理测量学测试(比如智力测试、人格评估、教育成就测试等等)的工具书,而不是我期待的那种IT领域的测试指南。这让我感到非常沮丧,毕竟我为这本书付出的时间和金钱,并没有换来我真正需要的那种知识。我仔细阅读了其中的一些条目介绍,它们详细列出了测试的编制者、出版年份、适用人群以及一些统计学特性,但对于如何**设计**、**执行**或**优化**一个软件测试流程,几乎没有任何指导。它的结构更像是一个图书馆的目录,而不是一本操作手册。如果你是心理学、教育测量学或者人力资源评估领域的研究者,这本书可能价值连城,但对于一个软件工程师来说,它就像一个美丽但完全无法用于建筑的砖块集合。我花了整整一个下午,试图在其中找到哪怕一丝与“软件”或“计算机科学”相关的术语,结果徒劳无功。这份“印刷品”的索引的深度令人印象深刻,但其内容焦点与我的职业方向完全背道而驰,这真是一次令人啼笑皆非的误解。

评分

从装帧和排版的角度来看,这本《Tests in Print》无疑是严肃且权威的,它散发着一种厚重的学术气息,似乎在向读者保证其内容的可靠性和经过时间检验的价值。但是,这种权威感和我的实际需求产生了剧烈的反作用力。我需要的是一个动态的、能够适应快速迭代环境的测试方法论,是那种可以被立即应用于敏捷开发周期中的实用指南。这本书提供的一切,都显得过于静态和历史化。它描述的测试大多需要耗费数小时甚至数天才能完成,且依赖于人工的、面对面的干预。这与现代软件测试追求的自动化、并行化和持续集成(CI/CD)的理念简直是南辕北辙。我翻阅了其中关于“信度分析”的部分,虽然统计学方法本身是严谨的,但我更关心的是如何用最小的成本快速验证一个新功能是否引入了新的漏洞,而不是花费数月时间去证明一个评估工具的内在一致性。如果说这是一本“测试”之书,那它显然是对现代技术测试领域的一种彻底的“缺席声明”。它更像是某个历史系学者对过去一个世纪人类评估工具的百科全书式记录,而非我们技术人员可以拿来立竿见影的实战宝典。

评分

阅读这本《Tests in Print》的过程,对我来说,更像是一场关于“语义学陷阱”的深刻教训。我本以为“测试”一词可以泛指一切形式的检验和验证,但这本书明确地将范围界定在了心理测量学和教育评估的狭窄领域。书中的语言充满了专业术语,比如“效度系数”、“项目反应理论”等等,这些术语的密度极高,要求读者对量表设计规范有着深入的了解。我试图从中提炼出一些关于系统验证的通用原则,比如如何排除系统性偏差,但所有的例子都围绕着人类受试者的主观性展开,这使得知识迁移变得极其困难。这本书的“价值”在于其全面的性——它似乎收录了某个时间点上所有重要的、已出版的评估工具。但对于一个寻求提高代码质量和系统鲁棒性的技术人员而言,这份“全面性”不过是冗余信息的堆砌。我甚至开玩笑地想,如果我把这本书扔给我的前端同事,他可能会以为这是某个奇怪的字体测试手册。它需要的配套阅读材料不是编程语言手册,而是统计学教科书。总而言之,它的内容重量级,但它承载的知识方向与我的目标完全偏离,最终的结果是,我必须寻找另一本真正能指导我进行技术测试的书籍。

评分

这本《Tests in Print》的阅读体验,堪称一次极端的“期望落差”。我原本寄希望于它能提供一个关于“如何系统化地验证假设和结果”的普适性方法论,因为在我看来,无论测试的对象是人还是软件,其背后的逻辑框架都应该有相通之处。我尤其关注那些关于“测量误差”和“偏差控制”的章节,这些概念在任何形式的质量保证中都是至关重要的。然而,这本书里的“误差”讨论,全部集中在受试者的主观反应、环境干扰,以及量表设计本身的内在缺陷上。它对技术系统中的随机错误、并发问题或是代码缺陷的描述,采取了一种近乎“视而不见”的态度。我试图去寻找关于“测试覆盖率”或“回归测试策略”的对应物,但收获的只是关于不同版本的智力测验在不同文化背景下的“样本等效性”的冗长论述。这本书的叙事节奏极其缓慢,充满了脚注和引用,阅读起来需要极大的耐心和专注力,但这份专注力换来的却是知识领域的错位。它需要读者拥有一个特定的、高度专业化的背景知识储备,否则,阅读过程中的挫败感会不断累积,你只会感觉自己在努力消化一堆与自己无关的数字和名词。

评分

说实话,拿到这本书的时候,我几乎是带着一种朝圣般的心情,毕竟“Print”这个词汇在专业语境下总能勾起人们对于传统、扎实基础知识的敬畏。我满心期待的是能看到一些关于测试设计原则,例如等价类划分、边界值分析这些经典理论如何在新兴技术浪潮下得到继承和发扬的深刻探讨。然而,这本书的“深度”似乎完全走偏了方向。它的篇幅巨大,装帧也颇为正式,但内容却像是时间胶囊,里面塞满了上世纪中期到后期的各种评估工具的档案。我尝试用它来辅助我最近负责的一个复杂系统集成测试的准备工作,希望能找到一些通用的、跨领域的质量保证框架。结果呢?我找到的都是关于“幼儿认知发展量表”或者“职业兴趣倾向调查表”的详细记录。这些记录的详尽程度简直令人咋舌,精确到了试题的编号和信效度系数,但这些数据对我来说毫无意义,就像在沙漠里给你一本关于深海捕鱼的专业指南。我甚至开始怀疑,编纂者是否对“Tests”这个词的定义抱有一种极为狭隘和古典的理解。这本书更像是一个历史博物馆的藏品清单,而不是一本可以指导现代实践的工具书。它没有提供任何关于如何构建自动化测试脚本的思路,也没有关于性能瓶颈分析的案例,纯粹是学术性的、偏重于社会科学测量的文献汇编。

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有