Probability Models for DNA Sequence Evolution

Probability Models for DNA Sequence Evolution pdf epub mobi txt 电子书 下载 2026

出版者:Springer Verlag
作者:Durrett, Richard
出品人:
页数:248
译者:
出版时间:2002-1
价格:$ 95.99
装帧:HRD
isbn号码:9780387954356
丛书系列:Probability and its Applications- A Series of the Applied Probability Trust
图书标签:
  • 数学
  • DNA序列进化
  • 概率模型
  • 生物信息学
  • 分子进化
  • 数学建模
  • 统计遗传学
  • 序列分析
  • 进化生物学
  • 计算生物学
  • 马尔可夫模型
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

Our basic question is: Given a collection of DNA sequences, what underlying forces are responsible for the observed patterns of variability? To approach this question we introduce and analyze a number of probability models: the Wright-Fisher model, the coalescent, the infinite alleles model, and the infinite sites model. We study the complications that come from nonconstant population size, recombination, population subdivision, and three forms of natural selection: directional selection, balancing selection, and background selection. These theoretical results set the stage for the investigation of various statistical tests to detect departures from "neutral evolution." The final chapter studies the evolution of whole genomes by chromosomal inversions, reciprocal translocations, and genome duplication.Throughout the book, the theory is developed in close connection with data from more than 60 experimental studies from the biology literature that illustrate the use of these results. This book is written for mathematicians and for biologists alike. We assume no previous knowledge of concepts from biology and only a basic knowledge of probability: a one semester undergraduate course and some familiarity with Markov chains and Poisson processes. Rick Durrett received his Ph.D. in operations research from Stanford University in 1976. He taught in the UCLA mathematics department before coming to Cornell in 1985. He is the author of six books and 125 research papers, and is the academic father of more than 30 Ph.D. students. His current interests are the use of probability models in genetics and ecology, and decreasing the mean and variance of his golf.

《DNA序列演化概率模型》:内容概述与精要解读 本书旨在深入探讨和解析用于描述DNA序列在生命演化过程中变异和漂移的各类数学与统计模型。全书的叙事逻辑清晰,结构严谨,从基础的随机过程理论出发,逐步过渡到复杂的分子演化动力学框架,为读者构建了一个全面而深入的理论基石。 第一部分:基础理论的奠基 本书的开篇部分(通常涵盖前三章左右)专注于建立理解DNA序列演化所需的数学和概率论基础。这部分内容并非简单地复述标准教科书知识,而是着重于提炼和应用与生物信息学和分子进化高度相关的核心概念。 首先,随机过程基础被详细阐述。这包括对马尔可夫链(Markov Chains)的深入讨论,特别是离散时间马尔可夫链(DTMC)及其在模拟固定长度序列上的点突变过程中的应用。读者将学习如何构建和分析状态空间——即所有可能的DNA序列构型——的转移概率矩阵。重点分析了平衡分布的收敛性质,这在推断长期演化趋势时至关重要。 紧接着,连续时间马尔可夫链(CTMC)的引入是本部分的核心贡献之一。这部分详尽地介绍了瞬时速率矩阵(Infinitesimal Generator Matrix,Q-matrix)的构建,特别是针对不同核苷酸(A, T, C, G)之间的转换速率模型。这里详细讨论了Jukes-Cantor模型(JC69)作为最简化的统一速率模型,并引入了Kimura双参数模型(K80),后者区分了过渡(Transition)和颠覆(Transversion)的速率差异。对这些基础模型的数学推导和参数估计方法的讲解,为后续的复杂模型铺平了道路。 第二部分:核心演化模型的建立与检验 第二部分(约占全书篇幅的40%)进入本书的核心领域,即构建和应用更贴近生物实际的序列演化模型。 核苷酸替代模型(Nucleotide Substitution Models)的构建是本部分的重中之重。作者系统地介绍了从JC69到K80,再到更具包容性的GTR(General Time Reversible)模型的演进路径。GTR模型被完整地推导,展示了其如何通过六个速率参数来描述任意两个核苷酸之间替换的可能性。书中不仅展示了如何计算任意两个序列在给定时间 $t$ 内的累积替换矩阵 $P(t)$,还深入探讨了如何利用实际观测到的序列数据来估计这些速率参数,通常采用最大似然(Maximum Likelihood, ML)的方法。 一个重要的章节专门用于讨论碱基组成不平衡(Base Composition Heterogeneity)的处理。现实中,基因组的A/T/C/G比例往往不均匀,本书详细介绍了如何将碱基频率 $pi = (pi_A, pi_T, pi_C, pi_G)$ 纳入模型框架,并讨论了例如F81(Felsenstein 1981)模型等如何解决这一问题。 此外,对速率异质性(Rate Heterogeneity)的建模也占据了显著篇幅。自然选择和功能约束导致不同位点(sites)的演化速率不同。本书细致讲解了如何使用Gamma分布($Gamma$ distribution)来描述这种速率差异,例如Hasegawa-Kishino-Yano (HKY) 模型在结合了速率异质性后的扩展形式,以及引入Rate Variation的General Time Reversible $Gamma$ (GTR-$Gamma$) 模型。书中对如何将这些模型与期望最大化(EM)算法相结合进行参数估计进行了详尽的算法描述。 第三部分:从位点到基因组尺度的扩展 本书的后半部分着眼于将单一核苷酸替换模型扩展到更宏观的演化层面,涉及氨基酸序列、基因家族和多基因组的比较。 氨基酸替代模型的讨论是此部分的关键。由于20种氨基酸之间的化学性质和保守性存在巨大差异,简单的对称替换假设不再成立。本书系统地介绍了基于蛋白质结构和功能约束的经验模型,如Dayhoff PAM 矩阵和JTT(Jones-Taylor-Thornton)模型的构建原理。更先进的部分则涵盖了如WAG (Whelan and Goldman) 和 BLOSUM 族模型,解释了这些模型如何通过分析比对数据来确定不同氨基酸对之间的替换概率。 在分子演化动力学的章节中,本书将焦点从静态的概率模型转向了中性演化理论的实际应用。这包括对分子钟假说的检验和应用,探讨了如何利用校准的替代速率来估算物种分化时间。对选择压力的量化分析是此部分的高潮,重点介绍了 $d_N/d_S$(非同义替换速率与同义替换速率之比)的比值检验,包括了对 $d_S$(中性演化)和 $d_N$(正选择或负选择)的精确估计方法,例如基于分支(branch-site)模型的检验框架。 第四部分:高阶模型与计算挑战 最后,本书探讨了当前研究前沿中的复杂模型和计算方法的局限性。 结构化模型的引入是前沿课题的体现。这部分分析了如何将mRNA结构约束(如发夹结构或假结的形成)纳入到替代模型中,以更精细地描述非编码区或RNA基因的演化过程。 此外,贝叶斯方法在分子进化中的应用被独立成章论述。与传统的最大似然法相比,贝叶斯方法允许对参数进行更充分的不确定性量化。书中详细介绍了如何使用马尔可夫链蒙特卡洛(MCMC)方法,特别是Metropolis-Hastings算法,来采样后验分布,从而估计演化树拓扑和模型参数。对MCMC收敛诊断和计算效率的讨论,为实践者提供了重要的工程指导。 全书在收尾部分总结了这些概率模型在宏观基因组学中的应用潜力,例如在推断基因组间的重排事件和理解复制子(replicator)动态中的作用,强调了严谨的数学框架是解释海量生物数据所不可或缺的工具。本书的结构设计确保了读者不仅能理解“是什么”,更能掌握“为什么”和“如何做”的深层逻辑。

作者简介

目录信息

读后感

评分

评分

评分

评分

评分

用户评价

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有