《理解生物信息學》中包含,學習效果:每章開篇都有一個學習效果列表,它總結了該章所涉及的主題,可作為一個反饋清單。思維導圖:每一章都含有一個思維導圖,這是《理解生物信息學》一個特別的教學特征,它確保每個學生都能看到并記住一些特定應用中所必需的步驟。偶爾地,思維導圖的兩個獨立方面也可能有著重要的關聯。流程圖:每一章的每個小節都有一個流程圖以幫助讀者記憶該小節所涵蓋的主題。作為示例,下面給出了第5章的一個流程圖,其中在本節將要解釋的概念用深灰色框標注,且相互間用箭頭連接起來。例如,兩種主要類型的非常優聯配:局部和全局將在本章的這一節描述。那些已在之前小節描述過的概念用淺灰色框標注,這樣我們就很容易了解本節涉及的主題和已介紹過的主題間的聯系。例如,構建聯配需要為空缺 打分的方法和為替換打分的方法,兩者都已經在這一章描述過了。通過這種方式,整章涉及的主要概念以及相互間的關系就能漸漸地被構架出來。插圖:每一章都配有插圖。插圖的配置是經過充分考慮的,以保障既簡單易懂又與本書其他章節保持連貫一致。擴展閱讀:在這么一個快速發展的學科中,我們不可能在這本有限的《理解生物信息學》囊括現有的所有知識,更不用說將來的發展了。因此在每章的結尾我們都列了一些研究文獻和專業著作的參考文獻以幫助讀者進一步擴展知識、發展技能。我們根據不同主題收集文章,使得擴展閱讀中每節都與這一章相應小節的內容相對應。我們希望這能幫助閱讀者以很快的速度找到他們感興趣的擴展材料。字符表:生物信息學需要使用很多符號,對還不了解生物信息的人來說,許多符號都是不熟悉的。為了幫助讀者了解本書適用的符號,我們在《理解生物信息學》后面給出了引用的每個符號、它的定義以及它在本書常出現的位置的列表。名詞解釋:在文中,所有技術術語在第1次出現時都用黑體顯示,且在名詞解釋中列出其相應的解釋。此外,每個在名詞解釋中的術語都會出現在索引中,這樣讀者就能很快獲得詳細介紹這一術語的相應頁碼。
導語_點評_推薦詞
譯者序
前言
給閱讀者的短箋
致謝名單
第1部分 基礎知識
第1章 核酸的世界
1.1DNA和 RNA的結構
DNA分子是由4種不同類型的堿基組成的線性多聚體
兩條互補 DNA鏈通過堿基配對形成雙螺旋
RNA分子通常為單鏈結構,但在某些情況下可形成堿基配對結構
1.2 DNARNA和蛋白質:中心法則
DNA是信息載體,而 RNA則是信使
信使RNA根據遺傳密碼翻譯產生蛋白質
翻譯過程涉及了含 DNA和 RNA的核糖體的轉移
1.3基因結構和基因調控
特定的定位序列能和 RNA聚合酶結合,并識別轉錄起始點
真核生物中的轉錄起始信號遠比細菌中復雜得多
真核生物 mRNA轉錄物在翻譯前需經歷一系列修飾
翻譯的調控
1.4生命與進化之樹
主要生命形式的基本特征
突變可以改變核苷酸序列
總結
名詞解釋
擴展閱讀
第2章 蛋白質結構
2.1初級結構和二級結構
我們可從多個不同水平考察蛋白質結構
氨基酸是蛋白質的組成單位
側鏈決定了氨基酸化學和物理特性的不同
蛋白質鏈中的氨基酸通過肽鍵共價連接
蛋白質的二級結構由α螺旋?β鏈構成
在蛋白質結構中已發現了幾種不同類型的β折疊片
螺旋和鏈通過轉角?發夾結構和環連接
2.2對生物信息學的啟發
某些氨基酸傾向于形成特定的結構單元
從進化角度幫助序列分析
蛋白質結構的計算和可視化
2.3蛋白質通過折疊形成緊湊的結構
蛋白質的三級結構是通過多肽鏈的路徑來定義的
蛋白質折疊的穩定狀態是能量低的狀態
很多蛋白質是由多個亞基組成的
總結
名詞解釋
擴展閱讀
第3章 數據庫的處理
3.1數據庫的結構
平面文件數據庫以文本文件的方式存儲數據
關系數據庫廣泛應用于存儲生物信息
XML的靈活性可以確定定制的數據分類
一些用于生物數據的其他數據庫結構
數據庫可以通過本地訪問或通過互聯網相互鏈接
3.2數據庫類型
數據庫中不僅僅是數據
原始數據和衍生數據
我們如何定義和鏈接事物的重要性:本體
3.3數據庫搜索
序列數據庫
芯片數據庫
蛋白質相互作用數據庫
結構數據庫
3.4數據質量
非冗余性對一些應用特別重要
自動化方法可用于檢查數據的一致性
初步的分析和注釋通常是自動化完成的
為了產生高質量的注釋經常需要人為干預
數據庫更新和條目注釋版本號的重要性
總結
名詞解釋
擴展閱讀
第2部分 序列聯配
第4章 產生和分析序列聯配
4.1序列聯配的原理
聯配是在兩個或更多序列的相同區域尋找較大相似性的任務
聯配可以揭示序列間的同源性
比較蛋白質序列比核酸序列更容易檢測同源性
4.2聯配分值
一個聯配的質量是通過給予一個量化的分值來衡量的
量化兩個序列間的相似性的最簡單的方法是百分數
基于一致度的點圖可以可視化地評價相似性
真正的匹配不必相同
低一致度比可以被接受為具有顯著性
對于打分聯配有許多不同的方法
4.3替代矩陣
使用替代矩陣對每個排列后的序列位點分配一個單獨的值
PAM 替代矩陣使用密切相關的蛋白質序列集的替代頻率
BLOSUM 替代矩陣使用了局部高度保守區域序列的突變數據
替代矩陣的選擇取決于要解決的問題
4.4插入空缺
在序列插入空缺以達到和另一條序列的相似度較大,需要罰分制度
動態規劃算法可以決定引入空缺
4.5聯配類型
對于不同情況采用不同類型的聯配
多重序列聯配能同時比較一些相似序列
有幾種不同的技術可構造多重聯配
多重聯配可以提高低相似性序列聯配的度
ClustalW 可以對 DNA和蛋白質序列進行全局聯配
通過合并一些局部聯配可以構建多重聯配
增加新信息可以改進聯配
4.6檢索數據庫
已開發了快速而的搜索算法
FASTA格式是一個基于較短的相同片段
匹配的快速的數據庫搜索方法
BLAST的基礎在于發現非常相似的短片段
對不同的問題采用不同版本的BLAST和FASTA
PSIBLAST基于配置文件的數據庫搜索
SSEARCH 是一個嚴格的聯配方法
4.7搜索核酸或蛋白質序列
可直接使用或翻譯后的 DNA或 RNA序列
必須測試數據庫的匹配質量,以確保其不可能是偶然發生
選擇一個適當的犈值的閾值有助于限制數據庫搜索
低復雜度區域可以將同源性搜索復雜化
不同的數據庫可以用來解決具體問題
4.8蛋白質序列模體或模式
建立數據庫的模式需要專業知識
BLOCKS數據庫包含自動編譯的保守蛋白質序列的多重聯配的較短序列模塊
4.9 使用模式和模體搜索
可以在PROSITE數據庫中搜索蛋白質的模式和模體
基于模式的PHIBLAST程序同時搜索同源性和模體匹配
可以使用PRATT從多條序列產生模式
PRINTS數據庫包括了指紋圖譜,描述一個蛋白質家族的一些保守模體
Pfam數據庫定義了蛋白質家族的表達譜
4.10模式和蛋白質功能
可以搜索蛋白質上特定的功能位點
序列比較不是分析蛋白質序列的途徑
總結
名詞解釋
擴展閱讀
第5章 序列比對及數據庫搜索
5.1替換矩陣和打分
聯配分值用于衡量公共進化祖先的似然性
PAM (MDM)替代打分矩陣用于探索蛋白質進化起源
BLOSUM 矩陣用于尋找保守的蛋白質區域
用于核苷酸聯配的打分矩陣需由相似的方式得到
替換打分矩陣必須適用于特定的聯配問題
插入空缺的打分相對替換而言使用了更為啟發式的方法
5.2動態規劃算法
使用改進后的 NeedlemanWunsch算法構建全局聯配
對動態規劃算法的簡單改進就能用于局部序列聯配
不計算完整的矩陣,犧牲度提高時間效率
5.3索引技術和近似算法
后綴樹定位和獨特及重復序列的位置
散列索引是一種技術,列出了所有k的起始位置元組 (ktuples)
FASTA算法使用哈希算法和快速鏈接進行數據庫搜索
BLAST算法利用了有限狀態自動機
直接比較核酸序列和蛋白質序列,需要對BLAST和FASTA進行特殊的調整
5.4聯配分值的顯著性
有空缺局部聯配的統計可以按相似的算法進行
5.5聯配全基因組序列
有效索引和掃描全基因組序列對高等生物序列比對至關重要
密切關聯的物種基因組之間復雜進化關系需要創新的聯配算法
總結
名詞解釋
擴展閱讀
第6章模式?序列和多序列比對
6.1序列和序列標記
位置特異性分數矩陣是得分矩陣的擴展
解決構建PSSM 時數據缺失問題的方法
PSIBLAST是一個序列數據庫檢索程序
將序列表現為序列標記
6.2譜式隱馬爾可夫模型
用于序列比對的 HMM 的基本結構
利用聯配序列建立 HMM 參數
利用譜式 HMM 給序列打分:較大可能路徑以及所有路徑的總和
利用未聯配序列評估 HMM 參數
6.3序列聯配
利用聯配比較兩個PSSM
聯配譜式 HMM
6.4利用序列遞增 (gradualsequence addition)的多序列比對
序列添加的順序是基于評估合并聯配錯誤可能性而決定的
許多不同的打分策略用于建立多序列聯配
多序列聯配是利用向導樹以及譜式方法構建的,且可能進一步改進
6.5其他獲得多序列聯配的方法
多序列聯配程序 DIALIGN聯配無間隙的區段
利用遺傳算法的SAGA多序列聯配方法
6.6序列模式發現
在多序列聯配中查找模式:eMOTIF和AACC
序列中共有模式的概率查詢:Gibbs和MEME
總結
名詞解釋
擴展閱讀
第3部分進化過程
第7章重現進化歷史
7.1系統發生樹的結構和解釋
系統發生樹重建進化關系
用幾種方式描述樹的拓撲結構
一致樹和可信樹報告拓撲結構的比較結果
7.2分子進化及其結果
大多數相關序列有許多變異了幾次的位置
可接受突變速率對所有類型的堿基替換通常是不相同的
密碼子不同位置有不同的突變速率
只應該用直系同源基因構建物種系統發生樹
基因組大區域變化是常見的
7.3系統發生樹構建
核糖體小亞基rRNA序列非常適用于重建物種的進化
構樹方法的選擇在某種程度上依賴于數據集的大小和質量
在使用這些方法時必需選擇一個進化模型
所有的系統發生分析必須以的多序列比對開始
16SRNA序列的一個小數據集的系統發生分析
為酶家族建立基因樹有助于發現酶功能的進化
總結
名詞解釋
擴展閱讀
第8章 構建系統發生樹
8.1進化模型和進化距離的計算
一個簡單但不衡量進化距離的是狆距離
Poisson校正距離考慮了同一位點上的多次突變
Gamma校正距離考慮了不同的序列位點上突變速率的差異
JukesCantor模型再現了核苷酸序列進化的一些基本特征
更復雜的模型區分不同類型突變的相對頻率
在 DNA序列上存在核苷酸的偏好
蛋白質序列的進化模型和用于序列聯配的替代矩陣密切相關
8.2產生系統發生樹
聚類方法基于進化距離產生一個系統發育樹
UPGMA方法假定一個恒定的分子鐘,并產生一個等距樹
FitehMargoliash方法產生一個無根的加性樹
鄰接法:此方法涉及最小進化的概念
通常使用逐步增加和星形分解方法用以產生一棵起始樹用于進一步的探索,這不是最終樹
8.3產生多種樹的拓撲結構
分枝限界法大大提高了搜索樹的拓撲結構的效率
可以通過對一個現存樹做一系列細小的變化以優化樹拓撲結構
尋找根給出了系統發生樹在時間上的方向
8.4評價樹的拓撲結構
可使用基于進化距離的函數以評價樹
加權簡約法尋找具有突變最少的樹
使用簡約法可以采用不同的方式對突變作加權
可以使用較大似然法用以評估樹
四重奏迷惑 (quartetpuzzling)方法在標準執行中也包括了較大似然法
貝葉斯方法也可用于重建系統發生樹
8.5評估樹的特征和比較樹的性
即使是完善的數據和方法也會出現長枝吸引的問題
可以檢驗內部分枝測試樹的拓撲結構
用于比較兩棵或兩棵以上的樹的檢驗方法
總結
名詞解釋
擴展閱讀
第4部分 基因組特征
第9章 揭示基因組特征
9.1基因組序列的初步分析
將整個基因組序列分割開來簡化基因檢測
結構 RNA基因和重復序列在進一步分析中可以排除
同源性可以用于原核和真核基因的鑒定
9.2原核基因組中的基因預測
9.3真核基因組中的基因預測
外顯子和內含子的預測程序使用了多種方法
基因預測必須要保持正確的閱讀框
有些程序只利用查詢序列和外顯子模型來預測外顯子
有些程序只利用查詢序列和基因模型來預測外顯子
可以利用基因模型和序列相似性來預測基因
相關物種的基因組可以用來幫助基因預測
9.4剪接位點的預測
剪接位點可以由專門的程序獨立地鑒定
9.5啟動子區域的預測
原核啟動子有較好定義的基序
真核啟動子一般要比原核啟動子復雜
有許多啟動子的在線預測工具
啟動子預測結果并不十分清晰
9.6證實預測結果
有多種計算基因預測率的方法
翻譯預測的外顯子可以證實預測的性
構建蛋白質和鑒定同源基因
9.7基因組注釋
基因組注釋是基因組分析中的一步
GO(geneontology)提供了一套基因注釋的標準詞匯表
9.8大基因組比較
總結
名詞解釋
擴展閱讀
第10章 基因檢測和基因組注釋理論章節
10.1利用決策樹檢測功能 RNA分子
利用tRNAscan算法檢測tRNA基因
檢測真核生物基因組中的tRNA基因
10.2原核生物基因檢測中有用的特征
10.3原核生物基因檢測的算法
GeneMark利用了非均勻馬爾可夫鏈(inhomogeneousMarkovchains)和雙密碼子 (dicodon)統計
GLIMMER利用了編碼概率的差值馬爾科夫模型
ORPHEUS利用了同源性?密碼子統計和核糖體結合位點
GeneMark.hmm 利用狀態持續隱馬爾可夫模型
EcoParse是一個 HMM 基因模型
10.4真核生物基因檢測中用到的特征
真核生物基因與原核生物基因的差異
內含子?外顯子和剪切位點
轉錄因子的啟動子序列和結合位點
10.5預測真核生物基因信號
檢測核心啟動子結合信號是很多真核生物基因預測方法的關鍵元素
為了定位核心啟動子序列信號而設計的一類模型
利用序列一般性質預測啟動子區域可以去掉相當數量的假陽性結論
預測真核生物轉錄和翻譯起始位點
轉錄和翻譯終止信號給出基因完整定義
10.6預測外顯子和內含子
可以利用普遍序列性質 (generalsequence property)來識別
剪切位點預測
可以通過序列模式與堿基統計相結合預測剪切位點
GenScan將加權矩陣和決策樹整合以定位剪切位點
GeneSplicer利用一階馬爾可夫鏈預測剪切位點
NetPlantGene整合內含子和外顯子的神經網絡模型以預測剪切位點
其他特征可能也可以用于剪切位點預測
利用特定方法識別起始和終止外顯子
利用數據庫中的同源區域可以定義外顯子
10.7完整真核生物基因模型
10.8預測獨立基因之余
功能注釋
通過比較相關基因組,可以減少難以確定的預測
基因檢測方法的評估和再評估
總結
名詞解釋 308 oxviiio
擴展閱讀
第5部分 二級結構
第11章從序列中獲得二級結構
11.1預測方法的類型
基于規則的統計方法使殘基形成一個特定二級結構成為可能
最近鄰法是結合了有關蛋白質結構額外信息的統計方法
主要利用神經網絡及隱馬爾可夫方法進行二級結構預測的機器學習方法
11.2 訓練和測試數據庫
確定蛋白質二級結構的幾種方法
11.3預測程序性評估
Q 3 衡量個別殘基分配的精度
二級結構的預測不應該期望達到的殘基精度
Sov值衡量全元素的預測精度
CAFASP/CASP:無偏的和隨時可用的蛋白質預測評估
11.4統計和基于知識的方法
GOR方法用作信息論方法
Zpred程序包括了同源序列和殘基保守信息的多重聯配
使用多個序列信息提高整體預測精度
最近鄰法:使用多個非同源序列
PREDATOR是一種綜合了統計和基于知識的程序,其中包括了最近鄰法
11.5二級結構預測的神經網絡方法
評估神經網絡預測的性
基于網絡的神經網絡二級結構預測程序的幾個例子
PROF:蛋白質
這個商品不錯~
書不錯,不過包裝實在不敢恭維,買了6本書,就一層紙箱子裝,我收到箱子都破了個大洞,書也漏出來了,邊角皺皺巴巴的。我還以為就我的這個是這樣,恰巧碰的我一個同事,她也買的書,也在抱怨包裝太差了,箱子破了個大洞,太不負責了。
這個商品不錯呀,這個商品不錯呀,
對于完全沒基礎的還是相當吃力的
這個商品不錯~
這個商品不錯~
還可以,學習的書,看著不錯
這個商品不錯~
好
幫別人買的專業書籍,反應說不錯
好
這個商品不錯,這個商品不錯
good
很實惠,自學用
寶貝很好,第二天到貨
新概念是經典中俄經典,所以沒有什么可挑剔的。不過這套B的后半部門還是有點難度的,個人感覺比1A的前半部分難。也許是AB和1A1B之后不是同一個教育專家出的緣故吧。
包裝挺好,配送也及時
作為禮物,朋友非常喜歡。物流很快
紙張很好!
內容很好,書是正版書,非常值得學習的書
真是樣本生物信息學的好書,特別是每章后面的參考文獻,這個特別合適。
一直特想看生物信息學方面的書,系統的學一下,只看了目錄,很吸引人
在當當網買的《理解生物信息學》,這本書質量不錯,裝訂印刷精美,內容先進,推薦各位同行購買
很好的生物信息學教材,我看過一部分了。感覺很好!非常推薦
還是不錯的一本參考書,就是弄一幫學生翻譯的有點粗糙,要是直接出英文影音版就好了。
內容很好,書是正版書,先后買了兩本,送朋友一本,非常值得學習的書。
Zvelebil博士盡可能全面的收錄了生物信息領域的知識,是一本內容非常豐富的書,翻譯的也不錯
目前為止生物信息學最全面最好的一本書,值得買下來仔細研讀。是翻譯國外的書,版權貴,所以書價也略貴,不過物有所值