十一、分布式數(shù)據(jù)庫
1.分布式數(shù)據(jù)庫的分類
分布式數(shù)據(jù)庫,是根據(jù)它的管理系統(tǒng)(Distributed DBMS-DDBMS)進行分類的。對DDBMS可以從四個不同角度來分類:
(1)從構成的方式,可分為同構型和異構型兩類
所謂同構型,是指所有節(jié)點的局部DBMS都支持同一數(shù)據(jù)模式和數(shù)據(jù)語言。為使每個節(jié)點都掌握彼此的數(shù)據(jù)情況,需要增加網(wǎng)絡數(shù)據(jù)庫管理系統(tǒng)(NDBMS),各節(jié)點之間通過通信網(wǎng)絡形成統(tǒng)一的整體。同構型的DDBMS對于并發(fā)控制、冗余數(shù)據(jù)的一致性等問題容易處理,但建庫的代價比較大。
所謂異構型系統(tǒng),是指在分布環(huán)境中各節(jié)點上的數(shù)據(jù)模型和數(shù)據(jù)語言都可能不同。異構比同構型系統(tǒng)實現(xiàn)起來要困難一些,為了在兩個節(jié)點上的局部DBMS之間進行信息交換,就要對數(shù)據(jù)模式和數(shù)據(jù)語言進行轉(zhuǎn)換和映射工作。
。2)按控制方式,可以分為集中式與分布式
所謂集中控制的DDBM指所有事務都由一臺叫做中心計算機的節(jié)點進行管理。
分布控制的DDBMS,是指每個節(jié)點都保持DDBMS的一個副本來監(jiān)督和管理各節(jié)點及系統(tǒng)事務,它將網(wǎng)絡目錄作為用戶數(shù)據(jù)庫存放于局部DB之中。
。3)從數(shù)據(jù)分布的角度,DDBMS又可分為分割式、部分重復式和完全重復式
所謂分割式,是指每個節(jié)點只存儲DDB數(shù)據(jù)實體的部分子集,各節(jié)點的副本互不重疊。部分重復式,是指每個節(jié)點都存儲DDB數(shù)據(jù)實體的任意子集。
完全重復式,是指每個節(jié)點都存儲整個DDB數(shù)據(jù)實體的副本。也有文獻把完全重復式稱為復制式。
(4)從用戶的角度,DDBM可分為總體型和多重型。
2.分布式數(shù)據(jù)庫與單一數(shù)據(jù)庫的比較
(1)集中控制 在一個企業(yè)或單位范圍內(nèi)的信息資源上,對信息提供集中式控制的可能性,被認為是采用數(shù)據(jù)庫技術的最大動力之一,因為集中式數(shù)據(jù)庫是根據(jù)信息系統(tǒng)的演變和集中處理信息的需求開發(fā)出來的。
。2)數(shù)據(jù)獨立性 數(shù)據(jù)獨立性也曾經(jīng)被認為是采用數(shù)據(jù)庫方法的主要動力之一。實際上,數(shù)據(jù)獨立性意味著數(shù)據(jù)的實際結構對應用程序來講是透明的,應用程序員只需要利用數(shù)據(jù)邏輯結構,即所謂概念模式來編寫程序。數(shù)據(jù)獨立性的主要優(yōu)點是應用不受數(shù)據(jù)存儲的物理結構變化的影響。
在分布式數(shù)據(jù)庫中,數(shù)據(jù)的獨立性具有與傳統(tǒng)的集中式數(shù)據(jù)同等的重要性,然而,一種嶄新概念加進了數(shù)據(jù)獨立性的一般概念之中,這就是分布式透明性。所謂分布式透明性,指的是在編寫程序時就好象數(shù)據(jù)沒有被分布一樣。這樣,無論把數(shù)據(jù)存儲到甲地或乙地,或者把數(shù)據(jù)從一個節(jié)點移到另一個節(jié)點,都不會影響程序執(zhí)行的正確性和有效性,但是,必須指出,執(zhí)行速度或者效率卻受到了影響。
眾所周知,通過具有不同形式的數(shù)據(jù)描述和它們之間的映射的多層體系結構,曾為傳統(tǒng)的數(shù)據(jù)庫提供了獨立性,為此目的,開發(fā)出了概念模式、存儲模式和外部模式等概念。利用類似的方法,我們可以通過采用新層次和新模式,在分布式數(shù)據(jù)庫中可獲得分布式透明性。分布式透明性是分布式數(shù)據(jù)庫系統(tǒng)的主要目標之一。
(3)降低冗余 在傳統(tǒng)數(shù)據(jù)庫系統(tǒng)中,盡可能地降低冗余度是它的主要目標之一。這有兩個原因:首先,通過只用一個正本,可以自動地避免同一邏輯數(shù)據(jù)中幾個副本之間的不一致性。其次,用降低冗余度來節(jié)約存儲空間。通過共享數(shù)據(jù)的方式,即通過允許幾個應用訪問同一文件和記錄可以達到降低冗余度的目的。
但是,在分布式數(shù)據(jù)庫中,把數(shù)據(jù)的冗余看成是所需要的特性。這有幾個原因:首先,如果在需要冗余的所有節(jié)點都復制數(shù)據(jù),則可以增加應用的局部性。其次,可以增加分布式數(shù)據(jù)庫系統(tǒng)的有效性和可靠性。因為,如果復制數(shù)據(jù),則一個節(jié)點上的故障不會停止其它節(jié)點上應用的執(zhí)行。在一般情況下,為傳統(tǒng)集中式環(huán)境所規(guī)定的克服冗余的原因,在分布式環(huán)境中仍是有效的。因此,在分布式數(shù)據(jù)庫中,對冗余度的評價要選擇一種折衷方案,不能一概而論。一般地說,復制數(shù)據(jù)項的方便程度是隨著應用所執(zhí)行的檢索訪問與更新訪問的比率提高而增加。數(shù)據(jù)復制便利程度的提高,是因為具有一個項目多個副本,檢索可以在任一副本上進行,而更新卻必須在所有副本上一致地進行。
。4)有效訪問 復雜的訪問結構,如輔助索引、文件間的鏈接等,都是傳統(tǒng)數(shù)據(jù)庫所采用的重要技術,對這些結構的支持是數(shù)據(jù)庫管理系統(tǒng)DBMS極為重要的組成部分。提供復雜訪問結構的原因,是為了提高存取數(shù)據(jù)的效率。
。5)完整性、恢復和并發(fā)控制 在數(shù)據(jù)庫理論中,盡管完整性、恢復和并發(fā)控制等所涉及的問題是不同的,但它們之間相互聯(lián)系還是很多的,一般來說,完整性、恢復和并發(fā)控制等問題的解決,在很大程度上取決于所提供的事務的結構形式。
(6)保密性和安全性 在傳統(tǒng)數(shù)據(jù)庫中,具有集中式控制的數(shù)據(jù)庫管理員能保證只執(zhí)行那些授權的數(shù)據(jù)訪問。但應當指出,集中式數(shù)據(jù)庫本身比過去處理單獨文件的舊方法更難于實現(xiàn)數(shù)據(jù)的保密性和安全性。
在分布式數(shù)據(jù)庫中,局部數(shù)據(jù)庫管理員面臨的一些主要問題,與傳統(tǒng)數(shù)據(jù)庫管理員面臨的問題一樣。但是,分布式數(shù)據(jù)庫的兩個獨特方面值得一提:首先,在具有極高度節(jié)點自主權的分布式數(shù)據(jù)庫中,局部數(shù)據(jù)的擁有者認為比較安全,因為他們能自主地實施自己的安全措施,以履行集中式數(shù)據(jù)庫管理員的職責。其次,安全性問題,一般是分布式系統(tǒng)的固有問題,因分布式系統(tǒng)是通過通信網(wǎng)絡來實現(xiàn)分布式控制的,而通信網(wǎng)絡本身就在保護數(shù)據(jù)的安全性和保密性方面存在著弱點。通過網(wǎng)絡偷看、亂改別人的數(shù)據(jù)難以完全避免。
3.分布式數(shù)據(jù)庫管理系統(tǒng)(DDBMS)
在目前分析DDBMS的性能時,應該把商品化系統(tǒng)和先進的研究樣機區(qū)分開來,但是可以預料,某些先進的研究樣機中試驗的特性,可能會應用到將來的商品化系統(tǒng)中去的。本節(jié)簡要敘述分布式數(shù)據(jù)庫管理系統(tǒng)的基本性能,并就用什么樣的方法使得分布式數(shù)據(jù)庫這個新技術商品化的問題談一點看法。
從目前看,世界上幾各已經(jīng)商品化的分布式系統(tǒng)是由集中式數(shù)據(jù)庫管理系統(tǒng)的銷售廠商開發(fā)出來的。這些分布式數(shù)據(jù)庫管理系統(tǒng),包括擴充集中式DBMS時所附加的部件。分布式功能的擴充是通過裝配在計算機網(wǎng)絡中不同節(jié)點上的DBMS之間所提供的通信和合作來實現(xiàn)的。在這種情況下建立分布式數(shù)據(jù)庫通常所必須的軟件部分是:
。1)數(shù)據(jù)庫管理部分(DB);
(2)數(shù)據(jù)通信部分(DC);
。3)數(shù)據(jù)字典(DD),它能用來表示有關網(wǎng)絡中數(shù)據(jù)分布的信息;
。4)分布式數(shù)據(jù)庫部分(DDB)。
希望與更多計算機等級考試的網(wǎng)友交流,請進入計算機等級考試論壇
更多信息請訪問:考試吧計算機等級考試欄目
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |