精選了其中的 60 個(gè)最佳技巧,并把這些技巧編寫成了本文,為了方便索引其內(nèi)容劃分為 5 個(gè)部分:
第一部分介紹了設(shè)計(jì)數(shù)據(jù)庫(kù)之前12個(gè)基本技巧,包括命名規(guī)范和明確業(yè)務(wù)需求等(數(shù)據(jù)庫(kù)設(shè)計(jì)經(jīng)驗(yàn)談 (1) );第二部分介紹設(shè)計(jì)數(shù)據(jù)庫(kù)表24個(gè)指南性技巧,涵蓋表內(nèi)字段設(shè)計(jì)以及應(yīng)該避免的常見(jiàn)問(wèn)題等(數(shù)據(jù)庫(kù)設(shè)計(jì)經(jīng)驗(yàn)談 (2) );本次第三部分主要介紹選擇鍵和索引,包含10個(gè)技巧專門涉及系統(tǒng)生成的主鍵的正確用法,還有何時(shí)以及如何索引字段以獲得最佳性能等。
第 3 部分 - 選擇鍵和索引
數(shù)據(jù)采掘要預(yù)先計(jì)劃
我所在的某一客戶部門一度要處理 8 萬(wàn)多份聯(lián)系方式,同時(shí)填寫每個(gè)客戶的必要數(shù)據(jù)(這絕對(duì)不是小活)。我從中還要確定出一組客戶作為市場(chǎng)目標(biāo)。當(dāng)我從最開始設(shè)計(jì)表和字段的時(shí)候,我試圖不在主索引里增加太多的字段以便加快數(shù)據(jù)庫(kù)的運(yùn)行速度。然后我意識(shí)到特定的組查詢和信息采掘既不準(zhǔn)確速度也不快。結(jié)果只好在主索引中重建而且合并了數(shù)據(jù)字段。我發(fā)現(xiàn)有一個(gè)指示計(jì)劃相當(dāng)關(guān)鍵——當(dāng)我想創(chuàng)建系統(tǒng)類型查找時(shí)為什么要采用號(hào)碼作為主索引字段呢?我可以用傳真號(hào)碼進(jìn)行檢索,但是它幾乎就象系統(tǒng)類型一樣對(duì)我來(lái)說(shuō)并不重要。采用后者作為主字段,數(shù)據(jù)庫(kù)更新后重新索引和檢索就快多了。
可操作數(shù)據(jù)倉(cāng)庫(kù)(ODS)和數(shù)據(jù)倉(cāng)庫(kù)(DW)這兩種環(huán)境下的數(shù)據(jù)索引是有差別的。在 DW 環(huán)境下,你要考慮銷售部門是如何組織銷售活動(dòng)的。他們并不是數(shù)據(jù)庫(kù)管理員,但是他們確定表內(nèi)的鍵信息。這里設(shè)計(jì)人員或者數(shù)據(jù)庫(kù)工作人員應(yīng)該分析數(shù)據(jù)庫(kù)結(jié)構(gòu)從而確定出性能和正確輸出之間的最佳條件。
使用系統(tǒng)生成的主鍵
這類同技巧 1,但我覺(jué)得有必要在這里重復(fù)提醒大家。假如你總是在設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候采用系統(tǒng)生成的鍵作為主鍵,那么你實(shí)際控制了數(shù)據(jù)庫(kù)的索引完整性。這樣,數(shù)據(jù)庫(kù)和非人工機(jī)制就有效地控制了對(duì)存儲(chǔ)數(shù)據(jù)中每一行的訪問(wèn)。
采用系統(tǒng)生成鍵作為主鍵還有一個(gè)優(yōu)點(diǎn):當(dāng)你擁有一致的鍵結(jié)構(gòu)時(shí),找到邏輯缺陷很容易。
分解字段用于索引
為了分離命名字段和包含字段以支持用戶定義的報(bào)表,請(qǐng)考慮分解其他字段(甚至主鍵)為其組成要素以便用戶可以對(duì)其進(jìn)行索引。索引將加快 SQL 和報(bào)表生成器腳本的執(zhí)行速度。比方說(shuō),我通常在必須使用 SQL LIKE 表達(dá)式的情況下創(chuàng)建報(bào)表,因?yàn)?case number 字段無(wú)法分解為 year、serial number、case type 和 defendant code 等要素。性能也會(huì)變壞。假如年度和類型字段可以分解為索引字段那么這些報(bào)表運(yùn)行起來(lái)就會(huì)快多了。
鍵設(shè)計(jì) 4 原則
1.為關(guān)聯(lián)字段創(chuàng)建外鍵。
2.所有的鍵都必須唯一。
3.避免使用復(fù)合鍵。
4.外鍵總是關(guān)聯(lián)唯一的鍵字段。
別忘了索引
索引是從數(shù)據(jù)庫(kù)中獲取數(shù)據(jù)的最高效方式之一。95% 的數(shù)據(jù)庫(kù)性能問(wèn)題都可以采用索引技術(shù)得到解決。作為一條規(guī)則,我通常對(duì)邏輯主鍵使用唯一的成組索引,對(duì)系統(tǒng)鍵(作為存儲(chǔ)過(guò)程)采用唯一的非成組索引,對(duì)任何外鍵列[字段]采用非成組索引。不過(guò),索引就象是鹽,太多了菜就咸了。你得考慮數(shù)據(jù)庫(kù)的空間有多大,表如何進(jìn)行訪問(wèn),還有這些訪問(wèn)是否主要用作讀寫。
大多數(shù)數(shù)據(jù)庫(kù)都索引自動(dòng)創(chuàng)建的主鍵字段,但是可別忘了索引外鍵,它們也是經(jīng)常使用的鍵,比如運(yùn)行查詢顯示主表和所有關(guān)聯(lián)表的某條記錄就用得上。還有,不要索引 memo/note 字段,不要索引大型字段(有很多字符),這樣作會(huì)讓索引占用太多的存儲(chǔ)空間。
不要索引常用的小型表
不要為小型數(shù)據(jù)表設(shè)置任何鍵,假如它們經(jīng)常有插入和刪除操作就更別這樣作了。對(duì)這些插入和刪除操作的索引維護(hù)可能比掃描表空間消耗更多的時(shí)間。
不要把社會(huì)保障號(hào)碼(SSN)或身份證號(hào)碼(ID)選作鍵
永遠(yuǎn)都不要使用 SSN 或 ID 作為數(shù)據(jù)庫(kù)的鍵。除了隱私原因以外,須知政府越來(lái)越趨向于不準(zhǔn)許把 SSN 或 ID 用作除收入相關(guān)以外的其他目的,SSN 或 ID 需要手工輸入。永遠(yuǎn)不要使用手工輸入的鍵作為主鍵,因?yàn)橐坏┠爿斎脲e(cuò)誤,你唯一能做的就是刪除整個(gè)記錄然后從頭開始。
我在破解他人的程序時(shí)候,我看到很多人把 SSN 或 ID 還曾被用做系列號(hào),當(dāng)然盡管這么做是非法的。而且人們也都知道這是非法的,但他們已經(jīng)習(xí)慣了。后來(lái),隨著************身份犯罪案件的增加,我現(xiàn)在的同行正痛苦地從一大攤子數(shù)據(jù)中把 SSN 或 ID 刪除。
不要用用戶的鍵
在確定采用什么字段作為表的鍵的時(shí)候,可一定要小心用戶將要編輯的字段。通常的情況下不要選擇用戶可編輯的字段作為鍵。這樣做會(huì)迫使你采取以下兩個(gè)措施:
1.在創(chuàng)建記錄之后對(duì)用戶編輯字段的行為施加限制。假如你這么做了,你可能會(huì)發(fā)現(xiàn)你的應(yīng)用程序在商務(wù)需求突然發(fā)生變化,而用戶需要編輯那些不可編輯的字段時(shí)缺乏足夠的靈活性。當(dāng)用戶在輸入數(shù)據(jù)之后直到保存記錄才發(fā)現(xiàn)系統(tǒng)出了問(wèn)題他們?cè)撛趺聪?刪除重建?假如記錄不可重建是否讓用戶走開?
2.提出一些檢測(cè)和糾正鍵沖突的方法。通常,費(fèi)點(diǎn)精力也就搞定了,但是從性能上來(lái)看這樣做的代價(jià)就比較大了。還有,鍵的糾正可能會(huì)迫使你突破你的數(shù)據(jù)和商業(yè)/用戶界面層之間的隔離。
所以還是重提一句老話:你的設(shè)計(jì)要適應(yīng)用戶而不是讓用戶來(lái)適應(yīng)你的設(shè)計(jì)。
不讓主鍵具有可更新性的原因是在關(guān)系模式下,主鍵實(shí)現(xiàn)了不同表之間的關(guān)聯(lián)。比如,Customer 表有一個(gè)主鍵 CustomerID,而客戶的定單則存放在另一個(gè)表里。Order 表的主鍵可能是 OrderNo 或者 OrderNo、CustomerID 和日期的組合。不管你選擇哪種鍵設(shè)置,你都需要在 Order 表中存放 CustomerID 來(lái)保證你可以給下定單的用戶找到其定單記錄。
假如你在 Customer 表里修改了 CustomerID,那么你必須找出 Order 表中的所有相關(guān)記錄對(duì)其進(jìn)行修改。否則,有些定單就會(huì)不屬于任何客戶——數(shù)據(jù)庫(kù)的完整性就算完蛋了。
如果索引完整性規(guī)則施加到表一級(jí),那么在不編寫大量代碼和附加刪除記錄的情況下幾乎不可能改變某一條記錄的鍵和數(shù)據(jù)庫(kù)內(nèi)所有關(guān)聯(lián)的記錄。而這一過(guò)程往往錯(cuò)誤叢生所以應(yīng)該盡量避免。
可選鍵(候選鍵)有時(shí)可做主鍵
記住,查詢數(shù)據(jù)的不是機(jī)器而是人。
假如你有可選鍵,你可能進(jìn)一步把它用做主鍵。那樣的話,你就擁有了建立強(qiáng)大索引的能力。這樣可以阻止使用數(shù)據(jù)庫(kù)的人不得不連接數(shù)據(jù)庫(kù)從而恰當(dāng)?shù)倪^(guò)濾數(shù)據(jù)。在嚴(yán)格控制域表的數(shù)據(jù)庫(kù)上,這種負(fù)載是比較醒目的。如果可選鍵真正有用,那就是達(dá)到了主鍵的水準(zhǔn)。
我的看法是,假如你有可選鍵,比如國(guó)家表內(nèi)的 state_code,你不要在現(xiàn)有不能變動(dòng)的唯一鍵上創(chuàng)建后續(xù)的鍵。你要做的無(wú)非是創(chuàng)建毫無(wú)價(jià)值的數(shù)據(jù)。如你因?yàn)檫^(guò)度使用表的后續(xù)鍵[別名]建立這種表的關(guān)聯(lián),操作負(fù)載真得需要考慮一下了。
別忘了外鍵
大多數(shù)數(shù)據(jù)庫(kù)索引自動(dòng)創(chuàng)建的主鍵字段。但別忘了索引外鍵字段,它們?cè)谀阆氩樵冎鞅碇械挠涗浖捌潢P(guān)聯(lián)記錄時(shí)每次都會(huì)用到。還有,不要索引 memo/notes 字段而且不要索引大型文本字段(許多字符),這樣做會(huì)讓你的索引占據(jù)大量的數(shù)據(jù)庫(kù)空間。
預(yù)告:在第四部分將討論保證數(shù)據(jù)完整性,如何保持?jǐn)?shù)據(jù)庫(kù)的清晰和健壯,如何把有害數(shù)據(jù)降低到最小程度。
相關(guān)推薦:2010年全國(guó)計(jì)算機(jī)等考二級(jí)C:程序設(shè)計(jì)實(shí)戰(zhàn)匯總北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |