Bài giảng Nhập môn cơ sở dữ liệu - Bài 5: Tổ chức dữ liệu vật lý - Vũ Tuyết Trinh

Tchc dli
u v
t l
ý  
Vũ Tuyết Trinh  
Bmôn Các hthng thông tin, Khoa Công nghthông tin  
Đại hc Bách Khoa Hà Ni  
Hệ  
ng dng  
CSDL  
HQTCSDL  
CSDL  
CSDL  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Bxlý  
câu hi  
Bqun lý  
Giao dch  
Bqun lý  
lưu trữ  
Qun lý lưu trữ  
{ Tchc tp: sp xếp các  
bn ghi trên thiết bnhớ  
ngoài  
Bqun lý lưu trữ  
Qun lý buffer  
Qun  
lý  
giao  
dch  
z RID (record id): xác định địa  
chvt lý ca các bn ghi  
z chs: cu trúc dliu xác  
định stương ng gia  
RID ca bn ghi và giá trị  
ca trường (khoá)  
Qun lý tp  
{ Vùng nhớ đệm: trung gian  
gia thiết bnhngoài và  
bnhtrong (có thsử  
dng cho cDL và chs)  
Metadata &  
Data dictionary  
Data & index  
Tchc bnhngoài  
{ Mc đích: gim thiu truy xut đến dliu  
không cn thiết trên thiết bnhngoài  
{ Các vn đề cn quan tâm  
z Cu trúc lưu trữ  
z Các phép toán (thêm, xoá, sa, tìm kiếm)  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Các thiết bnhngoài  
{ Đĩa t, băng t, trng t, ...  
{ Đĩa t: được tchc thành tng trang  
z Chí phí truy nhp đến các trang bt klà tương  
đương  
z Chí phí đọc nhiu trang lin nhau < chí phí đọc các  
trang đó theo thtbt kỳ  
{
B
ă
ng t
:  
z chcó thể đọc được các trang lin nhau  
z rhơn đĩa tnhưng chi phí truy nhp thương ln hơn  
{ ...  
Đĩa tvs. bnhtrong  
{ Tc độ truy nhp bộ  
ms vs. ns (~1000 ln)  
{ Kích thước  
GB vs. 10x MB (~ 100 ln vi cùng chi phí)  
{ Lưu trữ  
n định (kckhi mt đin) vs. tm thi  
{ Phân chia block  
4KB vs. 1Byte  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Ni dung  
9 Tng quan vtchc bnhngoài  
{ Tchc tp đống  
{ Tchc tp băm  
{ Tchc tp chdn  
{ Cây cân bng  
Tchc tp đống (Heap File)  
{ Lưu trkế tiếp các bn ghi trong các trang  
không tuân theo m
t th
t
ự đặ
c bi
t nào  
{ Để thc hin các phép toán, cn:  
z Ghi nhstrang trong 1 tp  
z Ghi nhkhông gian trng trên các trang  
z Ghi nhcác bn ghi trên các trang  
¾ Có các con trtrti tt ccác trang ca tp và  
các con trnày được lưu trữ ở bnhtrong.  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Cài đặt tp đống bng danh sách  
Data  
Data  
Data  
Full Pages  
Page  
Page  
Page  
Header  
Page  
Data  
Data  
Data  
Pages with  
Free Space  
Page  
Page  
Page  
{ Cn lưu trHeaderPage và tên ca tp  
{ Mi trang gm dliu và 2 con trỏ  
Các phép toán  
{ Tìm kiếm 1 bn ghi  
{ Thêm 1 bn ghi  
{ Xoá 1 bn ghi  
{ Sa đổi mt bn ghi  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Sdng trang danh bạ  
Data  
Page 1  
Header  
Page  
Data  
Page 2  
Data  
Page N  
DIRECTORY  
{ Lưu thông tin vsbyte còn trng trên trang đó  
{ Danh blà 1 tp các trang  
Tchc tp băm (Hash File)  
{ Mc đích  
z Sdng chsố để hn chế slượng phép truy xut  
đĩa bng các phân nhóm các bn ghi (githiết n  
nhóm)  
z Mapping giá trkhoá vi vtrí ca (nhóm) bn ghi  
tương ng  
{
D
a trên b
ng b
ă
m (
hash table
)  
z Hàm băm (hash function)  
z Cm (bucket)  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Ví dụ  
h(x) = x mod 4  
1
2
4
3
Store  
hash  
1
1
2
3
4
4
2
3
Ví dtiếp  
h(x) = x mod 4  
Store  
hash  
10  
12  
6
1
1
2
3
4
2
3
4
10  
12  
6
ũ Tuyết Trinh, b/m Hthng thông tin,  
Các phép toán  
{ Tìm kiếm 1 bn ghi  
{ Thêm 1 bn ghi  
{ Xoá 1 bn ghi  
{ Sa đổi mt bn ghi  
Tiêu chí chn hàm băm  
{ Phân bcác bn ghi tương đối đồng đều (theo  
các cm)  
{ Hn chế vic sdng nhiu trang bnhcho 1  
cm  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Tchc tp chdn (Index File)  
{ Tp chdn theo khoá được chn trong bn ghi  
{ Tp chdn bao gm các cp (k,d), trong đó k  
là giá trca khoá ca bn ghi đầu tiên, d là địa  
chca khi (hay con trkhi).  
{ Tp chdn được sp xếp theo giá trca khoá.  
Các phép toán  
{ Tìm kiếm 1 bn ghi  
{ Thêm 1 bn ghi  
{ Xoá 1 bn ghi  
{ Sa đổi mt bn ghi  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Tìm kiếm 1 bn ghi  
{ Tìm kiếm tun tự  
z Duyt tp chdn tbn ghi đầu tiên đến khi tìm thy  
bn ghi có khoá k cn tìm  
z Nhn xét  
{ chm đối vi các tp chdn nói chung.  
{ Thích hp vi các tp chdn nhỏ đủ để lưu bộ  
nhtrong  
{ Tìm kiếm nhphân  
z Chia đôi tp chdn đã sp xếp để hn chế sbn  
ghi cn duyt  
z Ti mi ln chia hn chế được ½ sbn ghi cn xem  
xét  
Cây cân bng (BalanceTree)  
{ B-tree cân bng được tchc theo cp m, có  
các tính cht sau đây:  
z Gc ca cây hoc là mt nút lá hoc ít nht có hai  
con.  
z Mi nút (trnút gc và nút lá) có t[m/2] đến m con.  
z Mi đường đi tnút gc đến bt knút lá nào đều có  
độ dài như nhau.  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Ví dụ  
Nhn xét  
{ Cu trúc ca mi nút trong B-tree  
(p0, kl, p1, k2,...,kn, pn)  
z pi (i=l..n) là con trtrti khi i ca nút có ki là khoá  
đầu tiên ca khi đó.  
z Các khoá k trong mt nút được sp xếp theo thtự  
tăng dn.  
{ Mi khoá trong cây con, trbi pi đều nhhơn  
ki+1  
{ Mi khoá trong cây con, trbi pn đều ln hơn  
kn.  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Các phép toán  
{ Tìm kiếm 1 bn ghi  
{ Thêm 1 bn ghi  
{ Xoá 1 bn ghi  
{ Sa đổi mt bn ghi  
So sánh các cách tchc dliu  
{ Tp đống  
{ Tp băm  
{ Tp chdn  
{ Cây cân bng  
ũ Tuyết Trinh, b/m Hthng thông tin,  
Kết lun  
{ Truy cp đến CSDL thường liên quan đến mt  
ph
n nh
các b
n ghi trong m
t t
p d
li
u hay  
mt vài trường (đặc bit là các trường khoá)  
ca các bn ghi dliu.  
¾ Xác định các yêu cu này cho phép thiết kế dliu  
vt lý hiu quthông qua vic sdng các tchc  
lưu trữ đặc bit  
{ Tp chdn được to lp trên khoá tìm kiếm để  
tăng hiu quca lưu trdliu  
¾ Hiu quca các cu trúc chdn khác nhau phụ  
thuc vào điu kin áp dng chúng  
ũ Tuyết Trinh, b/m Hthng thông tin,  
pdf 13 trang baolam 26/04/2022 7340
Bạn đang xem tài liệu "Bài giảng Nhập môn cơ sở dữ liệu - Bài 5: Tổ chức dữ liệu vật lý - Vũ Tuyết Trinh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • pdfbai_giang_nhap_mon_co_so_du_lieu_bai_5_to_chuc_du_lieu_vat_l.pdf