Thiết kế cơ sở dữ liệu quan hệ - Phần VI Chuẩn hóa cơ sở dữ liệu

Dạng Chuẩn (Normal Form) của Lược Đồ Quan hệ

Định nghĩa : Dạng chuẩn là tập các tiêu chuẩn để đánh giá độ tốt & xấu (của một lược đồ Quan hệ).

Phân loại : Có 4 mức dạng chuẩn :

•Dạng chuẩn 1

•Dạng chuẩn 2

•Dạng chuẩn 3

•Dạng chuẩn Boyce-Codd (BC) » Dạng chuẩn 4

•Dạng chuẩn 5 : không được đề cập trong bài giảng này

 

ppt27 trang | Chia sẻ: ngochuyen96 | Lượt xem: 764 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Thiết kế cơ sở dữ liệu quan hệ - Phần VI Chuẩn hóa cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ (Relational Database Designing)Phần VI – CHUẨN HÓA (Standardize / Normalize) CƠ SỞ DỮ LIỆUDạng Chuẩn (Normal Form) của Lược Đồ Quan hệĐịnh nghĩa : Dạng chuẩn là tập các tiêu chuẩn để đánh giá độ tốt & xấu (của một lược đồ Quan hệ).Phân loại : Có 4 mức dạng chuẩn :Dạng chuẩn 1Dạng chuẩn 2Dạng chuẩn 3Dạng chuẩn Boyce-Codd (BC)  Dạng chuẩn 4Dạng chuẩn 5 : không được đề cập trong bài giảng nàyCác dạng chuẩn của Lược đồ Quan hệ (p.1)Dạng Chuẩn 1Định nghĩa : 1 lược đồ quan hệ Q được gọi là đạt dạng chuẩn 1 nếu toàn bộ các thuộc tính đều mang giá trị đơn (single value).Lưu ý :	Giá trị đơn : Chỉ nhận 1 giá trị tại 1 thời điểm. Ví dụ : chuỗi, số, ngày tháng, Không phải Giá trị đơn : mảng, tập hợp,  Đa số các lược đồ quan hệ đều đạt dạng chuẩn 1.Các dạng chuẩn của Lược đồ Quan hệ (p.2)Dạng Chuẩn 2Định nghĩa : 1 lược đồ quan hệ Q được gọi là đạt dạng chuẩn 2 nếu Q đạt dạng chuẩn 1 và mọi thuộc tính không khóa của Q đều phụ thuộc đầy đủ vào mọi khóa.Lưu ý : 	Thuộc tính không khóa : Xem slide chương 1	Phụ thuộc đầy đủ : K là 1 khóa của Q, X là 1 thuộc tính không khóa, X gọi là Phụ thuộc đầy đủ vào K nếu và chỉ nếu không tồn tại K’  K sao cho PTH K’X  F+ Các dạng chuẩn của Lược đồ Quan hệ (p.3)Dạng Chuẩn 2 – Ví dụCho Q(ABCD), F = {ABC;BD;BCA}Áp dụng thuật toán xác định tất cả các khóa, ta có khóa của Q là K1=AB và K2=BC.Nhận thấy :	D là 1 thuộc tính không khóa 	{B}  K2	BD  F+ Q không đạt dạng chuẩn 2Các dạng chuẩn của Lược đồ Quan hệ (p.4)Dạng Chuẩn 2 – Hệ quảNếu Q đạt dạng chuẩn 1, và không có thuộc tính không khóa thì Q đạt dạng chuẩn 2.Nếu Q đạt dạng chuẩn 1, và tất cả các khóa của Q đều chỉ có 1 thuộc tính thì Q đạt dạng chuẩn 2.Các dạng chuẩn của Lược đồ Quan hệ (p.5)Dạng Chuẩn 2 – Ý nghĩaCho quan hệ Q, K là 1 khóa, K’  K, K’, B là 1 thuộc tính không khóa. Giả sử K’  B (Q không đạt dạng chuẩn 2)Do K là khóa, => 	K  B	ta lại có	K’ B=> K chỉ đóng vai trò là siêu khóa đối với B hay B không phụ thuộc đầy đủ vào khóa. Trong thực tế, các quan hệ có tồn tại những phụ thuộc không đầy đủ thường mang lại sự không tối ưu cho CSDL.Các dạng chuẩn của Lược đồ Quan hệ (p.6)Phụ thuộc bắc cầuCho lược đồ quan hệ Q, X là tập thuộc tính thuộc Q+, A là 1 thuộc tính thuộc Q+.Định nghĩa : A được gọi là phụ thuộc bắc cầu vào X nếu và chỉ nếu :	Tồn tại tập con Y thuộc Q+ sao cho :	XY  F+ và YA  F+Y  X F+A  XYĐịnh nghĩa : A được gọi là phụ thuộc trực tiếp vào X nếu và chỉ nếu A phụ thuộc X và không phụ thuộc bắc cầu vào XCác dạng chuẩn của Lược đồ Quan hệ (p.7)Dạng Chuẩn 3Định nghĩa : 1 lược đồ quan hệ Q được gọi là đạt dạng chuẩn 3 nếu mọi thuộc tính không khóa của Q đều phụ thuộc trực tiếp vào mọi khóa.Ý nghĩa : Các phụ thuộc hàm bắc cầu của thuộc tính không khóa vào khóa gây khó khăn trong việc kiểm tra các ràng buộc toàn vẹn khi CSDL vận hành.Các dạng chuẩn của Lược đồ Quan hệ (p.8)Dạng Chuẩn 3 – Hệ quảNếu Q đạt dạng chuẩn 3 thì Q đạt dạng chuẩn 2.	CM : Giả sử Q đạt dạng chuẩn 3 và không đạt dạng chuẩn 2, => có thuộc tính A và khóa K sao cho : K’A với K’ K => KK’  K’A  A  KK’ => A phụ thuộc bắc cầu vào K => trái với giả thuyết.2.	Nếu Q không có thuộc tính không khóa thì Q đạt dạng chuẩn 3. 	CM : hiển nhiênCác dạng chuẩn của Lược đồ Quan hệ (p.9)Dạng Chuẩn 3 – Định lýCho lược đồ quan hệ Q, F là tập các phụ thuộc hàm có vế phải chỉ 1 thuộc tính. Q đạt dạng chuẩn 3 nếu và chỉ nếu mọi PTH XA  F đều có :	X là siêu khóa	A là thuộc tính khóaCác dạng chuẩn của Lược đồ Quan hệ (p.10)Dạng Chuẩn 3 – Chứng minh định lýChiều thuận : Cho Q đạt dạng chuẩn 3, xét PTH XA bất kỳ, giả sử A không là thuộc tính khóa và X không là siêu khóa.	Gọi K là 1 khóa của Q, => KX, ta có :	KX , XA	X không K (vì nếu XK thì X là 1 siêu 	khóa)	A  KX (do A K và A X) A phụ thuộc bắt cầu vào K  trái với giả thiếtCác dạng chuẩn của Lược đồ Quan hệ (p.11)Dạng Chuẩn 3 – Chứng minh định lýChiều đảo : Cho lược đồ quan hệ Q, F là tập PTH có vế phải 1 thuộc tính, với mọi XA  F ta đều có X là siêu khóa (1) hay A là thuộc tính khóa (2).	Giả sử Q không đạt dạng chuẩn 3 => tồn tại 1 khóa K, tập thuộc tính Y,thuộc tính không khóa A :	KY, YA, Y không K, AKY	Do A là thuộc tính không khóa => Y là siêu khóa => YK => trái với giả thiết.Các dạng chuẩn của Lược đồ Quan hệ (p.12)Thuật toán kiểm tra Dạng chuẩn 3Input : lược đồ Q, tập PTH F.Output : Q đạt dạng chuẩn 3 hay không.Bước 1 :	Tìm tất cả các khóa của QBước 2 : 	Tách các PTH trong F sao cho F chỉ gồm toàn các PTH có vế phải 1 thuộc tínhBước 3 :	Xét từng PTH XA trong F, nếu có A không là thuộc tính khóa và X không là siêu khóa thì kết luận Q không đạt dạng chuẩn 3.Các dạng chuẩn của Lược đồ Quan hệ (p.13)Dạng chuẩn Boyce-Codd / DC 4Định nghĩa : 1 lược đồ quan hệ Q được gọi là đạt dạng chuẩn BC nếu mọi PTH XA  F+ đều có X là siêu khóa.Hệ quả :	1.	Nếu Q đạt dạng chuẩn BC thì Q đạt dạng chuẩn 3. CM : dễ dàng từ định nghĩa.	2. 	Nếu Q chỉ có 2 thuộc tính thì Q đạt dạng chuẩn BC. CM : hiển nhiên.Các dạng chuẩn của Lược đồ Quan hệ (p.14)Dạng chuẩn BC – Định lýĐịnh lý : Q đạt dạng chuẩn BC nếu và chỉ nếu mọi PTH XA  F đều có X là siêu khóa.Chứng minh : Chiều thuận là hiển nhiên vì F  F+	Chiều đảo : Giả sử mọi XA  F đều có X là siêu khóa, và Q không đạt dạng chuẩn BC, => tồn tại YB  (F+ - F) và Y không là siêu khóa, gọi K là 1 khóa của Q, => KY và YB và Y không  K => B phụ thuộc bắc cầu vào K => Q không đạt dạng chuẩn 3 => Trái với giả thiết (Vì mọi XA  F đều có X là siêu khóa nên Q phải đạt dạng chuẩn 3 ).Các dạng chuẩn của Lược đồ Quan hệ (p.15)Thuật toán kiểm tra dạng chuẩn BCBước 1 : Tìm tất cả các khóa của Q.Bước 2 : Từ F, tạo tập phụ thuộc hàm F’ tương đương có vế phải 1 thuộc tính.Bước 3 : Duyệt các PTH XA trong F’, nếu X không là siêu khóa : kết luận Q không đạt BC, dừng thuật toán.Kết luận Q đạt BC.Các dạng chuẩn của Lược đồ Quan hệ (p.16)Thuật toán kiểm tra dạng chuẩn của Lược đồ quan hệBước 1 : Tìm tất cả khóa của Q.Bước 2 : Kiểm tra dạng chuẩn BC, nếu Q đạt BC : kết luận Q đạt BC và dừng thuật toán.Bước 3 : Kiểm tra dạng chuẩn 3, nếu Q đạt DC3 : kết luận Q đạt DC3 và dừng thuật toán.Bước 4 : Kiểm tra dạng chuẩn 2, nếu Q đạt DC2 : kết luận Q đạt DC2 và dừng thuật toán, ngược lại, Q đạt DC1 (Qui ước mọi lược đồ quan hệ đều đạt DC1)Các dạng chuẩn của Lược đồ Quan hệ (p.17)Phép tách kết nốiTách kết nối  Tách 1 lược đồ quan hệ thành 2 hay nhiều lược đồ quan hệ khác.Phép tách kết nối : ứng dụng để chuẩn hóa lược đồ quan hệ  chuẩn hóa CSDL  tách 1 lược đồ quan hệ ở dạng chuẩn thấp thành các lược đồ quan hệ ở dạng chuẩn cao hơn.Tiêu chí hàng đầu của phép tách kết nối là phải bảo toàn nghĩa là giữ được sự không mất mát thông tin (về dữ liệu / các ràng buộc  các PTH)Phép tách kết nối (p.1)Phép tách kết nối bảo toàn thông tin ( dữ liệu)Định nghĩa : Cho Q, Q1,Q2 có Q1+Q2+ = X   và Q1+Q2+=Q+Ta nói rằng Q được tách thành 2 lược đồ con. Và nếu :	 	r = r.Q1|> tr.Q1+|> t1r1: t1=t.Q1+ và t2r2: t2=t.Q2+ và t1.X=t2.X=t.X=> t r.Q1+|> tr tr.Q1+|> t1r1: t1=t.Q1+ (1)t1r1= r.Q1+ => t’r : t1=t’.Q1+ (2)(1),(2) => t.Q1+=t’.Q1+ => t.X = t’.X => t.Q2+=t’.Q2+ do XQ2+ 	=> t = t’ => t r  r = r.Q1+|><|r.Q2+ Phép tách kết nối (p.5)XXXTính chất – Ý nghĩaĐiều kiện XQ2+ trong phép tách Q thành 2 quan hệ Q1, Q2 tương đương với “X là 1 siêu khóa của Q2” hay “X chứa khóa của Q2”. Trong thực tế, X thường là khóa của Q2.Phát biểu ngắn gọn lại tính chất: “Phép tách lược đồ Q thành Q1,Q2 trên thuộc tính chung X là khóa của Q2 là phép tách bảo toàn thông tin”. Phép tách này còn được đặt tên là “Phép tách trên khóa”Phép tách kết nối (p.6)Tính chất – Ví dụCho Q(MaHS,HoTen,DiemTB,MaLop,TenLop), F = {MaHSHoTen,DiemTB,MaLop,TenLop ;	MaLopTenLop }	Nhận xét : MaHS là khóa chính của Q và Q không đạt dạng chuẩn 3 (có phụ thuộc bắc cầu MaHSMaLopTenLop).Tách Q thành Q1(MaHS,HoTen,DiemTB,MaLop) và Q2(MaLop,TenLop) với X = {MaLop}	Nhận xét : Q1, Q2 đều đạt dạng chuẩn BCPhép tách kết nối (p.7)Tính chất – Ứng dụngĐể chuẩn hóa lược đồ quan hệ về dạng chuẩn BC, ta có thể thực hiện tách các lược đồ quan hệ chưa đạt BC thành các quan hệ đạt BC :Q(A1,A2,,An) chưa đạt BC, có F={XY, }	Tách Q thành Q1 có Q1+ = Q+ - Y , Q2+ = XY	Nếu Q1, Q2 chưa đạt BC, lại tiếp tục tách Q1,Q2 thành Q11, Q12,Q21,Q22 Phép tách kết nối (p.8)

File đính kèm:

  • pptCHUAN HOA CO SO DU LIEU.ppt