Bài giảng SQL Server 2000

Bài 1: Giới Thiệu SQL Server 2000  
SQL Server 2000 là một hệ thống quản cơ sở dữ liệu (Relational Database Management  
System (RDBMS) ) sử dụng Transact-SQL để trao đổi dữ liệu giữa Client computer và SQL Server  
computer. Một RDBMS bao gồm databases, database engine và các ứng dụng dùng để quản dữ liệu và  
các bộ phận khác nhau trong RDBMS.  
SQL Server 2000 được tối ưu để thể chạy trên môi trường cơ sở dữ liệu rất lớn (Very Large  
Database Environment) lên đến Tera-Byte và có thể phục vụ cùng lúc cho hàng ngàn user. SQL Server 2000  
thể kết hợp "ăn ý" với các server khác như Microsoft Internet Information Server (IIS), E-Commerce  
Server, Proxy Server....  
SQL Server có 7 editions:  
Enterprise : Chứa đầy đủ các đặc trưng của SQL Server và có thể chạy tốt trên hệ thống lên đến  
32 CPUs và 64 GB RAM. Thêm vào đó nó có các dịch vụ giúp cho việc phân tích dữ liệu rất hiệu  
quả (Analysis Services)  
Standard : Rất thích hợp cho các công ty vừa nhỏ vì giá thành rẻ hơn nhiều so với Enterprise  
Edition, nhưng lại bị giới hạn một số chức năng cao cấp (advanced features) khác, edition này có  
thể chạy tốt trên hệ thống lên đến 4 CPU và 2 GB RAM.  
Personal: được tối ưu hóa để chạy trên PC nên có thể cài đặt trên hầu hết các phiên bản windows  
kể cả Windows 98.  
Developer : Có đầy đủ các tính năng của Enterprise Edition nhưng được chế tạo đặc biệt như giới  
hạn số lượng người kết nối vào Server cùng một lúc.... Ðây là edition mà các bạn muốn học SQL  
Server cần có. Chúng ta sẽ dùng edition này trong suốt khóa học. Edition này có thể cài trên  
Windows 2000 Professional hay Win NT Workstation.  
Desktop Engine (MSDE): Ðây chỉ một engine chạy trên desktop và không có user interface  
(giao diện). Thích hợp cho việc triển khai ứng dụng ở máy client. Kích thước database bị giới hạn  
khoảng 2 GB.  
Win CE : Dùng cho các ứng dụng chạy trên Windows CE  
Trial: Có các tính năng của Enterprise Edition, download free, nhưng giới hạn thời gian sử dụng.  
1.1. Cài Ðặt SQL Server 2000 (Installation)  
Các bạn cần Developer Edition và ít nhất là 64 MB RAM, 500 MB hard disk để thể install  
SQL Server. Bạn thể install trên Windows Server hay Windows XP Professional, Windows 2000  
Professional hay NT Workstation nhưng không thể install trên Win 98 family.  
một trong những đặc điểm của các sản phẩm Microsoft là dễ install nên chúng tôi không trình  
bày chi tiết về cách install hay các bước install mà chỉ trình bày các điểm cần lưu ý khi install mà thôi. Nếu  
các bạn gặp trở ngại trong việc install thì có thể đưa lên forum để hỏi thêm. Khi install bạn cần lưu ý các  
điểm sau:  
màn hình thứ hai bạn chọn Install Database Server. Sau khi install xong SQL Server bạn có  
thể install thêm Analysis Service nếu bạn thích.  
màn hình Installation Definition bạn chọn Server and Client Tools.  
Sau đó bạn nên chọn kiểu Custom chọn tất cả các bộ phận của SQL Server. Ngoài ra nên  
chọn các giá trị mặc định (default)  
màn hình Authentication Mode nhớ chọn Mixed Mode . Lưu ý vì SQL Server có thể dùng  
chung chế độ bảo mật (security) với Win NT và cũng thể dùng chế độ bảo mật riêng của nó. Trong  
Production Server người ta thường dùng Windows Authetication vì độ an toàn cao hơn dễ dàng cho  
người quản mạng cả cho người sử dụng. Nghĩa một khi bạn được chấp nhận (authenticated) kết nối  
vào domain thì bạn quyền truy cập dữ liệu (access data) trong SQL Server. Tuy nhiên ta nên chọn Mixed  
Mode để dễ dàng cho việc học tập.  
Sau khi install bạn sẽ thấy một icon nằm ở góc phải bên dưới màn hình, đây chính là Service  
Manager. Bạn thể Start, Stop các SQL Server services dễ dàng bằng cách double-click vào icon này.  
1.2. Một chút kiến thức về các Version của SQL Server  
SQL Server của Microsoft được thị trường chấp nhận rộng rãi kể từ version 6.5. Sau đó Microsoft  
đã cải tiến hầu như viết lại một engine mới cho SQL Server 7.0. Cho nên có thể nói từ version 6.5 lên  
version 7.0 là một bước nhảy vọt. một số đặc tính của SQL Server 7.0 không tương thích với version  
6.5. Trong khi đó từ Version 7.0 lên version 8.0 (SQL Server 2000) thì những cải tiến chủ yếu mở rộng  
các tính năng về web và làm cho SQL Server 2000 đáng tin cậy hơn.  
Một điểm đặc biệt đáng lưu ý version 2000 là Multiple-Instance. Nói cho dễ hiểu bạn có  
thể install version 2000 chung với các version trước mà không cần phải uninstall chúng. Nghĩa bạn thể  
chạy song song version 6.5 hoặc 7.0 với version 2000 trên cùng một máy (điều này không thể xảy ra với  
các version trước đây). Khi đó version trên máy bạn Default Instance còn version 2000 mới vừa  
install sẽ Named Instance.  
1.3. Các thành phần quan trọng trong SQL Server 2000  
SQL Server 2000 được cấu tạo bởi nhiều thành phần như Relational Database Engine, Analysis  
Service và English Query.... Các thành phần này khi phối hợp với nhau tạo thành một giải pháp hoàn chỉnh  
giúp cho việc lưu trữ và phân tích dữ liệu một cách dễ dàng.  
1.3.1. Relational Database Engine - Cái lõi của SQL Server:  
Ðây là một engine có khả năng chứa data các quy mô khác nhau dưới dạng table và  
support tất cả các kiểu kết nối (data connection) thông dụng của Microsoft như ActiveX Data  
Objects (ADO), OLE DB, and Open Database Connectivity (ODBC). Ngoài ra nó còn có khả năng tự  
điều chỉnh (tune up) ví dụ như sử dụng thêm các tài nguyên (resource) của máy khi cần trả lại  
tài nguyên cho hệ điều hành khi một user log off.  
1.3.2. Replication - Cơ chế tạo bản sao (Replica):  
Giả sử bạn một database dùng để chứa dữ liệu được các ứng dụng thường xuyên cập  
nhật. Một ngày đẹp trời bạn muốn một cái database giống y hệt như thế trên một server khác  
để chạy báo cáo (report database) (cách làm này thường dùng để tránh ảnh hưởng đến  
performance của server chính). Vấn đề là report server của bạn cũng cần phải được cập nhật  
thường xuyên để đảm bảo tính chính xác của các báo cáo. Bạn không thể dùng cơ chế back up  
and restore trong trường hợp này. Thế thì bạn phải làm sao? Lúc đó cơ chế replication của SQL  
Server sẽ được sử dụng để bảo đảm cho dữ liệu ở 2 database được đồng bộ (synchronized).  
Replication sẽ được bàn kỹ trong bài 12  
1.3.3. Data Transformation Service (DTS) - Một dịch vụ chuyển dịch data vô cùng  
hiệu quả  
Nếu bạn làm việc trong một công ty lớn trong đó data được chứa trong nhiều nơi khác  
nhau và các dạng khác nhau cụ thể như chứa trong Oracle, DB2 (của IBM), SQL Server,  
Microsoft Access....Bạn chắc chắn sẽ có nhu cầu di chuyển data giữa các server này (migrate hay  
transfer) và không chỉ di chuyển bạn còn muốn định dạng (format) nó trước khi lưu vào database  
khác, khi đó bạn sẽ thấy DTS giúp bạn giải quyết công việc trên dễ dàng như thế nào. DTS sẽ  
được bàn kỹ trong bài 8.  
1.3.4. Analysis Service - Một dịch vụ phân tích dữ liệu rất hay của Microsoft  
Dữ liệu (Data) chứa trong database sẽ chẳng có ý nghĩa nhiều nếu như bạn không thể  
lấy được những thông tin (Information) bổ ích từ đó. Do đó Microsoft cung cấp cho bạn một công  
cụ rất mạnh giúp cho việc phân tích dữ liệu trở nên dễ dàng và hiệu quả bằng cách dùng khái niệm  
hình khối nhiều chiều (multi-dimension cubes) và kỹ thuật "đào mỏ dữ liệu" (data mining) sẽ được  
chúng tôi giới thiệu trong bài 13.  
1.3.5. English Query - Một dịch vụ người Việt Nam chắc là ít muốn dùng :-) (?)  
Ðây là một dịch vụ giúp cho việc query data bằng tiếng Anh "trơn" (plain English).  
1.3.6. Meta Data Service:  
Dịch vụ này giúp cho việc chứa đựng và "xào nấu" Meta data dễ dàng hơn. Thế thì Meta  
Data là cái gì vậy? Meta data là những thông tin mô tả về cấu trúc của data trong database như  
data thuộc loại nào String hay Integer..., một cột nào đó phải là Primary key hay không....Bởi vì  
những thông tin này cũng được chứa trong database nên cũng một dạng data nhưng để phân  
biệt với data "chính thống" người ta gọi nó là Meta Data. Phần này chắc bạn phải xem thêm  
trong một thành phần khác của SQL Server sắp giới thiệu sau đây SQL Server Books Online vì  
không có bài nào trong loạt bài này nói rõ về dịch vụ này cả.  
1.3.7. SQL Server Books Online - Quyển Kinh Thánh không thể thiếu:  
Cho dù bạn đọc các sách khác nhau dạy về SQL server thì bạn cũng sẽ thấy books  
online này rất hữu dụng và không thể thiếu được( cho nên Microsoft mới hào phóng đính kèm theo  
SQL Server).  
1.3.8. SQL Server Tools - Ðây là một bộ đồ nghề của người quản trị cơ sở dữ liệu (DBA )  
Ái chà nếu kể chi tiết ra thì hơi nhiều đấy cho nên bạn cần đọc thêm trong books online.  
Ở đây người viết chỉ kể ra một vài công cụ thông dụng mà thôi.  
Ðầu tiên phải kể đến Enterprise Manager. Ðây là một công cụ cho ta thấy toàn cảnh hệ thống  
cơ sở dữ liệu một cách rất trực quan. Nó rất hữu ích đặc biệt cho người mới học và không thông  
thạo lắm về SQL.  
Kế đến Query Analyzer. Ðối với một DBA giỏi thì hầu như chỉ cần công cụ này là có thể quản  
cả một hệ thống database mà không cần đến những thứ khác. Ðây là một môi trường làm việc  
khá tốt vì ta có thể đánh bất kỳ câu lệnh SQL nào và chạy ngay lập tức đặc biệt là nó giúp cho ta  
debug mấy cái stored procedure dễ dàng.  
Công cụ thứ ba cần phải kể đến SQL Profiler. Nó có khả năng "chụp" (capture) tất cả các sự  
kiện hay hoạt động diễn ra trên một SQL server và lưu lại dưới dạng text file rất hữu dụng trong  
việc kiểm soát hoạt động của SQL Server.  
Ngoài một số công cụ trực quan như trên chúng ta cũng thường hay dùng osql bcp (bulk  
copy) trong command prompt.  
Bài 2: Giới Thiệu Sơ Lược Về Transact SQL (T-SQL)  
Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO (International Organization  
for Standardization) và ANSI (American National Standards Institute) được sử dụng trong SQL Server khác  
với P-SQL (Procedural-SQL) dùng trong Oracle.  
Trong bài này chúng ta sẽ tìm hiểu sơ qua về T-SQL. Chúng được chia làm 3 nhóm:  
2.1. Data Definition Language (DDL):  
Ðây là những lệnh dùng để quản lý các thuộc tính của một database như định nghĩa các hàng hoặc  
cột của một table, hay vị trí data file của một database...thường dạng  
Create object_Name  
Alter object_Name  
Drop object_Name  
Trong đó object_Name thể một table, view, stored procedure, indexes...  
dụ:  
Lệnh Create sau sẽ tạo ra một table tên Importers với 3 cột CompanyID,CompanyName,Contact  
USE Northwind  
CREATE TABLE Importers(  
CompanyID int NOT NULL,  
CompanyName varchar(40) NOT NULL,  
Contact varchar(40) NOT NULL  
)
Lệnh Alter sau đây cho phép ta thay đổi định nghĩa của một table như thêm(hay bớt) một cột hay một  
Constraint...Trong ví dụ này ta sẽ thêm cột ContactTitle vào table Importers  
USE Northwind  
ALTER TABLE Importers  
ADD ContactTitle varchar(20) NULL  
Lệnh Drop sau đây sẽ hoàn toàn xóa table khỏi database nghĩa cả định nghĩa của table và data bên  
trong table đều biến mất (khác với lệnh Delete chỉ xóa data nhưng table vẫn tồn tại).  
USE Northwind  
DROP TABLE Importers  
2.2. Data Control Language (DCL):  
Ðây là những lệnh quản lý các quyền truy cập lên từng object (table, view, stored procedure...). Thường có  
dạng sau:  
Grant  
Revoke  
Deny  
dụ:  
Lệnh sau sẽ cho phép user trong Public Role được quyền Select đối với table Customer trong database  
Northwind (Role một khái niệm giống như Windows Group sẽ được bàn kỹ trong phần Security)  
USE Northwind  
GRANT SELECT  
ON Customers  
TO PUBLIC  
Lệnh sau sẽ từ chối quyền Select đối với table Customer trong database Northwind của các user trong  
Public Role  
USE Northwind  
DENY SELECT  
ON Customers  
TO PUBLIC  
Lệnh sau sẽ xóa bỏ tác dụng của các quyền được cho phép hay từ chối trước đó  
USE Northwind  
REVOKE SELECT  
ON Customers  
TO PUBLIC  
2.3. Manipulation Language (DML):  
Ðây là những lệnh phổ biến dùng để xử lý data như Select, Update, Insert, Delete  
dụ:  
Select  
USE Northwind  
SELECT CustomerID, CompanyName, ContactName  
FROM Customers  
WHERE (CustomerID = 'alfki' OR CustomerID = 'anatr')  
ORDER BY ContactName  
Insert  
USE Northwind  
INSERT INTO Territories  
VALUES (98101, 'Seattle', 2)  
Update  
USE Northwind  
UPDATE Territories  
SET TerritoryDescription = 'Downtown Seattle'  
WHERE TerritoryID = 98101  
Delete  
USE Northwind  
DELETE FROM Territories  
WHERE TerritoryID = 98101  
phần này khá căn bản nên chúng tôi thiết nghĩ không cần giải thích nhiều. Chú ý trong lệnh Delete bạn  
thể chữ From hay không đều được.  
Nhưng mà chúng ta sẽ chạy thử các ví dụ trên ở đâu?  
Ðể chạy các câu lệnh thí dụ ở trên bạn cần sử dụng và làm quen với Query Analyser  
Cú Pháp Của T-SQL:  
Phần này chúng ta sẽ bàn về các thành phần tạo nên cú pháp của T-SQL  
Identifiers  
Ðây chính là tên của các database object. Nó dùng để xác định một object. (Chú ý khi nói đến Object trong  
SQL Server là chúng ta muốn đề cập đến table, view, stored procedure, index.....Vì hầu như mọi thứ trong  
SQL Server đều được thiết kế theo kiểu hướng đối tượng (object-oriented)). Trong ví dụ sau TableX,  
KeyCol, Description là những identifiers  
CREATE TABLE TableX  
(KeyCol INT PRIMARY KEY, Description NVARCHAR(80))  
Có hai loại Identifiers một loại thông thường (Regular Identifier) và một loại gọi Delimited  
Identifier, loại này cần dấu "" hay dấu [] để ngăn cách. Loại Delimited được dùng đối với các chữ trùng  
với từ khóa của SQL Server (reserved keyword) hay các chữ khoảng trống.  
dụ:  
SELECT * FROM [My Table]  
WHERE [Order] = 10  
Trong ví dụ trên chữ Order trùng với keyword Order nên cần đặt trong dấu ngoặc vuông [].  
Variables (Biến)  
Biến trong T-SQL cũng chức năng tương tự như trong các ngôn ngữ lập trình khác nghĩa cần khai báo  
trước loại dữ liệu trước khi sử dụng. Biến được bắt đầu bằng dấu @ (Ðối với các global variable thì có hai  
dấu @@)  
dụ:  
USE Northwind  
DECLARE @EmpIDVar INT  
SET @EmpIDVar = 3  
SELECT * FROM Employees  
WHERE EmployeeID = @EmpIDVar + 1  
Functions (Hàm)  
Có 2 loại hàm một loại là built-in và một loại user-defined  
Các hàm Built-In được chia làm 3 nhóm:  
Rowset Functions : Loại này thường trả về một object và được đối xử như một table. Ví dụ như  
hàm OPENQUERY sẽ trả về một recordset và có thể đứng vị trí của một table trong câu lệnh  
Select.  
Aggregate Functions : Loại này làm việc trên một số giá trị trả về một giá trị đơn hay là các  
giá trị tổng. dụ như hàm AVG sẽ trả về giá trị trung bình của một cột.  
Scalar Functions : Loại này làm việc trên một giá trị đơn trả về một giá trị đơn. Trong loại này  
lại chia làm nhiều loại nhỏ như các hàm về toán học, về thời gian, xử kiểu dữ liệu String....Ví dụ  
như hàm MONTH('2002-09-30') sẽ trả về tháng 9.  
Các hàm User-Defined (được tạo ra bởi câu lệnh CREATE FUNCTION và phần body thường được gói trong  
cặp lệnh BEGIN...END) cũng được chia làm các nhóm như sau:  
Scalar Functions : Loại này cũng trả về một giá trị đơn bằng câu lệnh RETURNS.  
Table Functions : Loại này trả về một table  
Data Type (Loại Dữ Liệu)  
Các loại dữ liệu trong SQL Server sẽ được bàn kỹ trong các bài sau  
Expressions  
Các Expressions có dạng Identifier + Operators (như +,-,*,/,=...) + Value  
Các thành phần Control-Of Flow  
Như BEGIN...END, BREAK, CONTINUE, GOTO, IF...ELSE, RETURN, WHILE.... Xin xem thêm Books Online để  
biết thêm về các thành phần này.  
Comments (Chú Thích)  
T-SQL dùng dấu -- để đánh dấu phần chú thích cho câu lệnh đơn và dùng /*...*/ để chú thích cho một  
nhóm  
Thực Thi Các Câu Lệnh SQL  
Thực thi một câu lệnh đơn:  
Một câu lệnh SQL được phân ra thành các thành phần cú pháp như trên bởi một parser, sau đó SQL  
Optimizer (một bộ phận quan trọng của SQL Server) sẽ phân tích và tìm cách thực thi (Execute Plan) tối ưu  
nhất dụ như cách nào nhanh và tốn ít tài nguyên của máy nhất... và sau đó SQL Server Engine sẽ thực  
thi và trả về kết quả.  
Thực Thi một nhóm lệnh (Batches)  
Khi thực thi một nhóm lệnh SQL Server sẽ phân tích và tìm biện pháp tối ưu cho các câu lệnh như một câu  
lệnh đơn chứa execution plan đã được biên dịch (compiled) trong bộ nhớ sau đó nếu nhóm lệnh trên  
được gọi lại lần nữa thì SQL Server không cần biên dịch mà có thể thực thi ngay điều này giúp cho một  
batch chạy nhanh hơn.  
Lệnh GO  
Lệnh này chỉ dùng để gởi một tín hiệu cho SQL Server biết đã kết thúc một batch job và yêu cầu thực thi.  
vốn không phải một lệnh trong T-SQL.  
Bài tập 2 SQL Server 2000  
Manipulate Data and Stored Procedure  
Please follow those steps to practise:  
1. Use bcp to export all data from Orders table of PracticeDB to c:\Orders.txt (or to c:\Orders.csv)  
2. Change some data in the c:\Orders.txt and save. Then import to Orders table from the text file  
using bcp  
3. Import Orders.txt to Orders table using BULK INSERT  
4. Create a Linked Server ‘LinkedPracticeDB’ which link to an Access database ‘PracticeDB.mdb’  
(firstly you have to create an Access database similar to PracticeDB in SQL Server and input some  
data). Then do a select data using four-part name and OPENQUERY  
5. Using ad hoc computer name with OPENROWSET and OPENDATASOURCE functions to  
select data from ‘PracticeDB.mdb’  
6. Create the following Cursor  
DECLARE @au_lname varchar(40), @au_fname varchar(20)  
DECLARE Employee_Cursor CURSOR FOR  
SELECT LastName, FirstName FROM Northwind.dbo.Employees  
OPEN Employee_Cursor  
FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname  
WHILE @@FETCH_STATUS = 0  
BEGIN  
PRINT 'Author:' + @au_fname + ' ' + @au_lname  
FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname  
END  
CLOSE Employee_Cursor  
DEALLOCATE Employee_Cursor  
7. Create the following stored procedure and try to execute with some values  
CREATE PROCEDURE AddNewOrder  
@OrderID smallint,  
@ProductName varchar(50),  
@CustomerName varchar(50),  
@Result smallint=1 Output  
AS  
DECLARE @CustomerID smallint  
BEGIN TRANSACTION  
If not Exists(SELECT CustomerID FROM Customers WHERE [Name]=@CustomerName)  
BEGIN  
SET @CustomerID= (SELECT Max(CustomerID) FROM Customers)  
SET @CustomerID=@CustomerID+1  
INSERT INTO Customers VALUES(@CustomerID,@CustomerName)  
If Exists(SELECT OrderID FROM [Orders] WHERE OrderID=@OrderID)  
BEGIN  
SELECT @Result=1  
ROLLBACK TRANSACTION  
END  
Else  
BEGIN  
INSERT INTO [Orders](OrderID,ProductName,CustomerID)  
VALUES(@OrderID,@ProductName,@CustomerID)  
SELECT @Result=0  
COMMIT TRANSACTION  
END  
END  
Else  
BEGIN  
If Exists(SELECT OrderID FROM [Orders] WHERE OrderID=@OrderID)  
BEGIN  
SELECT @Result=1  
ROLLBACK TRANSACTION  
END  
Else  
BEGIN  
INSERT INTO [Orders](OrderID,ProductName,CustomerID)  
VALUES(@OrderID,@ProductName,@CustomerID)  
SELECT @Result=0  
COMMIT TRANSACTION  
END  
END  
Print @Result  
Return  
9. Using VB 6 or VB.NET to execute the ‘AddNewOrder’ stored procedure  
10. Using xp_cmdshell extended stored procedure to send a message (xp_cmdshell ‘net send Hello’)  
Bài 3: Design and Implement a SQL Server Database  
3.1. Cấu Trúc Của SQL Server  
Như đã trình bày các bài trước một trong những đặc điểm của SQL Server 2000 là Multiple-  
Instance nên khi nói đến một (SQL) Server nào đó là ta nói đến một Instance của SQL Server 2000, thông  
thường đó là Default Instance. Một Instance của SQL Server 2000 có 4 system databases và một hay nhiều  
user database. Các system databases bao gồm:  
Master : Chứa tất cả những thông tin cấp hệ thống (system-level information) bao gồm thông tin  
về các database khác trong hệ thống như vị trí của các data files, các login account và các thiết đặt  
cấu hình hệ thống của SQL Server (system configuration settings).  
Tempdb : Chứa tất cả những table hay stored procedure được tạm thời tạo ra trong quá trình làm  
việc bởi user hay do bản thân SQL Server engine. Các table hay stored procedure này sẽ biến mất  
khi khởi động lại SQL Server hay khi ta disconnect.  
Model : Database này đóng vai trò như một bảng kẻm (template) cho các database khác. Nghĩa là  
khi một user database được tạo ra thì SQL Server sẽ copy toàn bộ các system objects (tables,  
stored procedures...) từ Model database sang database mới vừa tạo.  
Msdb : Database này được SQL Server Agent sử dụng để hoạch định các báo động và các công  
việc cần làm (schedule alerts and jobs).  
3.2. Cấu Trúc Vật Của Một SQL Server Database  
Mỗi một database trong SQL Server đều chứa ít nhất một data file chính (primary), có thể có thêm một hay  
nhiều data file phụ (Secondary) và một transaction log file.  
Primary data file (thường phần mở rộng .mdf) : đây là file chính chứa data và những system  
tables.  
Secondary data file (thường phần mở rộng .ndf) : đây là file phụ thường chỉ sử dụng khi  
database được phân chia để chứa trên nhiều dĩa.  
Transaction log file (thường phần mở rộng .ldf) : đây là file ghi lại tất cả những thay đổi diễn  
ra trong một database và chứa đầy đủ thông tin để thể roll back hay roll forward khi cần.  
Data trong SQL Server được chứa thành từng Page 8KB và 8 page liên tục tạo thành một Extent như hình  
vẽ dưới đây:  
Trước khi SQL Server muốn lưu data vào một table nó cần phải dành riêng một khoảng trống trong  
data file cho table đó. Những khoảng trống đó chính là các extents. Có 2 loại Extents: Mixed Extents (loại  
hỗn hợp) dùng để chứa data của nhiều tables trong cùng một Extent và Uniform Extent (loại thuần nhất)  
dùng để chứa data của một table. Ðầu tiên SQL Server dành các Page trong Mixed Extent để chứa data cho  
một table sau đó khi data tăng trưởng thì SQL dành hẳn một Uniform Extent cho table đó.  
3.3. Nguyên Tắc Hoạt Ðộng Của Transaction Log Trong SQL Server  
Transaction log file trong SQL Server dùng để ghi lại các thay đổi xảy ra trong database. Quá trình này diễn  
ra như sau: đầu tiên khi có một sự thay đổi data như Insert, Update, Delete được yêu cầu từ các ứng dụng,  
SQL Server sẽ tải (load) data page tương ứng lên memory (vùng bộ nhớ này gọi là data cache), sau đó data  
trong data cache được thay đổi(những trang bị thay đổi còn gọi dirty-page). Tiếp theo mọi sự thay đổi  
đều được ghi vào transaction log file cho nên người ta gọi write-ahead log. Cuối cùng thì một quá trình  
gọi Check Point Process sẽ kiểm tra và viết tất cả những transaction đã được commited (hoàn tất) vào  
dĩa cứng (flushing the page).  
Ngoài Check Point Process những dirty-page còn được đưa vào dĩa bởi một Lazy writer. Ðây là  
một anh chàng làm việc âm thầm chỉ thức giấc và quét qua phần data cache theo một chu kỳ nhất định sau  
đó lại ngủ yên chờ lần quét tới.  
Xin giải thích thêm một chút về khái niệm transaction trong database. Một transaction hay một  
giao dịch một loạt các hoạt động xảy ra được xem như một công việc đơn (unit of work) nghĩa hoặc  
thành công toàn bộ hoặc không làm gì cả (all or nothing). Sau đây một dụ cổ điển về transaction:  
Chúng ta muốn chuyển một số tiền $500 từ account A sang  
account B như vậy công việc này cần làm các bước sau:  
1.  
2.  
Trừ $500 từ account A  
Cộng $500 vào account B  
Tuy nhiên việc chuyển tiền trên phải được thực hiện dưới dạng một transaction nghĩa là giao  
dịch chỉ được xem là hoàn tất (commited) khi cả hai bước trên đều thực hiện thành công. Nếu một lý do  
nào đó ta chỉ thể thực hiện được bước 1 (chẳng hạn như vừa xong bước 1 thì điện cúp hay máy bị treo)  
thì xem như giao dịch không hoàn tất cần phải được phục hồi lại trạng thái ban đầu (roll back).  
Thế thì Check Point Process hoạt động như thế nào để thể đảm bảo một transaction được thực  
thi mà không làm "dơ" database.  
Trong hình vẽ trên, một transaction được biểu diễn bằng một mũi tên. Trục nằm ngang là trục thời  
gian. Giả sử một Check Point được đánh dấu vào thời điểm giữa transaction 2 và 3 như hình vẽ và sau đó  
sự cố xãy ra trước khi gặp một Check point kế tiếp. Như vậy khi SQL Server được restart nó sẽ dựa trên  
những gì ghi trong transaction log file để phục hồi data (xem hình vẽ).  
Ðiều đó nghĩa là SQL Server sẽ không cần làm gì cả đối với transaction 1 vì tại thời điểm Check  
point data đã được lưu vào dĩa rồi. Trong khi đó transaction 2 và 4 sẽ được roll forward vì tuy đã được  
commited nhưng do sự cố xảy ra trước thời điểm check point kế tiếp nên data chưa kịp lưu vào dĩa. Tức là  
dựa trên những thông tin được ghi trên log file SQL Server hoàn toàn có đầy đủ cơ sở để viết vào dĩa cứng.  
Còn transaction 3 và 5 thì chưa được commited (do bị down bất ngờ) cho nên SQL Server sẽ roll back hai  
transaction này dựa trên những được ghi trên log file.  
3.4. Cấu Trúc Logic Của Một SQL Server Database  
Hầu như mọi thứ trong SQL Server được tổ chức thành những objects ví dụ như tables, views,  
stored procedures, indexes, constraints.... Những system objects trong SQL Server thường bắt đầu bằng  
chữ sys hay sp. Các objects trên sẽ được nghiên cứu lần lượt trong các bài sau do đó trong phần này chúng  
ta chỉ bàn qua một số system object thông dụng trong SQL Server database mà thôi.  
Một số Sytem objects thường dùng:  
System Stored Procedure  
Ứng dụng  
Cung cấp thông tin về một database object (table, view...) hay một  
data type.  
Sp_help ['object']  
Sp_helpdb ['database']  
Sp_monitor  
Cung cấp thông tin về một database cụ thể nào đó.  
Cho biết độ bận rộn của SQL Server  
Sp_spaceused ['object',  
'updateusage' ]  
Cung cấp thông tin về các khoảng trống đã được sử dụng cho một  
object nào đó  
System Stored Procedure  
Ứng dụng  
Sp_who ['login']  
Cho biết thông tin về một SQL Server user  
dụ:  
sp_helpdb 'Northwind' sẽ cho kết quả dạng như bảng dưới đây  
name db_size owner dbid created status .....  
-------------------------------------------------------------------------------------------------------------------------------- ---  
----  
Northwind  
3.94 MB  
sa  
6
Aug 6 2000  
Status=ONLINE, Updateability=READ_WRITE, .....  
stored procedure sp_spaceused như dụ sau  
USE Northwind  
Go  
sp_spaceused 'Customers'  
sẽ cho biết thông tin về table Customer:  
name  
------------------------------------- ------------------------------------------  
Customers 91 104 KB 24 KB 80 KB 0 KB  
rows  
reserved  
data  
index_size  
unused  
3.5. Cách tạo một User Database  
Chúng ta có thể tạo một database dễ dàng dùng SQL Server Enterprise bằng cách right-click lên  
trên "database" và chọn "New Database" như hình vẽ sau:  
Sau đó chúng ta chỉ việc đánh tên của database và click OK.  
Ngoài ra đôi khi chúng ta cũng dùng SQL script để tạo một database. Khi đó ta phải chỉ vị trí của primary  
data file và transaction log file.  
dụ:  
USE master  
GO  
CREATE DATABASE Products  
ON  
( NAME = prods_dat,  
FILENAME = 'c:\program files\microsoft SQL server\mssql\data\prods.mdf',  
SIZE = 4,  
MAXSIZE = 10,  
FILEGROWTH = 1  
)
GO  
Trong ví dụ trên ta tạo một database tên là Products với logical file name là prods_dat và physical  
file name là prods.mdf, kích thước ban đầu là 4 MB và data file sẽ tự động tăng lên mỗi lần 1 MB cho tới tối  
đa là 10 MB. Nếu ta không chỉ định một transaction log file thì SQL sẽ tự động tạo ra 1 log file với kích  
thước ban đầu là 1 MB.  
Lưu Ý:  
Khi tạo ra một database chúng ta cũng phải lưu ý một số điểm sau: Ðối với các hệ thống nhỏ ở đó  
vấn đề tốc độ của server không thuộc loại nhạy cảm thì chúng ta thường chọn các giá trị mặc định (default)  
cho Initial size, Automatically growth file. Nhưng trên một số production server của các hệ thống lớn  
kích thước của database phải được người DBA ước lượng trước tùy theo tầm cỡ của business, và thông  
thường người ta không chọn Autogrowth(tự động tăng trưởng) Autoshrink(tự động nén). Câu hỏi được  
đặt ra ở đây là vì sao ta không để SQL Server chọn một giá trị khởi đầu cho datafile và sau đó khi cần thì nó  
sẽ tự động nới rộng ra mà lại phải ước lượng trước? Nguyên nhân là nếu chọn Autogrowth (hay Autoshrink)  
thì chúng ta có thể sẽ gặp 2 vấn đề sau:  
Performance hit: Ảnh hưởng đáng kể đến khả năng làm việc của SQL Server. Do nó phải thường  
xuyên kiểm tra xem có đủ khoảng trống cần thiết hay không và nếu không đủ sẽ phải mở rộng  
bằng cách dành thêm khoảng trống từ dĩa cứng và chính quá trình này sẽ làm chậm đi hoạt động  
của SQL Server.  
Disk fragmentation : Việc mở rộng trên cũng sẽ làm cho data không được liên tục chứa ở  
nhiều nơi khác nhau trong dĩa cứng điều này cũng gây ảnh hưởng lên tốc độ làm việc của SQL  
Server.  
Trong các hệ thống lớn người ta có thể dự đoán trước kích thước của database bằng cách tính toán  
kích thước của các tables, đây cũng chỉ là kích thước ước đoán mà thôi (xin xem "Estimating the size of a  
database" trong SQL Books Online để biết thêm về cách tính) và sau đó thường xuyên dùng một số câu  
lệnh SQL (thường dùng các câu lệnh bắt đầu bằng DBCC .Phần này sẽ được bàn qua trong các bài sau)  
kiểm tra xem có đủ khoảng trống hay không nếu không đủ ta có thể chọn một thời điểm mà SQL server ít  
bận rộn nhất (như ban đêm hay sau giờ làm việc) để nới rộng data file như thế sẽ không làm ảnh hưởng tới  
performance của Server.  
Chú ý giả sử ta dành sẵn 2 GB cho datafile, khi dùng Window Explorer để xem ta sẽ thấy kích thước của file  
là 2 GB nhưng data thực tế thể chỉ chiếm vài chục MB mà thôi.  
3.6. Những Ðiểm Cần Lưu Ý Khi Thiết Kế Một Database  
Trong phạm vi bài này chúng ta không thể nói sâu về thuyết thiết kế database mà chỉ đưa ra  
một vài lời khuyên mà bạn nên tuân theo khi thiết kế.  
Trước hết bạn phải nắm vững về các loại data type. Ví dụ bạn phải biết sự khác biệt giữa  
char(10), nchar(10) varchar(10), nvarchar(10). Loại dữ liệu Char là một loại string có kích thước cố  
định nghĩa là trong ví dụ trên nếu data đưa vào "This is a really long character string" (lớn hơn 10 ký tự) thì  
SQL Server sẽ tự động cắt phần đuôi và ta chỉ còn "This is a". Tương tự nếu string đưa vào nhỏ hơn 10 thì  
SQL sẽ thêm khoảng trống vào phía sau cho đủ 10 ký tự. Ngược lại loại varchar sẽ không thêm các khoảng  
trống phía sau khi string đưa vào ít hơn 10. Còn loại data bắt đầu bằng chữ n chứa dữ liệu dạng unicode.  
Một lưu ý khác là trong SQL Server ta có các loại Integer như : tinyint, smallint, int, bigint.  
Trong đó kích thước từng loại tương ứng là 1,2,4,8 bytes. Nghĩa loại smallint tương đương với Integer  
loại int tương đương với Long trong VB.  
Khi thiết kế table nên:  
Có ít nhất một cột thuộc loại ID dùng để xác định một record dễ dàng.  
Chỉ chứa data của một entity (một thực thể)  
Trong ví dụ sau thông tin về Sách và Nhà Xuất Bản được chứa trong cùng một table  
Books  
BookID Title  
Publisher  
PubState PubCity  
CA Berkely  
PubCountry  
USA  
1
Inside SQL Server 2000 Microsoft Press  
2
3
Windows 2000 Server New Riders  
MA  
CA  
Boston  
Berkely  
USA  
USA  
Beginning Visual Basic  
Wrox  
6.0  
Ta nên tách ra thành table Books và table Publisher như sau:  
Books  
BookID  
Title  
PublisherID  
1
2
3
Inside SQL Server 2000  
Windows 2000 Server  
Beginning Visual Basic 6.0  
P1  
P2  
P3  
và  
Publishers  
PublisherID Publisher  
PubState  
CA  
MA  
PubCity  
Berkely  
Boston  
Berkely  
PubCountry  
USA  
USA  
P1  
P2  
P3  
Microsoft Press  
New Riders  
Wrox  
CA  
USA  
Tránh dùng cột chứa NULL và nên luôn có giá trị Default cho các cột  
Tránh lập lại một giá trị hay cột nào đó  
dụ một cuốn sách có thể được viết bởi hơn một tác giả như thế ta có thể dùng một trong 2  
cách sau để chứa data:  
Books  
BookID  
Title  
Authors  
1
2
Inside SQL Server 2000  
Windows 2000 Server  
John Brown  
Matthew Bortniker, Rick Johnson  
Peter Wright, James Moon, John  
Brown  
3
Beginning Visual Basic 6.0  
hay  
Books  
Author1  
BookID Title  
1
2
Author2  
Null  
Author3  
Null  
Null  
Inside SQL Server 2000 John Brown  
Windows 2000 Server Matthew Bortniker Rick Johnson  
Beginning Visual Basic  
6.0  
3
Peter Wright  
James Moon  
John Brown  
Tuy nhiên việc lập đi lập lại cột Author sẽ tạo nhiều vấn đề sau này. Chẳng hạn như nếu cuốn sách  
nhiều hơn 3 tác giả thì chúng ta sẽ gặp phiền phức ngay....Trong ví dụ này ta nên chặt ra thành 3 table  
như sau:  
Books  
BookID  
Title  
1
2
3
Inside SQL Server 2000  
Windows 2000 Server  
Beginning Visual Basic 6.0  
Authors  
AuthID  
A1  
First Name  
John  
Last Name  
Brown  
A2  
A3  
A4  
Matthew  
Rick  
Peter  
Bortniker  
Johnson  
Wright  
A5  
James  
Moon  
AuthorBook  
BookID  
AuthID  
A1  
A2  
A3  
A4  
1
2
2
3
3
3
A5  
A1  
Ngoài ra một trong những điều quan trọng phải biết rõ quan hệ (Relationship) giữa các table:  
One-to-One Relationships : trong mối quan hệ này thì một hàng bên table A không thể liên kết  
với hơn 1 hàng bên table B và ngược lại.  
One-to-Many Relationships : trong mối quan hệ này thì một hàng bên table A có thể liên kết  
với nhiều hàng bên table B.  
Many-to-Many Relationships : trong mối quan hệ này thì một hàng bên table A có thể liên kết  
với nhiều hàng bên table B và một hàng bên table B cũng thể liên kết với nhiều hàng bên table  
A. Như ta thấy trong ví dụ trên một cuốn sách có thể được viết bởi nhiều tác giả một tác giả  
cũng thể viết nhiều cuốn sách. Do đó mối quan hệ giữa Books và Authors là quan hệ Many to  
Many. Trong trường hợp này người ta thường dùng một table trung gian để giải quyết vấn đề  
(table AuthorBook).  
Ðể một database tương đối hoàn hảo nghĩa thiết kế sao cho data chứa trong database không  
thừa không thiếu bạn cần biết thêm về các thủ thuật Normalization. Tuy nhiên trong phạm vi khóa học  
này chúng tôi không muốn bàn sâu hơn về đề tài này, bạn thể xem thêm trong các sách dạy thuyết cơ  
sở dữ liệu.  
Tải về để xem bản đầy đủ
doc 44 trang baolam 09/05/2022 4040
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng SQL Server 2000", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

  • docbai_giang_sql_server_2000.doc