Báo cáo nghiên cứu khoa học: " GIỚI THIỆU CẤU TRÚC CHỈ MỤC GR-TREE VÀ 4-R ĐỐI VỚI DỮ LIỆU THEO HAI LOẠI THỜI GIAN" pot

13 524 0
Báo cáo nghiên cứu khoa học: " GIỚI THIỆU CẤU TRÚC CHỈ MỤC GR-TREE VÀ 4-R ĐỐI VỚI DỮ LIỆU THEO HAI LOẠI THỜI GIAN" pot

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TẠP CHÍ KHOA HỌC, Đại học Huế, Số 59, 2010 GIỚI THIỆU CẤU TRÚC CHỈ MỤC GR-TREE VÀ 4-R ĐỐI VỚI DỮ LIỆU THEO HAI LOẠI THỜI GIAN Ngô Quỳnh Như, Hoàng Quang Trường Đại học Khoa học, Đại học Huế TÓM TẮT Các sở liệu theo hai loại thời gian cho phép bổ sung nên chúng thường có kích cỡ lớn Mặt khác, chúng thường chứa phần đáng kể liệu theo hai loại thời gian động nên vấn đề xử lý tìm kiếm liệu lại phức tạp tốn nhiều thời gian Một số phương pháp giúp truy cập hiệu loại liệu bổ sung cấu trúc truy xuất phụ, gọi mục Bài báo giới thiệu hai cấu trúc mục hiệu nhằm cho phép truy lục liệu theo hai loại thời gian, đặc biệt thời gian động, GR-tree 4R Giới thiệu Thời gian thuộc tính tượng giới thực Vì vậy, phần lớn ứng dụng sở liệu (CSDL) quản lý liệu thay đổi theo thời gian Có hai loại thời gian thường quan tâm thời gian hợp lệ (Valid Time) thời gian giao tác (Transaction Time) Thời gian hợp lệ kiện thời gian kiện xảy thực tế, thời gian giao tác thời gian lúc kiện lưu trữ CSDL Dữ liệu hỗ trợ hai loại thời gian gọi liệu theo hai loại thời gian Bài báo tập trung trình bày hai cấu trúc mục hỗ trợ liệu theo hai loại thời gian động (thời gian thay đổi theo thời gian tại) GR-tree [1], [5] 4-R [2], [5] Bằng cách sử dụng biến NOW UC, GR-tree mã hóa xác hình dạng vùng theo hai loại thời gian nút vùng giới hạn cực tiểu nút nhánh Các vùng giới hạn tăng trưởng vùng bên chúng tăng trưởng Tuy nhiên, để cài đặt GR-tree cần phải can thiệp vào nhân hệ quản trị sở liệu (DBMS) Để khắc phục hạn chế trên, mục 4-R đề xuất Kỹ thuật sử dụng mục chuyển đổi liệu theo hai loại thời gian động thành liệu theo hai loại thời gian tĩnh, sau dùng mục sẵn có cho liệu chuyển đổi Các truy vấn liệu ban đầu chuyển đổi thành truy vấn liệu chuyển đổi tương ứng Theo đó, phần 2, chúng tơi trình bày kết hợp thời gian với liệu 99 theo hai loại thời gian cách sử dụng vùng hai chiều Các mục GR-tree 4R trình bày phần Cuối phần kết luận Biểu diễn liệu theo hai loại thời gian Theo định dạng bốn nhãn thời gian TQuel, quan hệ theo hai loại thời gian có số thuộc tính phi thời gian bốn thuộc tính thời gian: VTbegin (thời gian bắt đầu hợp lệ), VTend (thời gian kết thúc hợp lệ), TTbegin (thời gian bắt đầu giao tác) TTend (thời gian kết thúc giao tác) Chẳng hạn, xét quan hệ thời gian NV_PB cho Bảng Bảng Quan hệ NV_PB NV PB TTbeginn TTend VTbegin VTend (1) Hùng Quảng cáo 4/2009 UC 3/2009 5/2009 (2) Nam Quản lý 3/2009 7/2009 6/2009 8/2009 (3) Mai Kinh doanh 5/2009 UC 5/2009 NOW (4) Hoa Kinh doanh 3/2009 7/2009 3/2009 NOW Hai biến UC (Until Changed) NOW dùng để biểu diễn thời gian hành, biến UC dùng cho TTend biến NOW dùng cho VTend Trong quan hệ trên, độ chi tiết thời gian tháng thời gian hành (Current Time) 9/2009 Bộ (1) ghi nhận thông tin “Hùng làm việc phận Quảng cáo” từ 3/2009 đến 5/2009 điều lưu CSDL từ 4/2009 hành Bộ (3) ghi “Mai làm việc phận Kinh doanh” từ 5/2009 (NOW), điều lưu lại từ 5/2009 cịn phần trạng thái CSDL hành Khi xóa sửa đổi hành, giá trị UC thuộc tính TTend thay đổi thành giá trị cố định khiến cho khơng cịn hành Chẳng hạn (2) bị xóa logic Mỗi biểu diễn vùng theo hai loại thời gian hệ trục tọa độ gồm hai chiều: thời gian giao tác (TT) thời gian hợp lệ (VT) Chẳng hạn, (1) đến (4) tương ứng với trường hợp từ đến Hình 100 Hình Các vùng theo hai loại thời gian Một khoảng thời gian giao tác hành cung cấp hình chữ nhật “tăng trưởng” theo chiều thời gian giao tác (trường hợp 1) Nếu khoảng thời gian hợp lệ giao tác hành biểu diễn vùng có dạng bậc thang tăng trưởng theo hai chiều thời gian (trường hợp 3) Đến lúc đó, khơng cịn hành vùng theo hai loại thời gian ngừng tăng trưởng (trường hợp 2, 4) GR-TREE Trong phần này, trước tiên chúng tơi trình bày cấu trúc GR-tree, phiên mở rộng R*-tree [4] Trên sở để xây dựng thuật tốn bổ sung đầu vào cho cấu trúc GR-tree 3.1 Cấu trúc GR-tree Bằng cách sử dụng biến NOW UC, GR-tree mã hóa hình dạng xác vùng theo hai loại thời gian (phần 2) Với mở rộng này, đầu vào nút chứa nhãn thời gian biểu diễn vùng theo hai loại thời gian trỏ trỏ tới liệu theo hai loại thời gian thực lưu trữ CSDL Mỗi đầu vào nút nhánh chứa bốn nhãn thời gian biểu diễn vùng giới hạn cực tiểu bao quanh đầu vào nút con, cờ Hidden, cờ Rectangle trỏ trỏ đến nút Hình ví dụ cấu trúc GR-tree quan hệ theo hai loại thời gian gồm Hình Ví dụ cấu trúc GR-tree [1] 101 Cờ Rectangle nhằm bốn nhãn thời gian mã hóa hình chữ nhật giới hạn cực tiểu hay hình bậc thang giới hạn cực tiểu trường hợp giá trị VTend NOW giá trị TTend UC, nghĩa cờ Rectangle cần thiết để phân biệt việc biểu diễn hình bậc thang tăng trưởng với hình chữ nhật tăng trưởng Hình biểu diễn vùng theo hai loại thời gian GR-tree tương ứng hình Khi đó, muốn tìm tất vùng chồng lấn với cửa sổ truy vấn cho hình cần truy lục nút Hình Biểu diễn hình ảnh vùng theo hai loại thời gian [1] Một hình bậc thang tăng trưởng nhỏ đặt với vùng khác hình chữ nhật giới hạn lớn có điểm kết thúc thời gian hợp lệ cố định (lớn thời gian hành) Đến lúc đó, hình bậc thang vượt q hình chữ nhật giới hạn khiến cho hình chữ nhật khơng cịn hợp lệ Cờ Hidden sử dụng để xử lý hình bậc thang Lưu ý gọi M số đầu vào tối đa mà nút chứa m số đầu vào tối thiểu phải có nút khơng phải nút gốc Khi có m ≤ M Ngồi ra, GR-tree cịn cân Để phục vụ cho việc tạo lập cấu trúc GR-tree, việc bổ sung liệu sau này, cần quan tâm đến thuật toán bổ sung đầu vào cho cấu trúc 3.2 Thuật tốn bổ sung đầu vào cho cấu trúc GR-tree Như biết, thuật toán bổ sung (chèn) đầu vào R*-tree [4] thiết kế cho hình chữ nhật tĩnh Trong đó, GR-tree, vùng giới hạn cực tiểu không vùng tĩnh mà vùng tăng trưởng theo thời gian nên tiêu chuẩn như: chọn nút để chèn đầu vào (ChooseSubtreee), chọn p đầu vào để xóa (RemoveTop), phân tách nút thành hai nút (Split) phải cải tiến để áp dụng cho GR-tree Thuật toán chèn R*-tree trước tiên gọi thuật tốn ChooseSubtree nhằm tìm 102 nút thích hợp để đặt đầu vào Nếu nút chọn chứa tối đa M đầu vào thuật tốn OverflowTreatment gọi Nếu suốt trình chèn đầu vào mới, lần gọi thuật toán OverflowTreatment mức cho thuật tốn RemoveTop gọi; trái lại thuật tốn Split gọi Thuật tốn RemoveTop R*-tree thực việc xóa p đầu vào nút chọn chèn lại chúng Trong trường hợp xấu nhất, tất đầu vào chèn lại vào nút chúng làm tràn số nút khác thuật tốn OverflowTreatment gọi lại, gọi thuật tốn Split Việc phân tách nút gây tải nút cha Nếu điều xảy ra, thuật toán OverflowTreatment áp dụng cho nút cha Từ ý tưởng trên, thuật toán cải tiến sử dụng bốn kiểu vùng giới hạn theo hai loại thời gian cho nút nhánh sau: Hình chữ nhật tĩnh hình bậc thang tĩnh Hình chữ nhật tăng trưởng theo chiều (sử dụng biến UC) Hình bậc thang tăng trưởng (sử dụng biến UC NOW, giá trị cờ Rectangle False) Hình chữ nhật tăng trưởng theo hai chiều (sử dụng biến UC NOW, giá trị cờ Rectangle True) Để không gian chồng lấn vùng giới hạn cực tiểu nút mức không gian không dùng vùng giới hạn nút (khơng gian bao phủ vùng giới hạn không bao phủ vùng giới hạn bên nó) nhỏ, ta cần đạt kiểu nút nhánh theo thứ tự ưu tiên Dựa ưu tiên này, quy tắc heuristic tổng quát áp dụng là: nhóm đầu vào thành nút cho kiểu nút thu tốt nhất, đồng thời giữ số lượng nút có kiểu khơng tốt mức thấp Cụ thể, quy tắc heuristic áp dụng cho thuật toán sau Thuật toán ChooseSubtree Thuật toán xem xét kiểu đầu vào kiểu nút mà đầu vào chèn vào Nó chọn nhóm gồm nút có kiểu cho đầu vào chèn vào nút nhóm kiểu nút cũ Nếu số nhóm gồm nút có kiểu khác thỏa mãn điều kiện nhóm gồm nút có kiểu tốt chọn Nếu khơng có nhóm thỏa điều kiện trên, đầu vào làm cho nút chọn có kiểu xấu trước Trong trường hợp này, thuật tốn chọn nhóm gồm nút kiểu cho chèn đầu vào vào nút nhóm kiểu nút trở nên xấu Nếu có nhiều nhóm thuật tốn chọn nhóm gồm nút có kiểu xấu Sau đó, chuyển nhóm cho thuật toán ChooseSubtree R*-tree, thuật toán đưa định dựa mở rộng phạm vi chồng lấn phạm vi bao phủ 103 Thuật tốn Split Có hai hướng tiếp cận: Thứ nhất, thuật toán Split cải tiến cách xem xét kiểu khác đầu vào để phân tách chúng thành hai nút cho nút giới hạn vùng có kiểu tốt đồng thời hạn chế phân bố đầu vào kiểu vào hai nút khác Hai nút tạo sau phân tách thuộc bốn kiểu nêu, có mười khả kết hợp kiểu hai vùng giới tương ứng với hai nút Chúng ta ưu tiên cặp theo mức độ tốt chúng (Hình 4) Hình Các cặp kiểu vùng giới hạn Một cặp vùng giới hạn x1 x2 xem tốt cặp vùng giới hạn y1 y2 nếu: (type(x1) ≠ type(y1) ∨ type(x2) ≠ type(y2)) ∧ ((type(x1) ≤ type(y1) ∧ type(x2) ≤ type(y2)) ∨ (type(x1) < max(type(y1), type(y2)) ∧ type(x2) < max(type(y1), type(y2)))) Thứ hai, thuật tốn Split R*-tree sửa đổi nhằm kiểm tra thêm số phân bố đầu vào cách bổ sung hai cách xếp Cách thứ nhất, đầu vào xếp theo giá trị VTend - TTbegin, giá trị tỷ lệ với khoảng cách từ góc bên trái vùng giới hạn (tương ứng với đầu vào) đến đường y = x VTend thiết lập giá trị cố định thích hợp vùng giới hạn hình chữ nhật tăng trưởng có VTend NOW Đối với hình bậc thang, giá trị sử dụng thay cho giá trị VTend - TTbegin bậc thang vùng có dạng bậc thang ln ln nằm đường y = x Tương tự, cách thứ hai, đầu vào xếp theo giá trị VTbegin - TTend Các cách xếp có ưu điểm tạo tách biệt dạng chữ nhật dạng bậc thang Khi đó, khả phân bố đầu vào có kiểu giống vào nút cao nên kiểu hai nút thu sau phân tách tốt Thuật tốn Split R*-tree sử dụng mà không cần sửa đổi trường hợp tất đầu vào hình chữ nhật tĩnh hình bậc thang tĩnh 104 Tuy GR-tree hỗ trợ hiệu liệu theo hai loại thời gian DBMS có khơng hỗ trợ mục Hạn chế khắc phục kỹ thuật mục trình bày phần Chỉ mục 4-R Ý tưởng kỹ thuật sử dụng mục 4-R áp dụng chuyển đổi liệu làm cho vùng liệu tăng trưởng liên tục theo hai loại thời gian trở nên tĩnh, sau lập mục cho vùng liệu tĩnh cách sử dụng bốn mục R*tree Theo đó, truy vấn liệu ban đầu chuyển đổi thành truy vấn liệu chuyển đổi Trong mục này, trước tiên chúng tơi trình bày việc chuyển đổi liệu Theo đó, việc chuyển đổi truy vấn trình bày phần sau 4.1 Chuyển đổi liệu Mục đích việc chuyển đổi liệu theo hai loại thời gian khử biến UC NOW Chúng ta phân biệt bốn loại liệu theo hai loại thời gian phụ thuộc vào TTend VTend có UC NOW hay khơng Định nghĩa Gọi miền giá trị nhãn thời gian T miền định danh ID TT |− TT −| kí hiệu cho TTbegin TTend; VT |− VT −| kí hiệu cho VTbegin VTend Miền giá trị liệu theo hai loại thời gian DB miền giá trị liệu theo hai loại thời gian tĩnh DS định nghĩa sau: DB = {< TTr|− , TTr−| ,VTr|− ,VTr−| , idr >∈T × T ∪ {UC} × T × T ∪ {NOW}× ID | (TTr−| = UC ∨ TTr|− ≤ TTr−| ) ∧ (VTr−| = NOW ∨ VTr|− ≤ VTr−| )} D S = {< TTr|− , TTr−| , VTr|− , VTr−| , id r >∈ T × T × T × T × ID | (TTr|− ≤ TTr−| ) ∧ (VTr|− ≤ VTr−| )} Lưu ý số “r” dùng để phân biệt hình chữ nhật liệu với hình chữ nhật truy vấn bàn đến sau Việc chuyển đổi liệu định nghĩa sau nhằm xác định việc chuyển đổi theo hai loại thời gian nói chung thành theo hai loại thời gian tĩnh Định nghĩa Cho R ⊆ DB Type = {1, 2, 3, 4} Khi phép chuyển đổi liệu định nghĩa sau: τ D ( R ) = {τ r (〈TTr|− , TTr−| , VTr|− , VTr−| , id r 〉 )| 〈TTr|− , TTr−| , VTr|− , VTr−| , id r 〉 ∈ R} Trong đó: 105 〈TTr|− , TTr|− ,VTr|− ,VTr|− , idr ,1〉, : TTr−| = UC ∧ VTr−| = NOW |− r −| |− r −| r τ r ( 〈TT , TTr , VT , VT , id r 〉 ) = 〈TTr|− , TTr|− ,VTr|− ,VTr−| , idr , 2〉, : TTr−| = UC ∧ VTr−| ≠ NOW 〈TTr|− , TTr−| ,VTr|− ,VTr|− , idr , 3〉, : TTr−| ≠ UC ∧ VTr−| = NOW 〈TTr|− , TTr−| ,VTr|− ,VTr−| , idr , 4〉, : TTr−| ≠ UC ∧ VTr−| ≠ NOW Hình Lưu trữ liệu tìm kiếm bốn mục 4-R Cây R1, tương ứng với trường hợp 1, nhằm lập mục cho vùng mà trước chuyển đổi vùng có giá trị kết thúc thời gian giao tác hợp lệ không cố định Do VT −| TT −| gắn với thời gian hành, nên để mã hóa 106 vùng cần lưu trữ điểm ( TT |− , VT |− ) mục Khi đó, để phù hợp với cấu trúc R-tree [3], vùng sau chuyển đổi biểu diễn điểm hai chiều 〈TTr|− , TTr|− , VTr|− , VTr|− 〉 Tương tự, R2, R3, R4 tương ứng với trường hợp 2, 3, Định nghĩa minh họa Hình Lưu ý rằng, R4 dành cho vùng mà trước chuyển đổi có giá trị kết thúc thời gian giao tác hợp lệ cố định Chúng có dạng hình chữ nhật tĩnh nên không cần chuyển đổi lưu trữ mục dạng 〈TTr|− , TTr−| , VTr|− , VTr−| 〉 4.2 Chuyển đổi truy vấn Chúng ta tìm hiểu kiểu truy vấn mục thơng dụng liệu theo hai loại thời gian gọi truy vấn giao dạng chữ nhật Loại truy vấn biểu diễn hình chữ nhật tĩnh, gọi hình chữ nhật truy vấn Gọi 〈TTq|−,TTq−| ,VTq|−,VTq−| 〉∈T ×T ×T ×T kí hiệu cho hình chữ nhật truy vấn, T miền giá trị nhãn thời gian Giả sử: TTq|− ≤ TTq−| ; VTq|− ≤ VTq−| TTq −| ≤ CT , CT giá trị thời gian hành Ta có định nghĩa sau: Định nghĩa Gọi r1 r2 hai vùng giới hạn chữ nhật tĩnh Khi đó, giao r1 r2 ký hiệu là: − − − 〈TTr|1 , TTr−| , VTr|1 , VTr−| 〉 ∩ 〈TTr|− , TTr−| , VTr|2 , VTr−| 〉 1 2 − − (TTr|1 ≤ TTr−| ) ∧ (TTr−| ≥ TTr|− ) ∧ (VTr|1 ≤ VTr−| ) ∧ (VTr−| ≥ VTr|− ) 2 2 Ngoài ra, gọi q = 〈TTq|− , TTq−| ,VTq|− ,VTq−| 〉 R ⊆ DB Khi đó, truy vấn giao dạng chữ nhật IntersectB R với tham số hình chữ nhật truy vấn q giá trị thời gian hành CT, định nghĩa sau: Inter sec t B [q, CT ]( R) = {id r | 〈TTr|− , TTr−| ,VTr|− ,VTr−| , id r 〉 ∈ R ∧ |− |− (((TTr−| = UC ) ∧ (VTr−| = NOW) ∧ (TTq−| ≥ VTq|− ) ∧ (q ∩ 〈TTr , CT , VTr , CT 〉 )) ∨ ((TTr−| = UC ) ∧ (VTr−| ≠ NOW) ∧ (q ∩ 〈TTr|− , CT ,VTr|− ,VTr−| 〉 )) ∨ ((TTr−| ≠ UC ) ∧ (VTr−| = NOW) ∧ (TTq−| ≥ VTq|− ) ∧ (q ∩ 〈TTr|− , TTr−| ,VTr|− , TTr−| 〉 )) ∨ ((TTr−| ≠ UC ) ∧ (VTr−| ≠ NOW) ∧ (q ∩ 〈TTr|− , TTr−| ,VTr|− ,VTr−| 〉 )))} Điều kiện giới hạn kết thuộc R Các thỏa mãn bốn điều kiện thỏa mãn truy vấn thuộc tập kết Điều kiện thứ ứng với vùng dạng bậc thang tăng trưởng, điều 107 kiện thứ hai ứng với vùng dạng chữ nhật tăng trưởng, điều kiện thứ ba ứng với vùng dạng bậc thang tĩnh điều kiện thứ tư ứng với vùng dạng chữ nhật tĩnh Trong trường hợp vùng dạng bậc thang tăng trưởng tĩnh, việc kiểm tra giao vùng với hình chữ nhật truy vấn cần kiểm tra thêm điều kiện góc bên phải hình chữ nhật truy vấn có nằm bên nằm đường VT = TT hay không (tương ứng với điều kiện TTq−| ≥ VTq|− ) Tương tự, định nghĩa truy vấn giao dạng chữ nhật liệu theo hai loại thời gian tĩnh Kết truy vấn độc lập với thời gian hành Định nghĩa Gọi q = 〈TTq|− , TTq−| , VTq|− , VTq−| 〉 S ⊆ DS Khi đó, truy vấn giao dạng chữ nhật IntersectS S với tham số hình chữ nhật truy vấn q định nghĩa sau: Inter sec t S [q ]( S ) = {id r | 〈TTr|− , TTr−| , VTr|− , VTr−| , id r 〉 ∈ S ∧ q ∩ 〈TTr|− , TTr−| , VTr|− , VTr−| 〉} Từ Định nghĩa 4, định nghĩa ánh xạ chuyển đổi truy vấn 4R để áp dụng với liệu chuyển đổi Ánh xạ chuyển đổi truy vấn 4-R nhằm ánh xạ truy vấn giao dạng chữ nhật liệu ban đầu thành hai bốn truy vấn tương đương liệu chuyển đổi Định nghĩa Cho: R ⊆ D B , S = τ D ( R) , Si = {〈TTr|− , TTr−| ,VTr|− ,VTr−| , id r 〉 | 〈TTr|− , TTr−| ,VTr|− ,VTr−| , idr , i〉 ∈ S} (với i = 1, 2, 3, 4), q = 〈TTq|− , TTq−| , VTq|− , VTq−| 〉 , q1 = 〈 0, TTq−| , 0, VTq−| 〉 , q2 = 〈 0, TTq−| , VTq|− , VTq−| 〉 , q3 = 〈 max(TTq|− , VTq|− ), TTq−| , 0, VTq−| 〉 , q4 = 〈TTq|− , TTq−| , VTq|− , VTq−| 〉 , B D ID D Khi đó, ánh xạ chuyển đổi truy vấn 4-R, τ q : [2 → ] → [2 S × Type → 2ID ] định nghĩa sau: τ q ( Inter sec t B [q, CT ])( S ) = U U i = 1,2,3,4 i = 2,4 108 Inter sec t S [qi ]( Si ), : TTq−| ≥ VTq|− Inter sec t S [qi ]( Si ), : TTq−| < VTq|− Hình chữ nhật tìm kiếm ban đầu (hình chữ nhật truy vấn q) hình chữ nhật tìm kiếm chuyển đổi tương ứng minh họa Hình Hình Hình Các đặc điểm tìm kiếm R3 Khi tìm kiếm R1, hình chữ nhật tìm kiếm mở rộng để bao phủ hết không gian kéo dài từ điểm bắt đầu thời gian hợp lệ giao tác đến góc bên phải hình chữ nhật tìm kiếm Khi tìm kiếm R2, khơng tìm kiếm vùng liệu chồng lấn với hình chữ nhật tìm kiếm ban đầu mà cịn tìm kiếm vùng bên trái hình chữ nhật tìm kiếm (mở rộng tìm kiếm sang trái) Việc chuyển đổi hình chữ nhật tìm kiếm R3 tương tự hình chữ nhật tìm kiếm mở rộng xuống phía thay sang trái Mặt khác, phần hình chữ nhật tìm kiếm nằm đường VT = TT phần khác nằm phần nằm mở rộng (xem Hình 6); Trong Định nghĩa 5, hàm “max” nhằm đảm bảo phần hình chữ nhật tìm kiếm mở rộng Do R4 lập mục cho hình chữ nhật theo hai loại thời gian khơng chuyển đổi, nên việc chuyển đổi hình chữ nhật tìm kiếm khơng cần thiết Sau số trường hợp đặc biệt cần ý truy vấn bốn Trong R1 R3, điểm khoảng lập mục nằm phía đường VT = TT vùng (trước chuyển đổi) mã hóa điểm khoảng khơng mở rộng đường Vì vậy, việc tìm kiếm hai thực hình chữ nhật tìm kiếm có phần nằm đường VT = TT 109 Trường hợp đặc biệt khác truy vấn lát cắt thời gian giao tác thời điểm hành ( TTq|− = TTq−| = CT ) xảy thường xuyên thực tế Dữ liệu hành nằm R1 R2, đó, truy vấn loại khơng cần thiết phải tìm kiếm R3 R4 Ngồi ra, truy vấn lát cắt thời gian giao tác thời điểm hành có thời gian hiệu lực phía đường VT = TT có R2 tìm kiếm Trường hợp đặc biệt cuối lát cắt thời gian giao tác thời điểm hành khơng có ràng buộc thời gian hợp lệ tất theo hai loại thời gian lập mục R1 R2 thỏa mãn không cần đến tìm kiếm Cải tiến quan trọng mục 4-R sử dụng lại mục hiệu dựa R-tree (ví dụ R*-tree) mà không cần sửa đổi có điểm, khoảng hình chữ nhật tĩnh lập mục Ngồi ra, điểm khoảng chiếm khơng gian lưu trữ nên nút chứa nhiều đầu vào độ cao thấp Đồng thời, số chiều liệu hành nên vùng chồng lấn hình chữ nhật giới hạn cực tiểu nhỏ Hơn nữa, biểu diễn liệu hành không mở rộng tới thời gian hành nên không gian không dùng giảm Tuy nhiên, 4-R có số hạn chế như: việc chuyển đổi truy vấn làm cho hình chữ nhật truy vấn ln ln bị mở rộng; hình chữ nhật giới hạn cực tiểu nút R2 kéo dài theo chiều thời gian hợp lệ truy vấn chuyển đổi R2 lại mở rộng dài theo chiều thời gian giao tác;… Kết luận Bài báo trình bày hai mục hỗ trợ hiệu cho liệu theo hai loại thời gian động, GR-tree 4-R Có thể xem mục 4-R trường hợp đặc biệt GR-tree Thuật toán bổ sung đầu vào GR-tree tách kiểu vùng liệu khác vào nút khác nhằm thu gồm nhóm nút chứa vùng liệu loại Vì vậy, mục 4-R trường hợp đặc biệt GR-tree, nhóm nút tạo thành bốn khác Tuy nhiên, hai cấu trúc GR-Tree 4-R không đề cập tới việc phân vùng liệu theo giá trị khóa phi thời gian mà dựa giá trị thuộc tính thời gian nên dẫn đến tình trạng ghi liệu có giá trị khóa phi thời gian gần bị lưu trữ nhiều khối liệu khác Khi đó, truy vấn liên quan đến khóa phi thời gian xử lý thiếu hiệu Đây vấn đề đáng quan tâm hướng nghiên cứu lĩnh vực TÀI LIỆU THAM KHẢO Rasa Bliujute, Christian S.Jensen, Simonas Saltenis, and Giedrius Slivinskas, R-Tree Based Indexing of Now-Relative Bitemporal Data, Temporal Database Management, 2000, 1161-1186 110 Rasa Bliujute, Christian S.Jensen, Simonas Saltenis, and Giedrius Slivinskas, LightWeight Indexing of General Bitemporal Data, Temporal Database Management, 2000, 1187-1217 Antonm Guttman, R-trees: A Dynamic Index Structure for Spatial Searching, ACM SIGMOD Conference, Boston, Massachusetts, 1984 N Beckmann [et al], The R*-tree: An Efficient and Robust Access Method for Points and Rectangles, ACM SIGMOD Conference, Atlantic City, NJ, 1990 Stantic B., Access Methods for Temporal Databases, Bela Stantic’s PhD Thesis, Griffith University, Australia, 2005 INTRODUCTION TO GR-TREE AND 4-R INDEX STRUCTURES OF BITEMPORAL DATA Ngo Quynh Nhu, Hoang Quang College of Sciences, Hue University SUMMARY Because bitemporal databases are basically appended only, they are usually very large in size On the other hand, they usually contain a significant part of now-relative bitemporal data, so processing and searching data are more complicated and time-consuming One of the effective access methods to this type of data is creating an extra retrieval structure that is called index This paper introduces two effective index structures that permit to retrieve bitemporal data, especially now-relative time, they are GR-tree and 4-R 111 ... vùng theo hai loại thời gian (phần 2) Với mở rộng này, đầu vào nút chứa nhãn thời gian biểu diễn vùng theo hai loại thời gian trỏ trỏ tới liệu theo hai loại thời gian thực lưu trữ CSDL Mỗi đầu vào.. .theo hai loại thời gian cách sử dụng vùng hai chiều Các mục GR-tree 4R trình bày phần Cuối phần kết luận Biểu diễn liệu theo hai loại thời gian Theo định dạng bốn nhãn thời gian TQuel,... dụng mục 4-R áp dụng chuyển đổi liệu làm cho vùng liệu tăng trưởng liên tục theo hai loại thời gian trở nên tĩnh, sau lập mục cho vùng liệu tĩnh cách sử dụng bốn mục R*tree Theo đó, truy vấn liệu

Ngày đăng: 23/07/2014, 05:20

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan