Phân tích so sánh quá trình tìm tin trong sơ đồ thuận và sơ đồ đảo

19 812 0
Phân tích so sánh quá trình tìm tin trong sơ đồ thuận và sơ đồ đảo

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Hiện nay khi nền kinh tế càng phát triển, kéo theo đó là sự phát triển của nền khoa học công nghệ và sự nắm bắt thông tin một cách nhanh nhạy

0 Đại Học Quốc Gia Hà Nội Trường Đại Học Khoa Học Xã Hội Nhân Văn Khoa Thơng tin thư viện --------------- Bài kiểm tra giữa kỳ Mơn: Q trình hệ thống thơng tin Phân tích so sánh q trình tìm tin trong đồ thuận đồ đảo THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 1 ĐẶT VẤN ĐỀ Hiện nay khi nền kinh tế càng phát triển, kéo theo đó là sự phát triển của nền khoa học cơng nghệ sự nắm bắt thơng tin một cách nhanh nhạy.Chỉ khi có được những điều đó chúng ta mới làm chủ được mọi thứ,làm chủ sự thành cơng .Người ta thường nói người có thơng tin là người chiếm lĩnh sự chiến thắng.Trong xã hội ngày nay việc nắm giữ thơng tin là một điều hết sức cần thiết quan trọng,bởi có như thế chúng ta mới làm chủ được sự phát triển nhanh chóng của xã hội thơng tin trong thời đại ngày nay THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 2 Nội Dung Vấn Đề Để thực hiện được q trình tìm tin hình thức hố cần có 3 tiền đề sau: * Có một khơng gian tìm tin Là cấu trúc có tổ chức lưu giữ các thực thể, đối tượng thơng tin được quản trị trong hệ thống như sách, báo, tạp chí, bài trích, luận án, luận văn… Để lưu giữ các đối tượng thơng tin này, tổ chức lưu giữ trên các file dữ liệu khác nhau: + File thuận + File đảo + File kép Để hình thành khơng gian lưu trữ thơng tin cần: + Tập hợp các thực thể cần quản trị + Tập hợp các thuộc tính + Mối quan hệ giữa từng thực thể được quản trị với các thuộc tính trong lĩnh vực đó + Xây dựng ma trận tư liệu + Hình thành đồ tổ chức thơng tin * Có câu hỏi tìm Để tìm kiếm thơng tin trong hệ thống tìm kiếm đòi hỏi phải có định hướng cuộc tìm, thể hiện qua các câu hỏi tìm. Câu hỏi tìm của người dùng tin là sự biểu đạt bằng lời hoặc một văn bản đề cập đến những chủ đề mà người dùng tin quan tâm. Đây chính là các điểm truy cập được thực hiện trong q trình tìm kiếm so sánh. Một câu hỏi tìm có thể có một hay nhiều điểm truy cập. Trong trường hợp có một điểm truy cập thì câu trả lời đơn giản. Khi số điểm truy cập có từ hai trở lên thì câu hỏi tìm phức tạp. Trong trường hợp này, các điểm truy cập phải kết nối với nhau thơng qua tốn tử logic. * Thủ tục so sánh ngữ nghĩa THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 3 Q trình tìm tin là q trình thuần t mang tính kỹ thuật, so sánh dấu hiệu của thực thể này với thực thể khác hoặc so sánh tập hợp dấu hiệu của thơng tin này với tập hợp dấu hiệu của thơng tin khác Qua việc phân tích,so sánh 2 ví dụ sau chúng ta sẽ hiểu rõ vấn đề: I. So sánh q trình tìm tin trong đồ thuận (Linear schema), đồ đảo (Invert schema) 2.1. Điểm giống nhau Như ta đã biết, các đối tượng thơng tin được lưu giữ trên các file dữ liệu khác nhau: File Thuận, file Đảo. Tuy nhiên, để hình thành khơng gian lưu trữ thơng tin chúng ta cần thực hiện các bước sau đối với bất kì một file dữ liệu nào, đó là: * Step 1: Tập hợp các thực thể cần quản trị * Step 2: Tập hợp các thuộc tính * Step 3: Mối quan hệ giữa các thực thể được quản trị với các thuộc tính trong lĩnh vực đó. * Step 4: Xây dựng ma trận tư liệu * Step 5: Hình thành đồ tổ chức thơng tin Q trình tìm tin hình thức thực chất là tập hợp các cơng đoạn kĩ thuật logic. Vì vậy để phân tích q trình tìm tin này ở trong đồ Thuận, Đảo chúng ta sẽ lần lượt khảo sát theo 5 phương diện sau: 1. Xem cuộc tìm đó thực hiện thành bao nhiêu bước? có những bước gì? (Stages - Steps) 2. Đường tìm tin? (Retrieval path) 3. Phép tìm đơn vị (kĩ thuật, logic - ROU)? mất bao nhiêu ROU? ROU là gì? 4. Cơng thức tổng qt để tính cuộc tìm đó như thế nào (Fomulate)? Khảo sát xem tham số gì chi phối cuộc tìm đó? 5. Đánh giá, kết luận về cuộc tìm (Conclusion or Coment)? THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 4 Với 5 bứoc đi 5 phương diện của q trình tìm tin chúng ta có thể dễ dàng khảo sát cuộc tìm trên các đồ tìm tin: đồ Thuận (Linear schema), đồ Đảo (Invert schema). Đó là những điểm giống nhau căn bản của các đồ tìm tin mà từ đó giúp hệ thống nhận biết truy xuất ra các thực thể thoả mãn u cầu tin của người dùng. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 5 2.2. Điểm khác nhau Bên cạnh những điểm giống nhau trong q trình tìm tin như trên thì cuộc tìm trong 2 file: Thuận, Đảo, cũng có những điểm khác nhau căn bản như sau: Schema Aspects Linear (File Thuận) Invert (File Đảo) 1. Conceptual (Bướcý niệm) Là đồ tổ chức thơng tin theo thực thể, tức là sau mỗi thực thể sẽ liệt kê các thuộc tính của thực thể đó. Thực thể ở đây là các tài liệu được phản ánh. Thuộc tính là chủ đề của tài liệu được rút ra trong q trình Indexing. D i :: = <T J > m i = n1 ; j = m,1 ` T j :: = <A i > n i = n,1 ; j = Là đồ được tổ chức theo thuộc tính, tức là sau mỗi thuộc tính sẽ liệt kê những thực thể chứa thuộc tính đó. m,1 2.3. Điểm khác nhau Bên cạnh những điểm giống nhau trong q trình tìm tin như trên thì cuộc tìm trong 2 file: Thuận, Đảo, cũng có những điểm khác nhau căn bản như sau: Schema Aspects Linear (File Thuận) Invert (File Đảo) THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 6 2. Stages (Bước tìm) Cuộc tìm này thực hiện một bước tìm duy nhất (Tuần tự so sánh u cầu tin với từng tài liệu được quản trị trong hệ thống.) Cuộc tìm này phải thực hiện 2 bước: Bước 1: Truy cập vào các điểm truy cập có trong biểu thức tìm (access point) để thu được các tài liệu theo các điểm truy cập. Bước 2: Thực hiện phép tốn logic để tìm ra tập hợp tài liệu được quản trị trong hệ thống phù hợp với u cầu tin của biểu thức tìm. 3. ROU/Path (Bước tìm đơn vị) Thực hiện ROU kĩ thuật Thực hiện ROU kĩ thuật ROU logic. 4. Fomulate (Cơng thức tổng qt) V L = n ROU V L : Tốc độ cuộc tìm trong file Thuận n: Số thực thể được quản trị trong hệ thống. V I = (2TQ – 1) ROU V I : Tốc độ cuộc tìm trong file Đảo. TQ: Số thuật ngữ có trong câu hỏi tìm. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 7 5. Document Matrix (Ma trận tư liệu) T: Thuộc tính D: Thực thể (Tài liệu) T  D: Giá trị ma trận (Value) T D T 1 …………….T m D 1 : : : : : D m T D T 1 …… T m D 1 : : : : : D m T: Thuộc tính D: Thực thể (Tài liệu) T  D: Giá trị ma trận (Value) 6. Conclusion or Coment (Kết luận, đánh giá, nhận xét) - Tốc độ cuộc tìm trong đồ thuận chậm vì cuộc tìm phải qt tồn miền dữ liệu. - Tính hữu ích của cuộc tìm khơng cao - Tốc độ cuộc tìm trong đồ đảo nhanh hơn vì cuộc tìm có định hướng. - Tính hữu ích của cuộc tìm cao. Như vậy qua sự so sánh những đặc điểm giống nhau khác nhau của 2 phương thức tìm tin trong hệ thống thơng tin ta thấy rằng: Mỗi phương thức (cuộc tìm được thực hiện trên các đồ: Đảo, Thuận.) đều có những ưu điểm nhược THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 8 điểm nhất định. Để có một kết quả cuộc tìm tối ưu, thoả mãn các u cầu của bài tốn tìm tin đưa ra thì tuỳ vào từng trường hợp cụ thể mà ta nên lựa chọn phương thức tìm tin phù hợp nhất. Như vậy sẽ làm giảm đại lượng nhiễu tin mất tin của bài tốn đưa ra để thoả mãn nhu cầu tin của người sử dụng hệ thống tìm tin sẽ đạt tới trạng thái lí tưởng. II. Ví dụ minh hoạ Cho bài tốn tìm tin sau: Trong hệ thống có tập hợp gồm 06 tài liệu với những nội dung, chủ đề được mơ tả như sau: TQ1 :: = <Việt nam, Văn hóa, Đa dạng, Ngơn ngữ> TQ2 :: = <Việt nam, Ngơn ngữ, Con người> TQ3 :: = <Văn hóa, NGơn ngữ, Con người> TQ4 :: = <Việt nam, Văn hóa, Ngơn ngữ> TQ5 :: = <Đa dạng, Con người, Đất nước> TQ6 :: = <Việt nam, Ngơn ngữ,Đất nước> u cầu tìm: “Hãy tìm các tài liệu về ngơn ngữ con người”. Anh (chị) hãy thực hiện các trình tự tìm tin theo 2 đồ: Thuận (Linear schema, Đảo (Invert schema) Bài làm Theo bài ra ta có khơng gian tài liệu như sau: ● Step 1: Tập hợp các thực thể cần quản trị TQ1 :: = <Việt nam, Văn hóa, Đa dạng, Ngơn ngữ> TQ2 :: = <Việt nam, Ngơn ngữ, Con người> TQ3 :: = <Văn hóa, NGơn ngữ, Con người> TQ4 :: = <Việt nam, Văn hóa, Ngơn ngữ> TQ5 :: = <Đa dạng, Con người, Đất nước> TQ6 :: = <Việt nam, Ngơn ngữ,Đất nước> THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 9 ● Step2: Các thuộc tính, chủ để (subjects) A1 ÷ Việt nam A2 ÷ Văn hóa A3 ÷ Đa dạng A4 ÷ Ngơn ngữ A5 ÷ Con người A6 ÷ Đất nước ● Step3: Mối quan hệ giữa các thực thể được quản trị trong hệ thống với các thuộc tính trong lĩnh vực đó TQ1 :: = <A1, A2, A3, A4> TQ2 :: = <A1, A4, A5> TQ3 :: = <A2, A4, A5> TQ4 :: = <A1, A2, A4> TQ5 :: = <A3, A5, A6> TQ6 :: = <A1, A4, A6> ● Step4: Xây dựng ma trận tư liệu (Doccument matrix) A TQ A1 A2 A3 A4 A5 A6 TQ1 1 1 1 1 0 0 TQ2 1 0 0 1 1 0 TQ3 0 1 0 1 1 0 TQ4 1 1 0 1 0 0 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN [...]... các ROU cần thiết cho việc tìm cụ thể là rất lớn Chính vì vậy mà hiệu quả tìm tin trong đồ thuận là rất thấp Để cải thiện cuộc tìm tin trong đồ thuận, có các giải pháp sau: 12 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN - Tác động vào khơng gian tìm tin bằng cách phân giã đồ thuận thành các đồ con - Tác động vào miền áp dụng của cơ quan thơng tin Thơng thường thường được áp dụng trong khu vực, lĩnh vưc mà... cao trong thực tiễn cuộc sống 17 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN MỤC LỤC NỘI DUNG VẤN ĐỀ 2 I So sánh q trình tìm tin trong đồ thuận (Linear schema), đồ đảo (Invert schema) 3 2.1 Điểm giống nhau 3 2.2 Điểm khác nhau 5 2.3 Điểm khác nhau 5 II Ví dụ minh hoạ 8 1 Tìm tin theo đồ thuận (Linear schema) 11 2 Tìm tin trong đồ. .. có đồ Venn của q trình tìm tin trong đồ Đảo: Ngơn ngữ * con người (A4 * A5) Ngơn ngữ Con người ● ROU: (Phép tìm đơn vị) Để thực hiện cuộc tìm trong đồ đảo cần có 2 phép tìm dơn vị (2 loại ROU) Cụ thể: Ở bước 1: Cần 2 ROU kĩ thuật Ở bước 2: Cần 1 ROU logic Như vậy ta mất 3 ROU cho cuộc tìm này trong đồ đảo ● Fomulate: (Cơng thức tổng quảt) VI = (2TQ - 1)ROU TQ: Thuật ngữ chủ đề Cuộc tìm trong. .. coment: (Nhận xét, đánh giá) Trình tự tìm tin trong đồ thuận đưa đến kết cục được xảy ra trong tồn bộ khơng gian dữ liệu được lưu giữ, quản trị trong hệ thống Như vậy, rõ ràng nguồn dữ liệu trong khi thực hiện cuộc tìm tin khơng trực tiếp, khơng liên quan đến câu hỏi tìm, điều này làm giảm đi hệ số hữu ích trong khơng gian tìm tin tại đồ thuận hệ quả của nó là làm cho cuộc tìm diễn ra một cách chậm... chứa thuộc tính * Step5: Hình thành đồ tổ chức thơng tin Theo đề bài u cầu ta có 3 đồ tổ chức thơng tin là: - đồ Thuận (Linear schema) - đồ Đảo (Invert schema) Q trình tổ chức tìm tin theo 2 dạng đồ trên được thực hiện theo trình tự sau: Từ u cầu tin của bài tốn đưa ra ta có các điểm truy cập là: 1 Ngơn ngữ 2 Con người Từ đó ta xác định được biểu thức tìm tin: Ngơn ngữ * Con người (hay:... thực tế của đồ đảo chỉ xảy ra trên các miền hạn chế mà có nội dung trực tiếp liên đới tới chủ đề người dùng tin quan tâm Do đó tính hữu ích cuộc tìm rất cao, tốc độ tìm được cải thiện đáng kể so với đồ Thuận 16 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN KẾT THÚC VẤN ĐÊ Qua việc phân tích, so sánh ví dụ trên ta thấy thơng tin (information) đóng một vai trò rất quan trọng hữu ích trong cuộc sống Thơng tin làm... cầu tìm A4 * A5 TQ1 A1, A2, A3, A4 TQ 2 A1, A4, A5 TQ 2, TQ 3 thoả mãn TQ 3 A2, A4, A5 TQ 4 A1, A2, A4 TQ 5 A3, A5, A6 TQ 6 A1, A4, A6 Trình tự cuộc tìm diễn ra như sau: ● Stages: (Bước tìm) : Để thực hiện cuộc tìm này, trong đồ thuận thực hiện việc tuần tự so sánh nội dung của biểu thức tìm tin với từng tài liệu được quản trị trong đồ thuận của 11 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN hệ thống Cuộc tìm. .. các phép tốn logic Với biểu thức tìm đã cho cuộc tìm mất 6 ROU kĩ thuật 0 ROU logic ● Fomulate: (Cơng thức tổng qt) VL = n ROU (n: Là số thực thể được quản trị trong hệ thống) Nhân tố quyết định, chi phối tốc độ tìm trong đồ thuậnsố lượng các thực thể được quản trị trong hệ thống Do vậy với 06 thực thể được quản trị trong hệ thống thì cuộc tìm trong đồ thuận mất 6 ROU kĩ thuật ● Conclusion... mãn TQ5 Trình tự cuộc tìm diễn ra như sau: ● Stages: (Bước tìm) : Cuộc tìm trong đồ đảo được thực hiện chia thành 2 bước Bước 1: Thơng qua việc truy cập vào đồ đảo theo các điểm truy cập có trong biểu thức tìm, ta sẽ thu được các tập hợp tài liệu theo u cầu Bước 2: Tuần tự thực hiện các phép tốn logic ta sẽ thu được tập hợp cuối cùng là tập hợp kết quả chứa những tài liệu được quản trị trong hệ... trong khu vực, lĩnh vưc mà nhu cầu, mức độ, cường độ tìm kiếm thơng tin cao 2 Tìm tin trong đồ Đảo (Invert schema) Conceptual layer: đồ đảo đồ được tổ chức theo thuộc tính, tức là sau mỗi thuộc tính sẽ liệt kê các thực thể của thuộc tính đó Physical layer: 13 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN u cầu tìm A4*A5 A1 TQ 1, TQ 2, TQ 4, TQ 6 A2 Biểu thức tìm: A4 *A5 TQ1 TQ 4 A3 TQ 1, TQ 3 TQ2 TQ 1,TQ 5 TQ3 . thơng tin khác Qua việc phân tích, so sánh 2 ví dụ sau chúng ta sẽ hiểu rõ vấn đề: I. So sánh q trình tìm tin trong sơ đồ thuận (Linear schema), sơ đồ đảo. sơ đồ Venn của q trình tìm tin trong sơ đồ Đảo: ● ROU: (Phép tìm đơn vị) Để thực hiện cuộc tìm trong sơ đồ đảo cần có 2 phép tìm

Ngày đăng: 12/04/2013, 11:40

Hình ảnh liên quan

* Step5: Hình thành sơ đồ tổ chức thơng tin - Phân tích so sánh quá trình tìm tin trong sơ đồ thuận và sơ đồ đảo

tep5.

Hình thành sơ đồ tổ chức thơng tin Xem tại trang 11 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan