Bước đầu tìm hiểu vấn đề quản trị tri thức và giáo dục người dùng tin

19 399 0
Bước đầu tìm hiểu vấn đề quản trị tri thức và giáo dục người dùng tin

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Báo cáo khoa học: Bước đầu tìm hiểu vấn đề quản trị tri thức và giáo dục người dùng tin

0 Đại Học Quốc Gia Hà Nội Trường Đại Học Khoa Học Xã Hội Nhân Văn Khoa Thơng tin thư viện --------------- Bài kiểm tra giữa kỳ Mơn: Q trình hệ thống thơng tin Phân tích so sánh q trình tìm tin trong sơ đồ thuận sơ đồ đảo THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 1 ĐẶT VẤN ĐỀ Hiện nay khi nền kinh tế càng phát triển, kéo theo đó là sự phát triển của nền khoa học cơng nghệ sự nắm bắt thơng tin một cách nhanh nhạy.Chỉ khi có được những điều đó chúng ta mới làm chủ được mọi thứ,làm chủ sự thành cơng .Người ta thường nói người có thơng tinngười chiếm lĩnh sự chiến thắng.Trong xã hội ngày nay việc nắm giữ thơng tin là một điều hết sức cần thiết quan trọng,bởi có như thế chúng ta mới làm chủ được sự phát triển nhanh chóng của xã hội thơng tin trong thời đại ngày nay THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 2 Nội Dung Vấn Đề Để thực hiện được q trình tìm tin hình thức hố cần có 3 tiền đề sau: * Có một khơng gian tìm tin Là cấu trúc có tổ chức lưu giữ các thực thể, đối tượng thơng tin được quản trị trong hệ thống như sách, báo, tạp chí, bài trích, luận án, luận văn… Để lưu giữ các đối tượng thơng tin này, tổ chức lưu giữ trên các file dữ liệu khác nhau: + File thuận + File đảo + File kép Để hình thành khơng gian lưu trữ thơng tin cần: + Tập hợp các thực thể cần quản trị + Tập hợp các thuộc tính + Mối quan hệ giữa từng thực thể được quản trị với các thuộc tính trong lĩnh vực đó + Xây dựng ma trận tư liệu + Hình thành sơ đồ tổ chức thơng tin * Có câu hỏi tìm Để tìm kiếm thơng tin trong hệ thống tìm kiếm đòi hỏi phải có định hướng cuộc tìm, thể hiện qua các câu hỏi tìm. Câu hỏi tìm của người dùng tin là sự biểu đạt bằng lời hoặc một văn bản đề cập đến những chủ đềngười dùng tin quan tâm. Đây chính là các điểm truy cập được thực hiện trong q trình tìm kiếm so sánh. Một câu hỏi tìm có thể có một hay nhiều điểm truy cập. Trong trường hợp có một điểm truy cập thì câu trả lời đơn giản. Khi số điểm truy cập có từ hai trở lên thì câu hỏi tìm phức tạp. Trong trường hợp này, các điểm truy cập phải kết nối với nhau thơng qua tốn tử logic. * Thủ tục so sánh ngữ nghĩa THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 3 Q trình tìm tin là q trình thuần t mang tính kỹ thuật, so sánh dấu hiệu của thực thể này với thực thể khác hoặc so sánh tập hợp dấu hiệu của thơng tin này với tập hợp dấu hiệu của thơng tin khác Qua việc phân tích,so sánh 2 ví dụ sau chúng ta sẽ hiểuvấn đề: I. So sánh q trình tìm tin trong sơ đồ thuận (Linear schema), sơ đồ đảo (Invert schema) 2.1. Điểm giống nhau Như ta đã biết, các đối tượng thơng tin được lưu giữ trên các file dữ liệu khác nhau: File Thuận, file Đảo. Tuy nhiên, để hình thành khơng gian lưu trữ thơng tin chúng ta cần thực hiện các bước sau đối với bất kì một file dữ liệu nào, đó là: * Step 1: Tập hợp các thực thể cần quản trị * Step 2: Tập hợp các thuộc tính * Step 3: Mối quan hệ giữa các thực thể được quản trị với các thuộc tính trong lĩnh vực đó. * Step 4: Xây dựng ma trận tư liệu * Step 5: Hình thành sơ đồ tổ chức thơng tin Q trình tìm tin hình thức thực chất là tập hợp các cơng đoạn kĩ thuật logic. Vì vậy để phân tích q trình tìm tin này ở trong sơ đồ Thuận, Đảo chúng ta sẽ lần lượt khảo sát theo 5 phương diện sau: 1. Xem cuộc tìm đó thực hiện thành bao nhiêu bước? có những bước gì? (Stages - Steps) 2. Đường tìm tin? (Retrieval path) 3. Phép tìm đơn vị (kĩ thuật, logic - ROU)? mất bao nhiêu ROU? ROU là gì? 4. Cơng thức tổng qt để tính cuộc tìm đó như thế nào (Fomulate)? Khảo sát xem tham số gì chi phối cuộc tìm đó? 5. Đánh giá, kết luận về cuộc tìm (Conclusion or Coment)? THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 4 Với 5 bứoc đi 5 phương diện của q trình tìm tin chúng ta có thể dễ dàng khảo sát cuộc tìm trên các sơ đồ tìm tin: sơ đồ Thuận (Linear schema), sơ đồ Đảo (Invert schema). Đó là những điểm giống nhau căn bản của các sơ đồ tìm tin mà từ đó giúp hệ thống nhận biết truy xuất ra các thực thể thoả mãn u cầu tin của người dùng. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 5 2.2. Điểm khác nhau Bên cạnh những điểm giống nhau trong q trình tìm tin như trên thì cuộc tìm trong 2 file: Thuận, Đảo, cũng có những điểm khác nhau căn bản như sau: Schema Aspects Linear (File Thuận) Invert (File Đảo) 1. Conceptual (Bướcý niệm) Là sơ đồ tổ chức thơng tin theo thực thể, tức là sau mỗi thực thể sẽ liệt kê các thuộc tính của thực thể đó. Thực thể ở đây là các tài liệu được phản ánh. Thuộc tính là chủ đề của tài liệu được rút ra trong q trình Indexing. D i :: = <T J > m i = n1 ; j = m,1 ` T j :: = <A i > n i = n,1 ; j = Là sơ đồ được tổ chức theo thuộc tính, tức là sau mỗi thuộc tính sẽ liệt kê những thực thể chứa thuộc tính đó. m,1 2.3. Điểm khác nhau Bên cạnh những điểm giống nhau trong q trình tìm tin như trên thì cuộc tìm trong 2 file: Thuận, Đảo, cũng có những điểm khác nhau căn bản như sau: Schema Aspects Linear (File Thuận) Invert (File Đảo) THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 6 2. Stages (Bước tìm) Cuộc tìm này thực hiện một bước tìm duy nhất (Tuần tự so sánh u cầu tin với từng tài liệu được quản trị trong hệ thống.) Cuộc tìm này phải thực hiện 2 bước: Bước 1: Truy cập vào các điểm truy cập có trong biểu thức tìm (access point) để thu được các tài liệu theo các điểm truy cập. Bước 2: Thực hiện phép tốn logic để tìm ra tập hợp tài liệu được quản trị trong hệ thống phù hợp với u cầu tin của biểu thức tìm. 3. ROU/Path (Bước tìm đơn vị) Thực hiện ROU kĩ thuật Thực hiện ROU kĩ thuật ROU logic. 4. Fomulate (Cơng thức tổng qt) V L = n ROU V L : Tốc độ cuộc tìm trong file Thuận n: Số thực thể được quản trị trong hệ thống. V I = (2TQ – 1) ROU V I : Tốc độ cuộc tìm trong file Đảo. TQ: Số thuật ngữ có trong câu hỏi tìm. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 7 5. Document Matrix (Ma trận tư liệu) T: Thuộc tính D: Thực thể (Tài liệu) T  D: Giá trị ma trận (Value) T D T 1 …………….T m D 1 : : : : : D m T D T 1 …… T m D 1 : : : : : D m T: Thuộc tính D: Thực thể (Tài liệu) T  D: Giá trị ma trận (Value) 6. Conclusion or Coment (Kết luận, đánh giá, nhận xét) - Tốc độ cuộc tìm trong sơ đồ thuận chậm vì cuộc tìm phải qt tồn miền dữ liệu. - Tính hữu ích của cuộc tìm khơng cao - Tốc độ cuộc tìm trong sơ đồ đảo nhanh hơn vì cuộc tìm có định hướng. - Tính hữu ích của cuộc tìm cao. Như vậy qua sự so sánh những đặc điểm giống nhau khác nhau của 2 phương thức tìm tin trong hệ thống thơng tin ta thấy rằng: Mỗi phương thức (cuộc tìm được thực hiện trên các sơ đồ: Đảo, Thuận.) đều có những ưu điểm nhược THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 8 điểm nhất định. Để có một kết quả cuộc tìm tối ưu, thoả mãn các u cầu của bài tốn tìm tin đưa ra thì tuỳ vào từng trường hợp cụ thể mà ta nên lựa chọn phương thức tìm tin phù hợp nhất. Như vậy sẽ làm giảm đại lượng nhiễu tin mất tin của bài tốn đưa ra để thoả mãn nhu cầu tin của người sử dụng hệ thống tìm tin sẽ đạt tới trạng thái lí tưởng. II. Ví dụ minh hoạ Cho bài tốn tìm tin sau: Trong hệ thống có tập hợp gồm 06 tài liệu với những nội dung, chủ đề được mơ tả như sau: TQ1 :: = <Việt nam, Văn hóa, Đa dạng, Ngơn ngữ> TQ2 :: = <Việt nam, Ngơn ngữ, Con người> TQ3 :: = <Văn hóa, NGơn ngữ, Con người> TQ4 :: = <Việt nam, Văn hóa, Ngơn ngữ> TQ5 :: = <Đa dạng, Con người, Đất nước> TQ6 :: = <Việt nam, Ngơn ngữ,Đất nước> u cầu tìm: “Hãy tìm các tài liệu về ngơn ngữ con người”. Anh (chị) hãy thực hiện các trình tự tìm tin theo 2 sơ đồ: Thuận (Linear schema, Đảo (Invert schema) Bài làm Theo bài ra ta có khơng gian tài liệu như sau: ● Step 1: Tập hợp các thực thể cần quản trị TQ1 :: = <Việt nam, Văn hóa, Đa dạng, Ngơn ngữ> TQ2 :: = <Việt nam, Ngơn ngữ, Con người> TQ3 :: = <Văn hóa, NGơn ngữ, Con người> TQ4 :: = <Việt nam, Văn hóa, Ngơn ngữ> TQ5 :: = <Đa dạng, Con người, Đất nước> TQ6 :: = <Việt nam, Ngơn ngữ,Đất nước> THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 9 ● Step2: Các thuộc tính, chủ để (subjects) A1 ÷ Việt nam A2 ÷ Văn hóa A3 ÷ Đa dạng A4 ÷ Ngơn ngữ A5 ÷ Con người A6 ÷ Đất nước ● Step3: Mối quan hệ giữa các thực thể được quản trị trong hệ thống với các thuộc tính trong lĩnh vực đó TQ1 :: = <A1, A2, A3, A4> TQ2 :: = <A1, A4, A5> TQ3 :: = <A2, A4, A5> TQ4 :: = <A1, A2, A4> TQ5 :: = <A3, A5, A6> TQ6 :: = <A1, A4, A6> ● Step4: Xây dựng ma trận tư liệu (Doccument matrix) A TQ A1 A2 A3 A4 A5 A6 TQ1 1 1 1 1 0 0 TQ2 1 0 0 1 1 0 TQ3 0 1 0 1 1 0 TQ4 1 1 0 1 0 0 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN [...]... cuộc tìm này, trong sơ đồ thuận thực hiện việc tuần tự so sánh nội dung của biểu thức tìm tin với từng tài liệu được quản trị trong sơ đồ thuận của 11 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN hệ thống Cuộc tìm như vậy chỉ thực hiện một bước duy nhất để thu được kết quả thoả mãn u cầu tìm ● Path: (Đường tìm tin) Tuần tự so sánh u cầu tìm: A4 *A5 với từng thực thể trong tập hợp TQ: = < TQ 1, TQ2,… TQ6> Con đường tìm. .. (Đánh giá, nhận xét) Cuộc tìm trong sơ dồ đảo được thực hiện khơng phải trên tồn bộ miền dữ liệu của khơng gian tìm mà hệ thống quản trị Bằng thủ pháp truy cập có định hướng theo u cầu của người dùng tin, khơng gian thực tế của sơ đồ đảo chỉ xảy ra trên các miền hạn chế mà có nội dung trực tiếp liên đới tới chủ đề người dùng tin quan tâm Do đó tính hữu ích cuộc tìm rất cao, tốc độ tìm được cải thiện đáng... liệu trong khi thực hiện cuộc tìm tin khơng trực tiếp, khơng liên quan đến câu hỏi tìm, điều này làm giảm đi hệ số hữu ích trong khơng gian tìm tin tại sơ đồ thuận hệ quả của nó là làm cho cuộc tìm diễn ra một cách chậm chạp, chi phí cho các ROU cần thiết cho việc tìm cụ thể là rất lớn Chính vì vậy mà hiệu quả tìm tin trong sơ đồ thuận là rất thấp Để cải thiện cuộc tìm tin trong sơ đồ thuận, có các... được quản trị trong sơ đồ thuận của hệ thống, đưa đến kết quả cuối cùng là những tập hợp thoả mãn u cầu đề bài: TQ 2 :: = TQ 3 :: = ● ROU: (Phép tìm đơn vị) Cuộc tìm chỉ thực hiện các phép tốn kĩ thuật, khơng thực hiện các phép tốn logic Với biểu thức tìm đã cho cuộc tìm mất 6 ROU kĩ thuật 0 ROU logic ● Fomulate: (Cơng thức tổng qt) VL = n ROU (n: Là số thực thể được quản trị. .. biểu thức tìm tin: Ngơn ngữ * Con người (hay: A4 * A5) Với điều kiện bài tốn như vậy, ta tiến hành khảo sát trên 5 phương diện, kết quả cuối cùng của cuộc tìm là đưa ra những thực thể được quản trị trong hệ thống mà có kết quả phù hợp với nội dung của u cầu tìm Có nghĩa là hệ thống phải đưa ra những tài liệu mà trong đó bao gồm những chủ đề là: “Ngơn ngữ - Con người 10 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 1 Tìm. .. ĐIỆN TỬ TRỰC TUYẾN u cầu tìm A4*A5 A1 TQ 1, TQ 2, TQ 4, TQ 6 A2 Biểu thức tìm: A4 *A5 TQ1 TQ 4 A3 TQ 1, TQ 3 TQ2 TQ 1,TQ 5 TQ3 TQ4 A4 TQ 1, TQ 2, TQ3 TQ6 TQ 2 TQ4, TQ6 A5 TQ 3 TQ 2, TQ 3, TQ 5 A6 TQ2 TQ 5, TQ 6 TQ3 Thoả mãn TQ5 Trình tự cuộc tìm diễn ra như sau: ● Stages: (Bước tìm) : Cuộc tìm trong sơ đồ đảo được thực hiện chia thành 2 bước Bước 1: Thơng qua việc truy cập vào sơ đồ đảo theo các điểm... đồ đảo theo các điểm truy cập có trong biểu thức tìm, ta sẽ thu được các tập hợp tài liệu theo u cầu Bước 2: Tuần tự thực hiện các phép tốn logic ta sẽ thu được tập hợp cuối cùng là tập hợp kết quả chứa những tài liệu được quản trị trong hệ thống phù hợp với u cầu tìm ● Path: (Đường tìm tin) Thực hiện truy cập vào các thuật ngữ (access points) tại khơng gian tìm trong sơ đồ đảo ta thu được 3 tập hợp... đồ đảo cần có 2 phép tìm dơn vị (2 loại ROU) Cụ thể: Ở bước 1: Cần 2 ROU kĩ thuật Ở bước 2: Cần 1 ROU logic Như vậy ta mất 3 ROU cho cuộc tìm này trong sơ đồ đảo ● Fomulate: (Cơng thức tổng quảt) VI = (2TQ - 1)ROU TQ: Thuật ngữ chủ đề Cuộc tìm trong sơ đồ Đảo bị chi phối bởi tham số TQ, mà TQ phản ánh số thuật ngữ chủ đề có trong biểu thức tìm tin Như vậy: VI =(2*2 – 1) ROU = 3 ROU 15 THƯ VIỆN ĐIỆN... Nhân tố quyết định, chi phối tốc độ tìm trong sơ đồ thuận là số lượng các thực thể được quản trị trong hệ thống Do vậy với 06 thực thể được quản trị trong hệ thống thì cuộc tìm trong sơ đồ thuận mất 6 ROU kĩ thuật ● Conclusion or coment: (Nhận xét, đánh giá) Trình tự tìm tin trong sơ đồ thuận đưa đến kết cục được xảy ra trong tồn bộ khơng gian dữ liệu được lưu giữ, quản trị trong hệ thống Như vậy, rõ ràng... trong sơ đồ thuận, có các giải pháp sau: 12 THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN - Tác động vào khơng gian tìm tin bằng cách phân giã sơ đồ thuận thành các sơ đồ con - Tác động vào miền áp dụng của cơ quan thơng tin Thơng thường thường được áp dụng trong khu vực, lĩnh vưc mà nhu cầu, mức độ, cường độ tìm kiếm thơng tin cao 2 Tìm tin trong sơ đồ Đảo (Invert schema) Conceptual layer: Sơ đồ đảo là sơ đồ được tổ . TUYẾN 2 Nội Dung Vấn Đề Để thực hiện được q trình tìm tin hình thức hố cần có 3 tiền đề sau: * Có một khơng gian tìm tin Là cấu trúc có tổ. thơng tin * Có câu hỏi tìm Để tìm kiếm thơng tin trong hệ thống tìm kiếm đòi hỏi phải có định hướng cuộc tìm, thể hiện qua các câu hỏi tìm. Câu hỏi tìm

Ngày đăng: 08/04/2013, 07:55

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan