báo cáo khai phá mức độ sử dụng cho và trên web ngữ nghĩa

36 345 0
báo cáo khai phá mức độ sử dụng cho và trên web ngữ nghĩa

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÀI TIӆU LUҰ N WEB MINING Tên bài báo: KHAI PHÁ MӬC ĐӜ SӰ DӨNG CHO VÀ TRÊN WEB NGӲ NGHĨA Ngưͥi d͓ch : Phan Lê Thi͏n I.Tóm tҳt y Khai phá web ngӳ nghĩa nhҵm mөc đích phӕi hӧp hai lĩnh vӵc phát triӇn nhanh Semantic Web và Web Mining. Mөc đích Web Mining là khám phá nhӳng hiӇu biӃt vӅ vҩn đӅ ngӳ nghĩa cӫa tài nguyên Web và viӋc sӱ dөng chúng. Do tính chҩt chӫ yӃu là cú pháp cӫa hoҥt đӝng khai phá dӳ liӋu Web, sӵ khám phá ra ngӳ nghĩa là không thӇ chӍ dӵa trên cơ sӣ dӳ liӋu này. Do đó, đӏnh dҥng ngӳ nghĩa cӫa tài nguyên web và sӵ điӅu hưӟng hành vi ngày càng đưӧc sӱ dөng y Semantic Web nâng cao chҩt lưӧng trên www bҵng máy xӱ lý thông tin hӛ trӧ ngưӡi sӱ dөng trong công viӋc cӫa mình. y Trong bài báo này, chúng tôi thҧo luұn sӵ tác đӝng qua lҥi cӫa Semantic Web và Web Mining, vӟi trӑng tâm đһc biӋt vӅ khai phá mӭc đӝ sӱ dөng. II. Thông tin y Khai phá mӭc đӝ sӱ dөng web là mӝt ӭng dөng cӫa nhӳng phương pháp khai phá dӳ liӋu đӇ phân tích mүu tin sӱ dөng web, thưӡng xuyên nhҩt trong biӇu mүu cӫa nhұt ký máy chӫ web. Mӝt trong nhӳng vҩn đӅ chӫ yӃu là sӕ lưӧng lӟn cӫa các mүu thưӡng đưӧc tìm thҩy, trong sӕ này,làm như thӃ nào có thӇ xác đӏnh đưӧc mүu chú ý. y Ví dө, mӝt ӭng dөng cӫa luұt phân tích kӃt hӧp đӇ đăng nhұp web là bҧn thӕng kê tiêu biӇu cӫa 1 vài mүu quan sát rҵng 90% ngưӡi sӱ dөng đã mua vào mӝt cӱa hàng trӵc tuyӃn cũng như đã đӃn thăm trang chӫ cӫa mӝt mô hình đó là tҫm thưӡng bӣi vì trang chӫ là điӇm vào chính cӫa trang web. II. Thông tin y Mӝt cách tiӃp cұn phә biӃn cho mô hình hoá các trang web và cách sӱ dөng chúng là liên quan đӃn phương pháp kӻ thuұt OLAP: OLAP là mӝt kӻ thuұt sӱ dөng các thӇ hiӋn dӳ liӋu đa chiӅu gӑi là các kh͙i nhҵm cung cҩp khҧ năng truy xuҩt nhanh đӃn dӳ liӋu cӫa kho dӳ liӋu. Tҥo khӕi cho dӳ liӋu trong các bҧng chiӅu và bҧng sӵ kiӋn trong kho dӳ liӋu và cung cҩp khҧ năng thӵc hiӋn các truy vҩn tinh vi và phân tích cho các ӭng dөng client. OLAP đưӧc đһt ra đӇ xӱ lý các truy vҩn liên quan đӃn lưӧng dӳ liӋu rҩt lӟn mà nӃu cho thӵc thi các truy vҩn này trong hӋ thӕng OLTP sӁ không thӇ cho kӃt quҧ hoһc sӁ mҩt rҩt nhiӅu thӡi gian. II. Thông tin y Mӝt vҩn đӅ thӭ hai phҧi đӕi mһt vӟi nhiӅu phân tích hiӋn tҥi mà tính đӃn ngӳ nghĩa hӑc là đӏnh nghĩa thưӡng phҧi đưӧc chӃ tác bҵng tay đӇ đҥi diӋn cho mӝt trang web đó có phát triӇn đӝc lұp vӅ mӝt khái niӋm tәng thӇ và bҧn đӗ cӫa các trang cá nhân đӇ khái niӋm này có thӇ đưӧc thiӃt lұp. Như vұy sӁ là mong muӕn đӇ có mô hình phong phú cӫa trang web, khái niӋm cӫa nó và cҩu trúc cӫa nó (siêu liên kӃt), mӝt mô hình đӇ chөp sӵ phӭc tҥp cӫa các mӕi quan hӋ đa dҥng giӳa các khái niӋm đӅ cұp trong trang web, và mô hình đó là ³xây dӵng vào´ trang web trong câu đó mà trang theo yêu cҫu cӫa khách là ngay khi liên kӃt vӟi khái niӋm và mӕi quan hӋ cӫa nó. II. Thông tin y Các web ngӳ nghĩa chӍ là thӃ này: hiӋn nay làm giàu bҵng web cӫa mӝt ngӳ nghĩa chính thӭc ӣ dҥng cӫa bҧn thӇ hӑc mà nҳm bҳt đưӧc ý nghĩa cӫa trang và các liên kӃt mүu có thӇ hiӇu đưӧc máy. Ý tưӣng chính cӫa Semantic Web là thông tin quá trình máy trong trình tӵ đӇ cho phép dӵa trên nhӳng công cө ngӳ nghĩa cӫa ngưӡi sӱ dөng. y Trong bài báo này, chúng tôi thҧo luұn trên mӝt phía mà Semantic Web có thӇ cҧi thiӋn khai thác sӱ dөng, và mӝt phía khác làm sao khai thác sӱ dөng có thӇ dùng đӇ xây dӵng Semantic Web II. Thông tin y Chúng tôi sӱ dөng kǤ hҥn Semantic Web Mining đӇ biӇu thӏ nhӳng phương pháp khác nhau vӅ khai thác Semantic Web và khai thác cho các Semantic Web. Bên cҥnh Semantic Web Usage Mining, Semantic Web Mining cũng bao gӗm Semantic Web Content và Structure Mining. Chúng tôi thҧo luұn vӅ quan điӇm chung vӅ Semantic Web Mining trong (5) . Trong bài báo này,chúng tôi sӁ tұp trung vào nhiӅu khía cҥnh đһc biӋt cӫa Semantic Web Usage Mining. y Lý tưӣng nhҩt, tҩt cҧ các phương pháp giҧi quyӃt trên nên đưӧc kӃt hӧp đӇ đi tӯ trang web và cách dùng cӫa nó tӟi ngӳ nghĩa hӑc cӫa nó và ngưӧc lҥi III. Web (Usage) Mining y Khai phá Web là viӋc áp dөng các kӻ thuұt khai phá dӳ liӋu theo khái niӋm, cҩu trúc và sӱ dөng các tài nguyên web. ĐiӅu này có thӇ giúp khám phá toàn cҫu cũng như cҩu trúc cөc bӝ trong và giӳa các trang web. Giӕng như sӵ ӭng dөng khai phá dӳ liӋu khác, khai phá web có thӇ có lӧi nhuұn tӯ viӋc đưa cҩu trúc cho dӳ liӋu (như trong các bҧng cơ sӣ dӳ liӋu), nhưng nó cũng có thӇ cung cҩp chung cҩu trúc hoһc không có cҩu trúc dӳ liӋu như văn bҧn dҥng tӵ do. ĐiӅu này có nghĩa Web Mining là mӝt trӧ giúp vô giá trong viӋc chuyӇn đәi tӯ nӝi dung dӉ hiӇu cӫa con ngưӡi đӃn máy ngӳ nghĩa dӉ hiӇu. y Sӵ khác biӋt này thưӡng thӵc hiӋn giӳa khai phá web đó hoҥt đӝng trên tài nguyên web cӫa chính nó (thưӡng xuyên phân biӋt trong nӝi dung và cҩu trúc khai phá) và khai phá mà hoҥt đӝng vӅ cách sӱ dөng cӫa khách vӅ tài nguyên này. III. Web (Usage) Mining y Nӝi dung khai phá web là mӝt dҥng khai phá văn bҧn. Nó tұp trung trong khái niӋm vӅ các trang cá nhân, nó chӭa trong tұp lӋnh HTML«mã hoá cái đó tҥo ra mӝt trang. Vì vұy nó có thӇ tұn dөng nhӳng cҩu trúc chung cӫa nhӳng kiӇu văn bҧn. Cҩu trúc siêu liên kӃt giӳa các trang là, trên mӝt phía, cҩu trúc bên trên và ӣ trên các trang cá nhân. Đây là cách dùng trong khai phá cҩu trúc web gҫn giӕng như thuұt toán Google PageRank xác đӏnh sӵ liên quan cӫa mӝt trang vӟi trang khác ³trích dүn´ nó như thӃ nào. Mӝt mһt khác, các siêu liên kӃt là mӝt phҫn cӫa nguyên văn khái niӋm cӫa 1 trang. y ĐiӅu này đһc biӋt đúng vӟi các trang trong siêu liên kӃt, như các yӃu tӕ khác, là (ngӳ nghĩa) tăng lên rõ ràng. III. Web (Usage) Mining y Trong khai phá mӭc đӝ sӱ dөng web ,tài nguyên web chính đó là khai phá là mӝt mүu tin lӡi đӅ nghӏ cӫa khách hàng khi đӃn trang web,thưӡng phҫn lӟn tұp hӧp trong mӝt nhұt ký máy chӫ web. Nӝi dung và cҩu trúc cӫa trang web, và trong sӵ đһc biӋt cӫa mӝt trang web, phҧn ánh ý đӏnh cӫa tác giҧ và nhà thiӃt kӃ vӅ các trang và thông tin mô hình cơ bҧn. Hành vi thӵc tӃ cӫa ngưӡi sӱ dөng vӅ tài nguyên này có thӇ tìm thҩy bә sung cҩu trúc. y Đҫu tiên, mӕi quan hӋ có thӇ đưӧc thuyӃt phөc bҵng cách sӱ dөng nơi không có cҩu trúc đһt biӋt đưӧc thiӃt kӃ. y Ví dө, trong danh mөc online cӫa sҧn phҭm thưӡng có cҩu trúc hoһc không có hoһc mӝt hoһc mӝt sӕ cҩu trúc phân cҩp đưa ra các loҥi sҧn phҭm,các nhà sҧn xuҩt «khai phá viӋc ghé thăm đӃn trang web, tuy nhiên, ngưӡi ta có thӇ tìm thҩy rҵng nhiӅu ngưӡi sӱ dөng quan tâm đӃn sҧn phҭm A cũng quan tâm sҧn phҭm B. [...]... cho khai phá web và khai phá cӫa chính bҧn thân Web ngӳ nghĩa, chúng tôi sӁ bàn luұn cҧ hai trong mӝt kiӇu tәng hӧp V Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa y Lӧi ích cӫa khai phá mӭc đӝ sӱ dөng Web bao gӗm ngӳ nghĩa hӑc vào trong quá trình khai phá cho mӝt lý do đơn giҧn mà các chuyên gia ӭng dөng như kӃt thúc cӫa kӃt quҧ khai phá là sӵ quan tâm... logic V Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa y Ngӳ nghĩa hӑc có thӇ đưӧc dùng cho khai phá mӭc đӝ sӱ dөng Web cho nhӳng mөc đích khác nhau Mӝt sӕ phương pháp tiӃp cұn hiӋn nay trong mөc này mӝt hình thӭc hóa tương đӕi đһc biӋt cӫa ngӳ nghĩa hӑc, trong khi nhӳng ngưӡi khác khai thác toàn bӝ công suҩt cӫa Web ngӳ nghĩa Web ngӳ nghĩa cung cҩp mӝt... lưӧng khai phá Web: nhӳng kiӇu cӫa (siêu) liên kӃt bây giӡ đưӧc mô tҧ rõ ràng, cho phép kӻ sư kiӃn thӭc tìm kiӃm đưӧc nhӳng sӵ hiӇu thҩu sâu hơn trong cҩu trúc khai phá Web; và nӝi dung cӫa nhӳng trang đӃn cùng vӟi mӝt ngӳ nghĩa hӑc hình thӭc, cho phép áp dөng kӻ thuұt khai phá mà đòi hӓi nhiӅu hơn vӅ cҩu trúc nhұp đưӧc đưa vào y Bӣi vì sӵ khác biӋt giӳa cách sӱ dөng cӫa ngӳ nghĩa hӑc cho khai phá web và. .. dùng đӇ cҧi tiӃn các trang web tĩnh cho tҩt cҧ ngưӡi sӱ dөng (thêm vào link tӯ C đӃn D), hay cho nhӳng khuyӃn cáo đӝng đưӧc biӃn thành chuyӋn cá nhân cho tұp con cӫa nhӳng ngưӡi sӱ dөng mà đi đӃn C III Web (Usage) Mining y Nó thì hӳu ích đӇ kӃt hӧp khai phá sӱ dөng web vӟi nӝi dung và cҩu trúc trình tӵ phân tích đӇ ³có ý nghĩa đưӡng dүn quan sát thưӡng xuyên và các trang trên các đưӡng dүn ĐiӅu này... bӣi nhóm bҧn thӇ luұn W3C Web (WebOnt) dưӟi tên OWL y Vài công cө đang sӱ dөng cho sӵ tҥo thành và bҧo trì cӫa nhӳng bҧn thӇ luұn và siêu dӳ liӋu, cũng như cho lý luұn bên trong cӫa nó IV Semantic Web y Nhóm cӫa chúng tôi đã phát triӇn OntoEdit, mӝt trình biên tұp bҧn thӇ luұn mà khi đưӧc kӃt nӕi vӟi Ontobroker, mӝt đӝng cơ suy luұn cho F-Logic Nó cung cҩp có nghĩa cho ngӳ nghĩa hӑc nhӳng cách trình... dӏch V Sӱ dөng ngӳ nghĩa hӑc cho khai phá mӭc đӝ sӱ dөng và khai phá mӭc đӝ sӱ dөng cӫa Web ngӳ nghĩa y Chҷng hҥn, xem xét mӝt trang Web du lӏch mà cho phép ngưӡi đӃn thăm tìm kiӃm nhӳng khách sҥn theo tiêu chuҭn khác nhau, đӇ quan sát nhӳng sӵ mô tҧ chi tiӃt cӫa nhӳng khách sҥn này, đӇ đһt chӛ ,v.v« Trong trang web, mӝt vҩn đӅ đһt phòng khách sҥn có thӇ đưӧc nhұn ra bӣi thư hӗi báo cӫa trang reserve.php?user=12345&hotel=Beach_Hotel&people=2... trong khai phá như thӃ nào? y Khai phá đang sӱ dөng nhiӅu nguyên tҳc phân loҥi có liên quan đӃn kӻ thuұt khӕi dӳ liӋu OLAP y Sӵ phân tích cӫa dӳ liӋu trӯu tưӧng sӱ dөng nguyên tҳc phân loҥi thì quan trӑng cho nhiӅu khai phá ӭng dөng đӇ phát sinh nhӳng kӃt quҧ đҫy ý nghĩa y Nhӳng mүu đã đưӧc khai phá thì không có ích cho nhӳng ӭng dөng như hӋ thӕng ngưӡi giӟi thiӋu khi nhӳng tin tӭc mӟi đưӧc giӟi thiӋu vào... ngưӡi khai phá có thӇ đưӧc dùng đӇ khám phá nhӳng mүu tuҫn tӵ trong dӳ liӋu đưӧc thay đәi Nhӳng hình dҥng cӫa nhӳng mүu tuҫn tӵ, và công cө khai phá đưӧc dùng, xác đӏnh nhiӅu kiӃn thӭc trưӟc có thӇ đưӧc dùng đӇ hҥn chӃ nhӳng mâu thuүn cho nhau V.4 KiӃn thӭc vӅ nhӳng sӵ kiӋn ӭng dөng đưӧc sӱ dөng trong khai phá như thӃ nào? y Tӟi nay, thông thưӡng ít tán thành trên mô hình hoҥt đӝng cӫa web ngӳ nghĩa. .. Semantic Web y Mô hình dӳ liӋu cơ sӣ RDF cơ bҧn là mӝt đӗ thӏ đã đưӧc dán nhãn đӏnh hưӟng Đӏnh nghĩa RDF Schema mӝt mô hình ngôn ngӳ đơn giҧn trên đҫu cӫa RDF nó bao gӗm các lӟp là mӝt mӕi quan hӋ giӳa lӟp và giӳa các thuӝc tính ,và lĩnh vӵc/miӅn hҥn chӃ cho thuӝc tính RDF và RDF Schema thì lưu ý vӟi các cú pháp XML nhưng không thӇ giúp cho cây ngӳ nghĩa hӑc cӫa XML y Lӟp tiӃp theo là bҧn thӇ hӑc tӯ vӵng và. .. có thӇ đưӧc thӵc hiӋn bҵng nhiӅu phương pháp Phҫn lӟn trong sӕ nhӳng phương pháp dӵa trên bҧn vӁ cӫa trang trong bҧn thӇ hӑc Và ưu tiên bҧn thӇ hӑc và ánh xҥ cӫa trang vào đó có thӇ đã có sҹn, ánh xҥ cӫa trang trong bҧn thӇ hӑc hiӋn nay có thӇ cҫn có nghiên cӭu, và/ hoһc bҧn thӇ hӑc chính nó có thӇ có đưӧc suy ra trưӟc tiên IV Semantic Web y Semantic Web là dӵa trên mӝt tҫm nhìn cӫa Tim Berners-Lee,ngưӡi . TIӆU LUҰ N WEB MINING Tên bài báo: KHAI PHÁ MӬC ĐӜ SӰ DӨNG CHO VÀ TRÊN WEB NGӲ NGHĨA Ngưͥi d͓ch : Phan Lê Thi͏n I.Tóm tҳt y Khai phá web ngӳ nghĩa nhҵm mөc đích phӕi hӧp hai lĩnh vӵc phát triӇn. Semantic Web và Web Mining. Mөc đích Web Mining là khám phá nhӳng hiӇu biӃt vӅ vҩn đӅ ngӳ nghĩa cӫa tài nguyên Web và viӋc sӱ dөng chúng. Do tính chҩt chӫ yӃu là cú pháp cӫa hoҥt đӝng khai phá dӳ. nó tӟi ngӳ nghĩa hӑc cӫa nó và ngưӧc lҥi III. Web (Usage) Mining y Khai phá Web là viӋc áp dөng các kӻ thuұt khai phá dӳ liӋu theo khái niӋm, cҩu trúc và sӱ dөng các tài nguyên web. ĐiӅu này

Ngày đăng: 12/04/2015, 14:12

Tài liệu cùng người dùng

Tài liệu liên quan