什么是web挖掘的基本任務(wù)之一 WEB挖掘被分為哪幾類?
WEB挖掘被分為哪幾類?Web內(nèi)容挖掘。Web內(nèi)容挖掘是指對Web頁面內(nèi)容和后臺事務(wù)數(shù)據(jù)庫進行挖掘,從Web文檔內(nèi)容及其描述的內(nèi)容信息中獲取有用知識的過程。同時,還可以挖掘web的組織結(jié)構(gòu)和鏈接關(guān)系,
WEB挖掘被分為哪幾類?
Web內(nèi)容挖掘。Web內(nèi)容挖掘是指對Web頁面內(nèi)容和后臺事務(wù)數(shù)據(jù)庫進行挖掘,從Web文檔內(nèi)容及其描述的內(nèi)容信息中獲取有用知識的過程。同時,還可以挖掘web的組織結(jié)構(gòu)和鏈接關(guān)系,從人工鏈接結(jié)構(gòu)中獲取有用的知識。由于文檔之間的互聯(lián)性,www除了提供文檔內(nèi)容外,還可以提供有用的信息。利用這些信息,我們可以對頁面進行排序并找到重要的頁面?!eb使用記錄挖掘。Web使用記錄挖掘是通過挖掘相應(yīng)站點的日志文件和相關(guān)數(shù)據(jù),發(fā)現(xiàn)站點訪問者的行為模式,獲取有價值的信息的過程。Web挖掘的目標是從超鏈接結(jié)構(gòu)、Web內(nèi)容和使用日志中發(fā)現(xiàn)有用的信息。雖然web挖掘使用了多種數(shù)據(jù)挖掘技術(shù),但它不僅僅是傳統(tǒng)數(shù)據(jù)挖掘的簡單應(yīng)用。在過去的20年里,許多新的挖掘任務(wù)和算法被發(fā)明出來。根據(jù)挖掘過程中使用的數(shù)據(jù)類型,web挖掘任務(wù)可以分為三種主要類型:web結(jié)構(gòu)挖掘、web內(nèi)容挖掘和web使用挖掘。