智能信息處理(一) | 您所在的位置:網(wǎng)站首頁(yè) › 屬羊人今日打麻將 › 智能信息處理(一) |
智能信息處理(IIP)
Intelligent Information Processing 1.概念模擬人或其它生物處理信息的行為,建立處理復(fù)雜系統(tǒng)信息的理論、算法和系統(tǒng)的一些方法和技術(shù) 2.特點(diǎn)不需要建立問(wèn)題的精確描述 3.基礎(chǔ)以人工智能導(dǎo)論為基礎(chǔ),融合滲透數(shù)據(jù)挖掘。 4.例子 “啤酒與尿布”,超市貨架組織,關(guān)聯(lián)銷售,購(gòu)物籃分析網(wǎng)上購(gòu)物,廣告投放,定向營(yíng)銷客戶流失分析信息檢索,智能搜索入侵檢測(cè) 5.技術(shù)背景 超大規(guī)模數(shù)據(jù)庫(kù)的出現(xiàn)先進(jìn)的計(jì)算機(jī)技術(shù)對(duì)海量數(shù)據(jù)的快速訪問(wèn)統(tǒng)計(jì)方法深入 6.問(wèn)題 數(shù)據(jù)過(guò)剩信息爆炸知識(shí)貧乏 7.推廣 數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn) 7.1 數(shù)據(jù)挖掘 DM 7.1.1 概念技術(shù)層面:數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中,提取潛在有用的信息和知識(shí)的過(guò)程。 商業(yè)層面:數(shù)據(jù)挖掘就是一種商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和建模處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。 7.1.2 特點(diǎn)數(shù)據(jù)挖掘所得到的信息應(yīng)具有先前未知、有效和實(shí)用三個(gè)特征。其主要目標(biāo)就是提高決策能力,能在過(guò)去的經(jīng)驗(yàn)基礎(chǔ)上預(yù)言未來(lái)趨勢(shì)等。 7.1.3 挖掘?qū)ο? 關(guān)系數(shù)據(jù)庫(kù)(Relation database)數(shù)據(jù)倉(cāng)庫(kù)(Data warehouse)事務(wù)數(shù)據(jù)庫(kù)(Transaction database)空間數(shù)據(jù)庫(kù)(Spatial database)時(shí)態(tài)數(shù)據(jù)庫(kù)和時(shí)序數(shù)據(jù)庫(kù) (Temporal database)流數(shù)據(jù)(Streaming database)多媒體數(shù)據(jù)庫(kù) (Multimedia database)文本數(shù)據(jù)(Text database)萬(wàn)維網(wǎng)數(shù)據(jù)(Word Wide Web Data) 7.1.4 挖掘任務(wù)預(yù)測(cè)任務(wù): 根據(jù)其它屬性的值預(yù)測(cè)特定屬性的值,如分類、回歸、離群點(diǎn)檢測(cè)。 描述任務(wù): 尋找概括數(shù)據(jù)中潛在聯(lián)系的模式,如聚類分析、關(guān)聯(lián)分析、演化分析、序列模式挖掘。 7.1.4.1 分類(Classification)分析示例數(shù)據(jù)庫(kù)中的數(shù)據(jù)為每個(gè)類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則 7.1.4.2 聚類(Clustering)聚類分析技術(shù)試圖找出數(shù)據(jù)集中的共性和差異,并將具有共性的對(duì)象聚合在相應(yīng)的類中。 7.1.4.3 回歸(Regression )回歸分析是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種分析方法。 7.1.4.4 關(guān)聯(lián)(Association)發(fā)現(xiàn)特征之間的相互依賴關(guān)系,通常是從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的模式知識(shí)(又稱為關(guān)聯(lián)規(guī)則)。 7.1.4.5 離群點(diǎn)檢測(cè)(Outlier)離群點(diǎn)檢測(cè)就是發(fā)現(xiàn)與眾不同的數(shù)據(jù)。 7.1.4.6 演化(Evolving)演化分析就是對(duì)隨時(shí)間變化的數(shù)據(jù)對(duì)象的變化規(guī)律和趨勢(shì)進(jìn)行建模描述。 7.1.4.7 序列模式(Sequential pattern)序列模式挖掘是指分析數(shù)據(jù)間的前后序列關(guān)系,包括相似模式發(fā)現(xiàn)、周期模式發(fā)現(xiàn)等。 7.2 知識(shí)發(fā)現(xiàn) KDD 7.2.1 概念是從數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的整個(gè)過(guò)程。 這個(gè)過(guò)程定義為:從數(shù)據(jù)中鑒別出有效模式的非平凡過(guò)程,該模式是新的、可能有用的和最終可理解的。 7.2.2 主要步驟 數(shù)據(jù)清洗(data clearning)其作用是清除數(shù)據(jù)噪聲和與挖掘主題明顯無(wú)關(guān)的數(shù)據(jù)。數(shù)據(jù)集成(data integration)其作用是將來(lái)自多數(shù)據(jù)源中的相關(guān)數(shù)據(jù)組合到一起。數(shù)據(jù)轉(zhuǎn)換(data transformation)其作用是將數(shù)據(jù)轉(zhuǎn)換為易于進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)存儲(chǔ)形式。數(shù)據(jù)挖掘(data mining)其作用是利用智能方法挖掘數(shù)據(jù)模式或規(guī)律知識(shí)。模式評(píng)估(pattern evaluation)其作用是根據(jù)一定評(píng)估標(biāo)準(zhǔn)從挖掘結(jié)果篩選出有意義的相關(guān)知識(shí)。知識(shí)表示(knowledge presentation)其作用是利用可視化和知識(shí)表達(dá)技術(shù),向用戶展示所挖掘的相關(guān)知識(shí)。 8.數(shù)據(jù)挖掘過(guò)程 數(shù)據(jù)收集知識(shí)提取知識(shí)輔助決策文章內(nèi)容來(lái)自課程ppt,侵刪 |
CopyRight 2018-2019 實(shí)驗(yàn)室設(shè)備網(wǎng) 版權(quán)所有 |