手機(jī)號(hào)
未認(rèn)證執(zhí)照
張寶(先生)
普通會(huì)員
張寶 (先生)
信息時(shí)代的突出特點(diǎn)是數(shù)據(jù)爆炸。企業(yè)資源系統(tǒng)、銷售系統(tǒng)、市場(chǎng)調(diào)查、供應(yīng)鏈、客戶、網(wǎng)站、制造流程等都不斷在我們面前添加新的信息;數(shù)據(jù)挖掘是利用統(tǒng)計(jì)與人工智能的算法;從龐大的企業(yè)歷史數(shù)據(jù)中,找出隱藏的規(guī)律以及建立精確的模型,預(yù)測(cè)未來(lái),提供有效的市場(chǎng)行銷及客戶關(guān)系管理。數(shù)據(jù)挖掘自形成概念以來(lái);已經(jīng)在銀行業(yè)、保險(xiǎn)業(yè)、零售業(yè)、電信業(yè)、直銷行銷、制造業(yè)、電子商務(wù)等領(lǐng)域有廣泛的應(yīng)用。
數(shù)據(jù)挖掘(data mining,簡(jiǎn)稱dm)從狹義上是指從數(shù)據(jù)庫(kù)中提取知識(shí)。具體的說(shuō)是在數(shù)據(jù)庫(kù)中,對(duì)數(shù)據(jù)進(jìn)行一定的處理,從而獲得其中隱含的、事先未知的而又可能極為有用的信息。這些信息通常是以知識(shí)、規(guī)則或約束等形式來(lái)表現(xiàn)。在其他文獻(xiàn)中有許多類似的提法,例如:數(shù)據(jù)分析,知識(shí)獲取,知識(shí)萃取,數(shù)據(jù)構(gòu)成等。數(shù)據(jù)挖掘方法在數(shù)據(jù)庫(kù)系統(tǒng)和人工智能領(lǐng)域是一個(gè)新方向。
數(shù)據(jù)挖掘一般分為以下幾個(gè)主要步驟:
1.數(shù)據(jù)收集
大量全面豐富的數(shù)據(jù)是數(shù)據(jù)挖掘的前提,沒(méi)有數(shù)據(jù),數(shù)據(jù)挖掘也就無(wú)從作起。因此,數(shù)據(jù)收集是數(shù)據(jù)挖掘的首要步驟。數(shù)據(jù)可以來(lái)自于現(xiàn)有事務(wù)處理系統(tǒng),也可以從數(shù)據(jù)倉(cāng)庫(kù)中得到。
2.數(shù)據(jù)整理
數(shù)據(jù)整理是數(shù)據(jù)挖掘的必要環(huán)節(jié)。由數(shù)據(jù)收集階段得到的數(shù)據(jù)可能有一定的“污染”,表現(xiàn)在數(shù)據(jù)可能存在自身的不一致性,或者有缺失數(shù)據(jù)的存在等,因此數(shù)據(jù)的整理是必須的。同時(shí),通過(guò)數(shù)據(jù)整理,可以對(duì)數(shù)據(jù)做簡(jiǎn)單的泛化處理,從而在原始數(shù)據(jù)的基礎(chǔ)之上得到更為豐富的數(shù)據(jù)信息,進(jìn)而便于下一步數(shù)據(jù)挖掘的順利進(jìn)行。
3.數(shù)據(jù)挖掘
利用各種數(shù)據(jù)挖掘方法對(duì)數(shù)據(jù)進(jìn)行分析。
4.數(shù)據(jù)挖掘結(jié)果的評(píng)估
數(shù)據(jù)挖掘的結(jié)果有些具有實(shí)際意義,而另一些沒(méi)有實(shí)際意義,或是與實(shí)際情況相違背,這就需要進(jìn)行評(píng)估。評(píng)估可以根據(jù)用戶多年的經(jīng)驗(yàn),也可以直接用實(shí)際數(shù)據(jù)來(lái)驗(yàn)證模型的正確性,進(jìn)而調(diào)整挖掘模型,不斷重復(fù)進(jìn)行數(shù)據(jù)挖掘。
5.分析決策
數(shù)據(jù)挖掘的最終目的是輔助決策。決策者可以根據(jù)數(shù)據(jù)挖掘的結(jié)果,結(jié)合實(shí)際情況,調(diào)整競(jìng)爭(zhēng)策略等。
數(shù)據(jù)挖掘技術(shù)的目標(biāo)是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關(guān)系,從而服務(wù)于決策。 nlpir文本搜索與挖掘系統(tǒng)平臺(tái)針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的需要,融合了自然語(yǔ)言理解、網(wǎng)絡(luò)搜索和文本挖掘的技術(shù),提供了用于技術(shù)二次開(kāi)發(fā)的基礎(chǔ)工具集。系統(tǒng)平臺(tái)包括:全文精準(zhǔn)檢索、新詞發(fā)現(xiàn)、分詞標(biāo)注、統(tǒng)計(jì)分析、文本聚類、分類過(guò)濾、正負(fù)面分析、自動(dòng)摘要等十多個(gè)中間件組成,各個(gè)中間件api可以無(wú)縫地融合到客戶的各類復(fù)雜應(yīng)用系統(tǒng)之中。
nlpir是一套專門針對(duì)原始文本集進(jìn)行處理和加工的軟件,提供了中間件處理效果的可視化展示,也可以作為小規(guī)模數(shù)據(jù)的處理加工工具。用戶可以使用該軟件對(duì)自己的數(shù)據(jù)進(jìn)行處理。
數(shù)據(jù)挖掘是在數(shù)據(jù)庫(kù)中對(duì)數(shù)據(jù)進(jìn)行一定的處理,從而獲得其中隱含、事先未知的而又可能極為有用的信息。這些信息通常是以知識(shí)、規(guī)則或約束等形式來(lái)表現(xiàn)。這些知識(shí)可以用于知識(shí)管理、問(wèn)題求解、制定決策、過(guò)程控制和其他領(lǐng)域。
聯(lián)系人 | 需求數(shù)量 | 時(shí)間 | 描述 |
---|---|---|---|
暫無(wú)產(chǎn)品詢價(jià)記錄 |
采購(gòu)商 | 成交單價(jià)(元) | 數(shù)量 | 成交時(shí)間 |
---|---|---|---|
暫無(wú)購(gòu)買記錄 |
地區(qū):成都
主營(yíng)產(chǎn)品:電磁閥,氣缸,過(guò)濾器地區(qū):滄州
主營(yíng)產(chǎn)品:機(jī)床維修,鑄件,工量具地區(qū):汕頭
主營(yíng)產(chǎn)品:物流公司,貨運(yùn)站,國(guó)內(nèi)陸運(yùn)地區(qū):成都
主營(yíng)產(chǎn)品:聲屏障,護(hù)欄網(wǎng),石籠網(wǎng)