手機號
未認證執(zhí)照
張寶(先生)
普通會員
張寶 (先生)
隨著網絡、數據庫技術的迅速發(fā)展以及數據庫管理系統(tǒng)的廣泛應用,人們積累的數據越來越多。數據挖掘(data mining)就是從大量的實際應用數據中提取隱含信息和知識,它利用了數據庫、人工智能和數理統(tǒng)計等多方面的技術,是一類深層次的數據分析方法。
數據的迅速增加與數據分析方法的滯后之間的矛盾越來越突出,人們希望在對已有的大量數據分析的基礎上進行科學研究、商業(yè)決策或者企業(yè)管理,但是目前所擁有的數據分析工具很難對數據進行深層次的處理,使得人們只能望“數”興嘆。數據挖掘正是為了解決傳統(tǒng)分析方法的不足,并針對大規(guī)模數據的分析處理而出現的。數據挖掘通過在大量數據的基礎上對各種學習算法的訓練,得到數據對象間的關系模式,這些模式反映了數據的內在特性,是對數據包含信息的更高層次的抽象。目前,在需要處理大數據量的科研領域中,數據挖掘受到越來越多的關注,同時,在實際問題中,大量成功運用數據挖掘的實例說明了數據挖掘對科學研究具有很大的促進作用。數據挖掘可以幫助人們對大規(guī)模數據進行高效的分析處理,以節(jié)約時間,將更多的精力投入到更高層的研究中,從而提高科研工作的效率。
數據挖掘是知識發(fā)現(kdd)過程中的一個特定步驟,它用專門算法從數據中抽取模式,它并不是用規(guī)范的數據庫查詢語言進行查詢,而是對查詢的內容進行模式的總結和內在規(guī)律的搜索。傳統(tǒng)的查詢和報表處理只是得到事件發(fā)生的結果,并沒有深入研究發(fā)生的原因,而數據挖掘則主要了解發(fā)生的原因,并且以一定的置信度對未來進行預測,用來為決策行為提供有利的支持。
北京理工大學大數據搜索與挖掘實驗室張華平主任研發(fā)的nlpir大數據語義智能分析技術是對語法、詞法和語義的綜合應用。nlpir大數據語義智能分析平臺平臺是根據中文數據挖掘的綜合需求,融合了網絡精準采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯網內容處理的全技術鏈條的共享開發(fā)平臺。
其中kgb(knowledge graph builder)知識圖譜引擎是我們自主研發(fā)的知識圖譜構建與推理引擎,基于漢語詞法分析的基礎上,采用kgb語法實現了實時高效的知識生成,可以從非結構化文本中抽取各類知識,并實現了從表格中抽取指定的內容等。kgb同時可以定義不同的動作,如抽取動作,并能自定義各類后處理程序。利用kgb知識圖譜引擎可以抽取到產品的詳細報價信息,方便進行下一步的數據挖掘與圖譜構建。
例如kgb語法:
knowledge: { [/le;/w]+[采購方;甲 方;發(fā)包方; 需方]} +1+{[-(/le;/w)]20}s+{[(/le;/w)]}
action: extract
argument:甲 方單位
表示的是:
如果 句首或者標點后,跟了{采購方;甲 方;發(fā)包方};后面1步內跟的不是標點也不是是句尾,20個單元內的部分,將選中的詞抽取為甲 方單位。
數據挖掘技術及其應用是目前國際上的一個研究熱點,并在許多行業(yè)中得到了很好的應用,尤其是在市場營銷中獲得了成功,初步體現了其優(yōu)越性和發(fā)展?jié)摿。在信息管理領域,綜合應用數據挖掘技術和人工智能技術,獲取用戶知識、文獻知識等各類知識,將是實現知識檢索和知識管理發(fā)展的必經之路。
聯系人 | 需求數量 | 時間 | 描述 |
---|---|---|---|
暫無產品詢價記錄 |
采購商 | 成交單價(元) | 數量 | 成交時間 |
---|---|---|---|
暫無購買記錄 |
地區(qū):成都
主營產品:電磁閥,氣缸,過濾器地區(qū):滄州
主營產品:機床維修,鑄件,工量具地區(qū):汕頭
主營產品:物流公司,貨運站,國內陸運地區(qū):成都
主營產品:聲屏障,護欄網,石籠網