來源:《中國高新技術產業(yè)導報》
北京是中國軟件產業(yè)的中心,產業(yè)規(guī)模居全國首位。盡管如此,北京的數(shù)據(jù)挖掘產業(yè)發(fā)展與中國數(shù)據(jù)產業(yè)類似,仍停留在初級階段。北京擁有大量從事數(shù)據(jù)挖掘的國內外企業(yè)和單位,分布在理論算法研究、軟件工具、咨詢服務、集成開發(fā)等產業(yè)鏈各個環(huán)節(jié)。相比較而言,產業(yè)鏈上游市場主要被國外企業(yè)占據(jù),國內企業(yè)主要處于產業(yè)鏈的末端。SAS、SPSS、SAP、Oracle、Teredata、微軟和IBM等企業(yè)都把北京作為輻射中國的核心;而國內企業(yè)像神州數(shù)碼、太極、中科軟、華迪、拓爾思等主要提供系統(tǒng)集成服務,產品和工具提供商數(shù)量較少,規(guī)模較小,影響力與國外企業(yè)相比有一定差距。
北京海量數(shù)據(jù)挖掘產業(yè)發(fā)展難點分析
用戶數(shù)據(jù)挖掘工具使用能力弱
目前用戶普遍存在的問題是,數(shù)據(jù)掌握者與數(shù)據(jù)挖掘結果需求者往往不是同一人,由此造成掌握企業(yè)數(shù)據(jù)的人不知道數(shù)據(jù)有什么用,而需要數(shù)據(jù)挖掘結果的人卻不知道從何處得到這些結果,因而在決策中處于被動的局面。用戶數(shù)據(jù)挖掘工具使用能力弱,造成企業(yè)數(shù)據(jù)與數(shù)據(jù)挖掘結果的集成問題突出。
用戶缺乏能夠執(zhí)行數(shù)據(jù)挖掘的復合型人才
從目前電信、金融行業(yè)的人才結構來看,主導建設數(shù)據(jù)挖掘系統(tǒng)的大多是工科出身,業(yè)務不熟悉,對于數(shù)學領域中的統(tǒng)計學也都較為生疏。因此這種復合型人才的缺乏也在很大程度上造成了我國數(shù)據(jù)挖掘市場的不成熟。
數(shù)據(jù)源的可靠性問題
數(shù)據(jù)源是整個數(shù)據(jù)挖掘過程的源頭,如果源頭的數(shù)據(jù)不能保證可靠、可信和科學,那么挖掘得到的信息也就不可靠。因此,如果數(shù)據(jù)源的問題不解決,數(shù)據(jù)挖掘就是紙上談兵。
北京發(fā)展海量數(shù)據(jù)挖掘產業(yè)的優(yōu)劣勢分析
北京發(fā)展海量數(shù)據(jù)挖掘產業(yè)的優(yōu)勢
一是數(shù)據(jù)挖掘產業(yè)結構完整。完整的數(shù)據(jù)挖掘產業(yè)鏈條包括算法提供方、產品和工具提供商、系統(tǒng)集成商、咨詢公司和企業(yè)用戶。北京是中國軟件產業(yè)的中心,其海量數(shù)據(jù)挖掘產業(yè)結構相對完整。
二是有較為成熟的理論和技術。北京有較為成熟的海量數(shù)據(jù)挖掘理論和技術,擁有北大SAS 數(shù)據(jù)挖掘卓越中心、中國科大博納數(shù)據(jù)挖掘中心等專業(yè)研究機構;擁有中科院計算所MSMiner多策略數(shù)據(jù)挖掘平臺、人大金倉SmartBI系列產品、TRS BigData等海量數(shù)據(jù)挖掘產業(yè)有代表性的產品。
三是數(shù)據(jù)資源豐富,企業(yè)、政務機關集聚,數(shù)據(jù)的質量和數(shù)量都占有優(yōu)勢。






資訊頻道