- 相關(guān)推薦
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
[摘要]電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),按企業(yè)既定業(yè)務(wù)目標(biāo)對(duì)這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素。文章先容了數(shù)據(jù)挖掘技術(shù),以實(shí)例分析了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,并先容了在電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)。[關(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析
隨著Internet 的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變, 電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開(kāi)展電子商務(wù),這是目前電子商務(wù)急需解決的題目。
一 、數(shù)據(jù)挖掘技術(shù)
20 世紀(jì) 90 年代以來(lái),隨著信息技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲(chǔ)大量的數(shù)據(jù)。面對(duì)大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如治理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計(jì)等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識(shí)貧乏”的困境,人們迫切需要一種能夠智能地自動(dòng)地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識(shí)的技術(shù)和工具,這種對(duì)強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們熟悉到數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱躲著很多重要的信息,假如能把這些信息從數(shù)據(jù)庫(kù)中抽取出來(lái),將為公司創(chuàng)造很多潛伏的利潤(rùn)。這種從海量數(shù)據(jù)庫(kù)中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):
(一)數(shù)據(jù)總結(jié)
數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫(kù)中的有關(guān)數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對(duì)原始基本數(shù)據(jù)的總體把握。
(二)分類
分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來(lái)分析已有數(shù)據(jù),并猜測(cè)新數(shù)據(jù)將屬于哪一個(gè)組。
(三)關(guān)聯(lián)分析
數(shù)據(jù)庫(kù)中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說(shuō),兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性。通過(guò)挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。
數(shù)據(jù)挖掘的特點(diǎn)和性質(zhì)對(duì)于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢(shì), 揭示已知的事實(shí), 猜測(cè)未知的結(jié)果, 并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素, 以達(dá)到增加收進(jìn), 降低本錢, 使企業(yè)處于更有利的競(jìng)爭(zhēng)位置的目的。
二、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘技術(shù)源于貿(mào)易的直接需求, 因此它在各種貿(mào)易領(lǐng)域都存在廣泛的使用價(jià)值。電子商務(wù)是貿(mào)易領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開(kāi)展一切商務(wù)活動(dòng)。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時(shí), 企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù), 這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ), 同時(shí)高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動(dòng)中有了更大的用武之地。下面先容數(shù)據(jù)挖掘在以下電子商務(wù)幾個(gè)方面的作用:
(一)客戶細(xì)分
隨著“以客戶為中心”的經(jīng)營(yíng)理念的不斷深進(jìn)人心, 分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營(yíng)的重要課題。通過(guò)對(duì)電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析, 可以按各種客戶指標(biāo)(如自然屬性、收進(jìn)貢獻(xiàn)、交易額、價(jià)值度等) 對(duì)客戶分類, 然后確定不同類型客戶的行為模式, 以便采取相應(yīng)的營(yíng)銷措施, 促使企業(yè)利潤(rùn)的最大化。
(二)客戶獲得
利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過(guò)數(shù)據(jù)挖掘可以發(fā)現(xiàn)購(gòu)買某種商品的消費(fèi)者是男性還是女性, 學(xué)歷、收進(jìn)如何, 有什么愛(ài)好, 是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購(gòu)買該種商品的相關(guān)商品后多長(zhǎng)時(shí)間有可能購(gòu)買該種商品, 以及什么樣的人會(huì)購(gòu)買什么型號(hào)的該種商品等等。也許很多因素表面上看起來(lái)和購(gòu)買該種商品不存在任何聯(lián)系, 但數(shù)據(jù)挖掘的結(jié)果卻證實(shí)它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后, 針對(duì)目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的進(jìn)步, 傾銷的本錢將大大降低。
(三)客戶保持
數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類, 在每個(gè)類里的客戶擁有相似的屬性, 而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來(lái)進(jìn)步客戶的滿足度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失, 這樣挽留客戶的措施將具有針對(duì)性, 挽留客戶的用度將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較輕易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對(duì)于數(shù)據(jù)挖掘的正確性來(lái)說(shuō)是有很大幫助的。在企業(yè)所把握的客戶信息, 尤其是以前購(gòu)買行為的信息中, 可能正包含著這個(gè)客戶決定他下一個(gè)購(gòu)買行為的關(guān)鍵, 甚至決定因素。這個(gè)時(shí)候數(shù)據(jù)挖掘的作用就會(huì)體現(xiàn)出來(lái), 它可以幫助企業(yè)尋找到這些影響他購(gòu)買行為的因素。 (五)個(gè)性服務(wù)
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊(cè)時(shí), 客戶將會(huì)看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄, 系統(tǒng)可以向客戶顯示那些可能引起客戶特殊愛(ài)好的新商品。當(dāng)客戶留意到一件特殊的商品時(shí), 系統(tǒng)會(huì)建議一些在購(gòu)買中可以增加的其他商品。普通的產(chǎn)品目錄手冊(cè)經(jīng)常簡(jiǎn)單地按類型對(duì)商品進(jìn)行分組, 以簡(jiǎn)化客戶挑選商品的步驟。然而對(duì)于在線商店, 商品分組可能是完全不同的, 它經(jīng)常以針對(duì)客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目, 而且還考慮客戶購(gòu)物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個(gè)性化。
(六)資源優(yōu)化
節(jié)約本錢是企業(yè)盈利的關(guān)鍵。通過(guò)分析歷史的財(cái)務(wù)數(shù)據(jù)、庫(kù)存數(shù)據(jù)和交易數(shù)據(jù), 可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動(dòng)的投進(jìn)產(chǎn)出比例, 從而為企業(yè)資源優(yōu)化配置提供決策依據(jù), 例如降低庫(kù)存、進(jìn)步庫(kù)存周轉(zhuǎn)率、進(jìn)步資金使用率等。
(七)異常事件的確定
在很多貿(mào)易領(lǐng)域中, 異常事件具有明顯的貿(mào)易價(jià)值, 如客戶流失、銀行的信用卡欺詐、電信中移動(dòng)話費(fèi)拖欠等。通過(guò)數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速正確地甄別這些異常事件。
由此可見(jiàn)數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國(guó)阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),它利用數(shù)據(jù)挖掘工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個(gè)意外發(fā)現(xiàn):跟尿布一起購(gòu)買最多的商品竟然是啤酒。假如不是借助于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個(gè)隱躲在背后的事實(shí):在美國(guó),一些年輕的父親放工后經(jīng)常要到超市往買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。有了這個(gè)發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?
首先,從挖掘過(guò)程說(shuō),對(duì)在線訪問(wèn)客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問(wèn)信息的挖掘,另一部分是客戶登記信息的挖掘。面對(duì)大量的訪問(wèn)日志,首先要做的就是對(duì)數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無(wú)關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對(duì)數(shù)據(jù)進(jìn)行事務(wù)識(shí)別,通過(guò)對(duì)事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、愛(ài)好關(guān)聯(lián)規(guī)則、聚類等。通過(guò)模式分析,找到有用的信息,再通過(guò)聯(lián)機(jī)分析(OLAP) 的驗(yàn)證,結(jié)合客戶登記信息,找出有價(jià)值的市場(chǎng)信息,或發(fā)現(xiàn)潛伏的市場(chǎng)。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問(wèn)路徑的方法,它通過(guò)對(duì)Web 服務(wù)器的日志文件中客戶訪問(wèn)站點(diǎn)的訪問(wèn)次數(shù)分析,挖掘出頻繁訪問(wèn)路徑。 例如:一客戶從某一站點(diǎn)訪問(wèn)到某一感愛(ài)好的頁(yè)面后就會(huì)經(jīng)常訪問(wèn)該頁(yè)面, 通過(guò)路徑分析確定頻繁訪問(wèn)路徑, 可以了解客戶對(duì)哪些頁(yè)面感愛(ài)好,(下轉(zhuǎn)第78頁(yè))(上接第80頁(yè))從而更好地改進(jìn)設(shè)計(jì),為客戶服務(wù)。
2.愛(ài)好關(guān)聯(lián)規(guī)則
當(dāng)客戶訪問(wèn)某一網(wǎng)頁(yè)時(shí),一般會(huì)通過(guò)愛(ài)好詞條找出相關(guān)的愛(ài)好網(wǎng)頁(yè)通過(guò)鏈接繼續(xù)訪問(wèn), 這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)假如能夠按照某種策略進(jìn)行挖掘分析, 統(tǒng)計(jì)出客戶訪問(wèn)某些頁(yè)面及愛(ài)好關(guān)聯(lián)頁(yè)面的比率, 就可以很好地組織站點(diǎn), 實(shí)施有效的市場(chǎng)策略。
3.聚類分析
聚類分析是電子商務(wù)中很重要的一個(gè)方面,通過(guò)分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過(guò)對(duì)眾多的瀏覽“camera”網(wǎng)頁(yè)的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁(yè)上經(jīng)常花一段時(shí)間瀏覽的客戶,再通過(guò)對(duì)這部分客戶的登記資料分析,知道這些客戶是潛伏要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁(yè)的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。
通過(guò)以上幾種數(shù)據(jù)分析的方法可以有效地對(duì)電子商務(wù)中的信息進(jìn)行分析,從而更有效地開(kāi)展電子商務(wù)。
目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來(lái)越來(lái)越激烈的市場(chǎng)競(jìng)爭(zhēng)中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的貿(mào)易機(jī)會(huì)。現(xiàn)在世界上的主要數(shù)據(jù)庫(kù)廠商紛紛開(kāi)始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國(guó)在這一領(lǐng)域正處在研究開(kāi)發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢(shì)必會(huì)有更好的貿(mào)易機(jī)會(huì)和更光明的遠(yuǎn)景。
[參考文獻(xiàn)]
[1]韓家煒.Web 挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2001 , 38(4).
[2]陳宏. 消費(fèi)者數(shù)據(jù)挖掘系統(tǒng)建立的幾個(gè)題目[J]. www.ctiforum.com,2002-09-03.
【談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用】相關(guān)文章:
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用03-28
數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用03-22
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.03-21
數(shù)據(jù)挖掘在旅游電子商務(wù)中應(yīng)用論文11-28
數(shù)據(jù)挖掘技術(shù)在企業(yè)知識(shí)管理中的應(yīng)用03-19
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究03-07