數據面面觀:關於數據挖掘和數據分析

2019-03-16 16:42:01

1、

很多關於數據挖掘的帖子和文章都在強調工具、算法和架構等,但其實這些都不是數據挖掘的核心,數據挖掘的最重要的環節如下:

2、

為什麼把數據挖掘和數據分析放在一起說,是因為數據挖掘本身是一個數據套用化的過程,而套用化的過程某種意義上就是一個數據分析的過程,而這個數據分析可以是人為定義的、AI人工智慧輔助的等等。

所以,我們可以暫且這樣定數據挖掘和數據分析的關係:通過不斷最佳化的數據分析方法,並利用數據挖掘才能夠得出數據套用價值的最大化的結果。

數據挖掘是數據價值結果導向的過程集合,而數據套用價值到底有多大?者就是通過數據分析來評估的,其來自於數據分析的過程以及得出的結論。

3、

數據挖掘並不局限。就狹義而言,它就是一個在海量數據中挖掘數據價值的過程;而就廣義而言,只要是有數據來源的,並能夠通過數據分析方法論得到一數據價值結果為導向的過程,都可以稱作數據挖掘。

4、

產品運營經常會涉及到數據分析,從某種意義上而言,也是一個以數據價值為結果導向的過程:

5、

舉個商業化套用的例子,比如EverString這個產品,去年年底剛剛融了B輪65m美刀。這是一家通過大數據技術提供B2B Marketing領域企業智慧型解決方案的公司,通過挖掘企業數據與結合企業CRM,並建立模型,再利用這些模型幫助企業來預測誰是他們下一個客戶。以下是對於這家公司業務的分析:

6、

關於數據分析,並不可以簡單理解為對於對於數據進行定量、定性的分析和得出一個可用的數據結果的過程集合,這也是我為什麼把數據挖掘和數據分析放在一起說的原因。數據分析一定是伴隨著數據從採集到定義,再到套用,最後通過分析數據套用的價值,並不斷自我過程最佳化。

從某種意義上而言,數據分析會用到的很多工具。我們會發現無論是用GA、百度統計、友盟等等,它們同樣在做著:從採集數據、獲取標籤(機型、地理位置、用戶畫像等)、定義特徵(轉換率、客單價等)和模型(漏斗模型等)到套用模型(可視化圖表等)。這個過程同樣可以理解為一個數據分析方法結合數據挖掘的過程,即對可獲取的數據進行價值挖掘和套用的過程。

* 瞎琢磨,才疏學淺,一隅之見。

相關文章
精选文章