為什么數(shù)據(jù)分析沒有“洞察”?

2018-05-24 11:04 來源:美通社 作者:Janet

近日,智慧圖譜CEO王緒剛就“如何使軟件對分析結(jié)果具有洞察能力”給出了自己的見解,以下是其觀點全文:

作為21世紀最火熱行業(yè)“人工智能”的從業(yè)者,在“營銷大數(shù)據(jù)”領(lǐng)域工作多年,合作過眾多行業(yè)標桿型客戶,卻在與市場業(yè)務(wù)團隊的磨合初期,常常被尷尬的問到:“分析結(jié)果我們看到了,但這個結(jié)果想要告訴我們什么?”這個問題也可以理解為,“如何讓軟件具備對分析結(jié)果的洞察能力”?

洞察Insight,通俗的理解就是,企業(yè)從自身的業(yè)務(wù)邏輯去解讀數(shù)據(jù)現(xiàn)象的能力。同樣一份數(shù)據(jù),具備不同業(yè)務(wù)經(jīng)驗的人解讀起來得到的結(jié)論也各有不同。當分析結(jié)果被人詬病沒有Insight時,往往表達的是以下幾個意思:

1.分析結(jié)果與我們的業(yè)務(wù)有什么關(guān)系嗎?

2.分析結(jié)果我們是看到了,但是導致這個結(jié)果的原因是什么呢?

3.看來我們的業(yè)務(wù)的確出現(xiàn)了問題,可我們應(yīng)該怎么改進呢?

4.為什么分析結(jié)果與我業(yè)務(wù)經(jīng)驗得到的結(jié)果不一致?

5.分析結(jié)果會對我未來的計劃造成哪些影響呢?

當數(shù)據(jù)科學家面對這些質(zhì)疑的時候,往往第一反應(yīng)會想,如何基于更大的數(shù)據(jù)做復雜分析,或再用R建立一個新的模型,又或者需要做一些“教師”信號來訓練深度網(wǎng)絡(luò)……但通常都是工程師的角度,從業(yè)務(wù)角度出發(fā)思考問題?不存在的。如此,巨大的溝通鴻溝出現(xiàn)在業(yè)務(wù)需求者與數(shù)據(jù)科學家中間,我代表人類說Insight,而你代表計算機說Deep Learning。

要消除這道鴻溝,讓數(shù)據(jù)產(chǎn)生洞察,需要建立一種業(yè)務(wù)人員與計算機都可以理解的知識體系:

1、用“業(yè)務(wù)的語言”去解釋數(shù)據(jù)

數(shù)據(jù)分析應(yīng)用的核心基礎(chǔ)在于,業(yè)務(wù)的數(shù)據(jù)化和數(shù)據(jù)的業(yè)務(wù)化,通俗來講,就是把銷售,市場,售后等商業(yè)過程中的數(shù)據(jù)記錄下來,再對這些數(shù)據(jù)用業(yè)務(wù)的語言進行解釋,讓業(yè)務(wù)決策人員可以理解,業(yè)務(wù)流程可以應(yīng)用起來。我們常說的用戶畫像,就是一種對用戶行為數(shù)據(jù)的業(yè)務(wù)語言解釋。例如,在營銷場景中,用戶瀏覽了某產(chǎn)品三次,意味著該用戶對該產(chǎn)品的購買傾向增加。

而業(yè)務(wù)部門不同,對于同數(shù)據(jù)的描述方法也不盡相同。例如,“安裝師傅挺好的,只是這個聲音堪比鼓風機啊,只能說一等價錢一等貨吧!麻煩配送人員了!”這樣一條評論,對于售后部門,就是一條正面評價,而對于產(chǎn)品設(shè)計部門,就是一條負面評價,且負面內(nèi)容具體描述的是產(chǎn)品性能上的噪音問題。

因此同一條評論、用戶行為等過程數(shù)據(jù),通常需要打上多種標簽,同時要把標簽之間的語義關(guān)系表達出來,這樣的方式近似人類語言中的概念與知識體系。學術(shù)界稱之為“知識圖譜”。

2、發(fā)現(xiàn)數(shù)據(jù)中的特征作為新的知識

簡單的統(tǒng)計方法,發(fā)現(xiàn)的僅僅只是淺顯的客觀事實,但對于企業(yè)的業(yè)務(wù)決策優(yōu)化,無法提供結(jié)論或建議。例如,把人口統(tǒng)計學分析與微博數(shù)據(jù)結(jié)合起來,證明某個品牌的女性用戶占比大大超過男性,建議采用一些受女性歡迎的KOL作為傳播自媒體。但女性比例并不是該品牌的特征,而是所有這個行業(yè)的共性。

再例如,某主題公園對用戶口碑的分析,二月份負面評價比例持平,并沒有引起足夠重視。但如果對負面評價深入分類,就會發(fā)現(xiàn)二月份餐飲的負面批評與過去的六個月對比,呈顯著上升。因此二月份的負面評價特征與餐飲直接形成了相關(guān)性對應(yīng)。從而得到了春節(jié)期間,餐飲部門管理不善的結(jié)論。

因此,不僅僅是簡單的統(tǒng)計,而是通過一些“特征抽取”算法,找到兩個現(xiàn)象之間的相關(guān)性、相似性、因果性等特征,才能讓業(yè)務(wù)人員得到新的知識。

3、從問題出發(fā),去探索答案

有經(jīng)驗但不懂業(yè)務(wù)需求的分析師,往往喜歡把記憶中的分析維度與當前可以獲得的數(shù)據(jù)結(jié)合起來,來驗證一些業(yè)務(wù)假設(shè)或者既定的猜想。

分析中常見的人口統(tǒng)計學、轉(zhuǎn)化率、關(guān)鍵詞云等分析維度,分析師采用的是“驗證式”的分析方法,而業(yè)務(wù)人員的思考模式更近似于“探索式分析”,想要知道分析結(jié)果背后的誘因或會有多少關(guān)聯(lián)因素會受其影響,從問題出發(fā),去找到答案。

例如,通過監(jiān)測,數(shù)據(jù)提示競爭對手上市了新款,并且銷售與好評最近3天表現(xiàn)一直在上升,從這個數(shù)據(jù)出發(fā),我們可以探索,該款產(chǎn)品的設(shè)計要素與價格,直接與企業(yè)的那些品牌產(chǎn)生競爭,同期內(nèi),我們的策略與口碑表現(xiàn)對比如何?競爭對手的這個產(chǎn)品,好評在哪些方面,是哪些產(chǎn)品要素導致了這些好的口碑?是否值得我們跟進?

這種探索分析的方式,利用了數(shù)據(jù)挖掘的手段,更加符合人類的思考與推理方法,更容易得到有效的、可行動的結(jié)論。

4、讓數(shù)據(jù)分析過程透明化

無論是分析人員、還是業(yè)務(wù)決策人員,人們總是更加傾向于自身經(jīng)驗的判斷,如果整個數(shù)據(jù)的流程是一個黑盒子,必然無法對分析的結(jié)果進行解釋,也就降低了數(shù)據(jù)分析的可信力。因此需要讓整個分析過程透明化,可以追溯并可以反饋。

5、讓數(shù)據(jù)管理人員,分析人員與業(yè)務(wù)人員在同一個體系下協(xié)同工作

數(shù)據(jù)決策過程需要多種背景,多種角色的人員參與,程序員、分析員與營銷員,分別負責處理數(shù)據(jù)、生成分析報告,產(chǎn)生業(yè)務(wù)決策三種不同的任務(wù)。處于不同的工作環(huán)境,甚至不在一家公司。通過一個在線的協(xié)同系統(tǒng)將三者置于同一套界面、語言和流程下,不僅僅有利于大家更加具象的進行交流,減少信息漏斗,提高溝通效率。也有利于業(yè)務(wù)知識的傳遞與沉淀,企業(yè)不會因為某個人的變動而造成業(yè)務(wù)的停滯,業(yè)務(wù)知識才是企業(yè)真正的商業(yè)壁壘。

2141129-1

溝通漏斗

數(shù)據(jù)分析

一周熱門