近日,智慧圖譜CEO王緒剛就“如何使軟件對分析結果具有洞察能力”給出了自己的見解,以下是其觀點全文:
作為21世紀最火熱行業“人工智能”的從業者,在“營銷大數據”領域工作多年,合作過眾多行業標桿型客戶,卻在與市場業務團隊的磨合初期,常常被尷尬的問到:“分析結果我們看到了,但這個結果想要告訴我們什么?”這個問題也可以理解為,“如何讓軟件具備對分析結果的洞察能力”?
洞察Insight,通俗的理解就是,企業從自身的業務邏輯去解讀數據現象的能力。同樣一份數據,具備不同業務經驗的人解讀起來得到的結論也各有不同。當分析結果被人詬病沒有Insight時,往往表達的是以下幾個意思:
1.分析結果與我們的業務有什么關系嗎?
2.分析結果我們是看到了,但是導致這個結果的原因是什么呢?
3.看來我們的業務的確出現了問題,可我們應該怎么改進呢?
4.為什么分析結果與我業務經驗得到的結果不一致?
5.分析結果會對我未來的計劃造成哪些影響呢?
當數據科學家面對這些質疑的時候,往往第一反應會想,如何基于更大的數據做復雜分析,或再用R建立一個新的模型,又或者需要做一些“教師”信號來訓練深度網絡……但通常都是工程師的角度,從業務角度出發思考問題?不存在的。如此,巨大的溝通鴻溝出現在業務需求者與數據科學家中間,我代表人類說Insight,而你代表計算機說Deep Learning。
要消除這道鴻溝,讓數據產生洞察,需要建立一種業務人員與計算機都可以理解的知識體系:
1、用“業務的語言”去解釋數據
數據分析應用的核心基礎在于,業務的數據化和數據的業務化,通俗來講,就是把銷售,市場,售后等商業過程中的數據記錄下來,再對這些數據用業務的語言進行解釋,讓業務決策人員可以理解,業務流程可以應用起來。我們常說的用戶畫像,就是一種對用戶行為數據的業務語言解釋。例如,在營銷場景中,用戶瀏覽了某產品三次,意味著該用戶對該產品的購買傾向增加。
而業務部門不同,對于同數據的描述方法也不盡相同。例如,“安裝師傅挺好的,只是這個聲音堪比鼓風機啊,只能說一等價錢一等貨吧!麻煩配送人員了!”這樣一條評論,對于售后部門,就是一條正面評價,而對于產品設計部門,就是一條負面評價,且負面內容具體描述的是產品性能上的噪音問題。
因此同一條評論、用戶行為等過程數據,通常需要打上多種標簽,同時要把標簽之間的語義關系表達出來,這樣的方式近似人類語言中的概念與知識體系。學術界稱之為“知識圖譜”。
2、發現數據中的特征作為新的知識
簡單的統計方法,發現的僅僅只是淺顯的客觀事實,但對于企業的業務決策優化,無法提供結論或建議。例如,把人口統計學分析與微博數據結合起來,證明某個品牌的女性用戶占比大大超過男性,建議采用一些受女性歡迎的KOL作為傳播自媒體。但女性比例并不是該品牌的特征,而是所有這個行業的共性。
再例如,某主題公園對用戶口碑的分析,二月份負面評價比例持平,并沒有引起足夠重視。但如果對負面評價深入分類,就會發現二月份餐飲的負面批評與過去的六個月對比,呈顯著上升。因此二月份的負面評價特征與餐飲直接形成了相關性對應。從而得到了春節期間,餐飲部門管理不善的結論。
因此,不僅僅是簡單的統計,而是通過一些“特征抽取”算法,找到兩個現象之間的相關性、相似性、因果性等特征,才能讓業務人員得到新的知識。
3、從問題出發,去探索答案
有經驗但不懂業務需求的分析師,往往喜歡把記憶中的分析維度與當前可以獲得的數據結合起來,來驗證一些業務假設或者既定的猜想。
分析中常見的人口統計學、轉化率、關鍵詞云等分析維度,分析師采用的是“驗證式”的分析方法,而業務人員的思考模式更近似于“探索式分析”,想要知道分析結果背后的誘因或會有多少關聯因素會受其影響,從問題出發,去找到答案。
例如,通過監測,數據提示競爭對手上市了新款,并且銷售與好評最近3天表現一直在上升,從這個數據出發,我們可以探索,該款產品的設計要素與價格,直接與企業的那些品牌產生競爭,同期內,我們的策略與口碑表現對比如何?競爭對手的這個產品,好評在哪些方面,是哪些產品要素導致了這些好的口碑?是否值得我們跟進?
這種探索分析的方式,利用了數據挖掘的手段,更加符合人類的思考與推理方法,更容易得到有效的、可行動的結論。
4、讓數據分析過程透明化
無論是分析人員、還是業務決策人員,人們總是更加傾向于自身經驗的判斷,如果整個數據的流程是一個黑盒子,必然無法對分析的結果進行解釋,也就降低了數據分析的可信力。因此需要讓整個分析過程透明化,可以追溯并可以反饋。
5、讓數據管理人員,分析人員與業務人員在同一個體系下協同工作
數據決策過程需要多種背景,多種角色的人員參與,程序員、分析員與營銷員,分別負責處理數據、生成分析報告,產生業務決策三種不同的任務。處于不同的工作環境,甚至不在一家公司。通過一個在線的協同系統將三者置于同一套界面、語言和流程下,不僅僅有利于大家更加具象的進行交流,減少信息漏斗,提高溝通效率。也有利于業務知識的傳遞與沉淀,企業不會因為某個人的變動而造成業務的停滯,業務知識才是企業真正的商業壁壘。
溝通漏斗