人們常說,工業(yè)大數(shù)據(jù)是用來挖掘價(jià)值的。但更關(guān)鍵的是:價(jià)值應(yīng)如何被挖掘?
我曾經(jīng)在多個(gè)場(chǎng)合申明:“大數(shù)據(jù)用到工業(yè),特點(diǎn)是對(duì)可靠性要求高,而取得可靠性的難度大。” 這個(gè)矛盾是個(gè)攔路虎,一定要解決才行。為了解決這個(gè)矛盾,我再次提出:“知識(shí)首先存在于人的腦子當(dāng)中,需要用數(shù)據(jù)去雕琢、證偽、修正——而不是強(qiáng)調(diào)從數(shù)據(jù)里面發(fā)現(xiàn)新知識(shí) ”——這與商務(wù)大數(shù)據(jù)是不同的。
我的這個(gè)觀點(diǎn)有個(gè)潛臺(tái)詞:人腦中的知識(shí)是模糊甚至是錯(cuò)誤的,這才需要去雕琢和證偽。其實(shí),人腦中的多數(shù)認(rèn)識(shí)是正確的;但可以挖掘價(jià)值的地方,卻往往是模糊的、甚至是錯(cuò)誤的。事實(shí)上,大數(shù)據(jù)創(chuàng)造的價(jià)值是通過修正人的認(rèn)識(shí)中的不足和偏差來實(shí)現(xiàn)的。
人腦中的這些模糊認(rèn)識(shí),發(fā)生在什么情況下呢?
一種情況是受部門利益或流程標(biāo)準(zhǔn)的限制。我們知道,組織大到一定程度,就要?jiǎng)澐殖扇舾刹块T;機(jī)制復(fù)雜到一定程度,就要流程化、標(biāo)準(zhǔn)化。這些都是促進(jìn)生產(chǎn)力發(fā)展的。但是,這些事情又會(huì)制約信息的流動(dòng)和科學(xué)決策,從而容易形成與組織利益不一致的個(gè)人和部門利益。同時(shí),“標(biāo)準(zhǔn)”和流程的缺陷與不足,讓一些價(jià)值損失“合法化”,難以從組織整體的高度優(yōu)化決策。認(rèn)清事實(shí),就便于我們創(chuàng)造系統(tǒng)的價(jià)值。
經(jīng)驗(yàn)主義、教條主義、官僚主義與唯命是從,也容易讓人形成模糊甚至是錯(cuò)誤的認(rèn)識(shí)。早在10多年前,我就意識(shí)到: 在創(chuàng)新過程中,需要強(qiáng)調(diào)價(jià)值創(chuàng)造。強(qiáng)調(diào)價(jià)值創(chuàng)造的原因,是為了避免誤入歧途——離開具體的背景,片面追求好的指標(biāo)。但最近卻越來越感到:這個(gè)口號(hào)正在誤導(dǎo)一些企業(yè)。在這個(gè)口號(hào)的引導(dǎo)下,間接創(chuàng)造價(jià)值、系統(tǒng)創(chuàng)造價(jià)值都被壓制了;與風(fēng)險(xiǎn)同在的價(jià)值被壓制了;算不清楚收益的工作被壓制了;長(zhǎng)遠(yuǎn)的價(jià)值被壓制了。其實(shí),錯(cuò)的不是口號(hào),而是簡(jiǎn)單地理解這些口號(hào)。語言的表現(xiàn)力是有限的;再明確的語言,到了蠢材那里都會(huì)被誤解。而唯命是從、經(jīng)驗(yàn)主義、教條主義、官僚主義,就會(huì)讓人變蠢。有個(gè)段子形象地表達(dá)了這種現(xiàn)象。市領(lǐng)導(dǎo)到公園考察:“那些多些綠化那就更好了”于是,園長(zhǎng)讓人運(yùn)來了一頓鹽(把‘綠化那’聽成‘氯化鈉’)堆在公園里。這個(gè)段子看似好笑,在很多地方其實(shí)非常接近現(xiàn)實(shí)。
還有人認(rèn)為:系統(tǒng)的價(jià)值損失不大,就不重視這些問題。我卻覺得,系統(tǒng)價(jià)值其實(shí)很大,但主要是被掩蓋掉了。另外,考慮到很多制造企業(yè)的利潤(rùn)率也只有1%~2%,能把小的方面優(yōu)化起來,利益也是客觀的。其實(shí),把局部?jī)?yōu)化都做好了,整個(gè)企業(yè)就可能發(fā)生質(zhì)變——這就好比把坑坑洼洼的道路修成了高速公路,司機(jī)就可以放心開高速了。否則,你會(huì)花費(fèi)太多的成本來預(yù)防“異常”。
數(shù)據(jù)如何才能起到上述作用?
老大說過一句話:打鐵還需自身硬。本人也有個(gè)對(duì)應(yīng)的觀點(diǎn):數(shù)據(jù)的力量來自于真實(shí)和科學(xué)。這句話的含義是:人們?cè)谕七M(jìn)數(shù)字化的時(shí)候,常常被認(rèn)識(shí)水平和局部利益所綁架、被政績(jī)觀綁架,使得數(shù)據(jù)不具備科學(xué)性和真實(shí)性。數(shù)據(jù)不科學(xué),怎么可能用來修正人的錯(cuò)誤認(rèn)識(shí)呢?試想,如果真的是“經(jīng)濟(jì)增長(zhǎng)就靠統(tǒng)計(jì)局了”,國家還能搞好嗎?英國有位前首相說:“世界上有三類謊言:謊言,彌天大謊和統(tǒng)計(jì)數(shù)據(jù)。”。 搞數(shù)據(jù)的人,一定要知道:數(shù)據(jù)是會(huì)騙人的。學(xué)會(huì)不被數(shù)據(jù)所騙,是數(shù)據(jù)分析的基本功。
讓數(shù)據(jù)代表科學(xué)和真實(shí),其實(shí)并不容易。不僅要看到文化和制度的原因,也有技術(shù)和認(rèn)識(shí)方面的原因。這里,就需要有方法論的支持。舉個(gè)例子,希望引發(fā)大家的思考:
1、從A地到B地,平均2小時(shí)。其實(shí),從A地到B地有兩條路,一條平均半小時(shí),一條平均10小時(shí),只是很少有人走10小時(shí)的那條路。那么,如果你不知有兩條路,僅知道“從A地到B地,平均2小時(shí)。”,真的能代表科學(xué)與事實(shí)嗎?
2、喜歡打牌的人,50%是騙子。我們知道:一般來說,這句話是錯(cuò)的。但是,如果統(tǒng)計(jì)的對(duì)象是一群罪犯呢?結(jié)果還是有可能的。
這兩個(gè)例子用來供大家思考,并沒有什么答案。愛其實(shí),很早之前,人們就提出“數(shù)據(jù)質(zhì)量”的概念。數(shù)據(jù)質(zhì)量,不僅是精度問題,更是“適用性”問題——適用的結(jié)果,才是真實(shí)的結(jié)果。在筆者看來,在大數(shù)據(jù)時(shí)代,讓我們有更好的條件通過各種對(duì)比,判斷一個(gè)結(jié)論的“適用性”:因?yàn)榭梢哉业揭淮蠖训陌咐M(jìn)行對(duì)比——語文老師從小就告訴我們:有對(duì)比才會(huì)有說明。
但是,對(duì)比說明就那么容易嗎?當(dāng)然也不容易,需要找到一種與業(yè)務(wù)知識(shí)相關(guān)的知識(shí)和邏輯,才能便于對(duì)比說明。否則,整出一個(gè)“關(guān)公戰(zhàn)秦瓊”也難說。有了業(yè)務(wù)知識(shí),就能避免這些笑話。如果缺少業(yè)務(wù)知識(shí),就很難判斷一個(gè)分析結(jié)果是假象還是眾所周知的無聊論斷——如前所述,在工業(yè)過程中,系統(tǒng)復(fù)雜性很容易導(dǎo)致“發(fā)現(xiàn)”大量的假象和無聊的結(jié)果。如果沒有起碼的業(yè)務(wù)知識(shí),時(shí)間就會(huì)都浪費(fèi)在無聊的“發(fā)現(xiàn)”上。
現(xiàn)在回到開頭:工業(yè)大數(shù)據(jù)分析的最終目的是挖掘價(jià)值。但現(xiàn)實(shí)中直接的作用在于展示現(xiàn)實(shí)——展示那些頭腦中被假象和錯(cuò)誤觀念蒙蔽的現(xiàn)實(shí)。在被蒙蔽的現(xiàn)實(shí)中,隱含著改進(jìn)的空間——這就是金子所在的地方。當(dāng)然,看到價(jià)值并不等于能夠解決問題——這些問題很可能需要用智能制造的辦法來解決。所以,我設(shè)想:工業(yè)大數(shù)據(jù)或許可以作為智能制造的先導(dǎo)。智能制造的第一要義是“信息感知”:用大數(shù)據(jù)感知真實(shí)的現(xiàn)實(shí),豈不正是智能制造的先導(dǎo)嗎?孫子說“知己知彼百戰(zhàn)不殆”,不也是要先做到“信息感知”嗎?克服官僚主義,不要也要靠“信息感知”。