1、數(shù)據(jù)的來(lái)源
有種觀點(diǎn)認(rèn)為大數(shù)據(jù)的來(lái)源是業(yè)務(wù)系統(tǒng),大數(shù)據(jù)平臺(tái)只是順便把這些數(shù)據(jù)收集起來(lái)。這樣做不為數(shù)據(jù)的收集產(chǎn)生額外成本、也不影響原有業(yè)務(wù)系統(tǒng)的運(yùn)行。但是,各個(gè)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù),往往不是為了分析目的而建立的,關(guān)聯(lián)關(guān)系是丟失的。這樣,數(shù)據(jù)中很多的價(jià)值就失去了。本人的觀點(diǎn)是,如果這種觀點(diǎn)成立,建立業(yè)務(wù)系統(tǒng)的時(shí)候就要想到進(jìn)行數(shù)據(jù)分析。否則,數(shù)據(jù)的價(jià)值就會(huì)大打折扣。未來(lái),如果要讓數(shù)據(jù)發(fā)揮大的作用,可能要花很大的時(shí)間對(duì)某些數(shù)據(jù)進(jìn)行人工處理、講專家頭腦中的知識(shí)與數(shù)據(jù)結(jié)合起來(lái),然后入庫(kù):如果等到分析數(shù)據(jù)的時(shí)候再做,很多信息早已丟失了。當(dāng)然,這個(gè)過(guò)程本身的規(guī)范化要做好。否則甚至?xí)押脭?shù)據(jù)變成垃圾。
2、有無(wú)明確的業(yè)務(wù)功能
工業(yè)大數(shù)據(jù)平臺(tái)有沒有明確的功能? 多數(shù)觀點(diǎn)認(rèn)為:大數(shù)據(jù)的功能是事后分析挖掘。而針對(duì)事后分析,有兩種態(tài)度:有什么數(shù)據(jù)用什么數(shù)據(jù)、為了便于分析收集數(shù)據(jù)。我們認(rèn)為,從未來(lái)的角度看,后者應(yīng)該是發(fā)展方向。這時(shí),數(shù)據(jù)的質(zhì)量、完整性就變得很非常重要。
在我看來(lái),隨著ICT技術(shù)的提升,大數(shù)據(jù)平臺(tái)很可能會(huì)成為新一代的智能監(jiān)控系統(tǒng)(GE對(duì)飛機(jī)發(fā)動(dòng)機(jī)的設(shè)想應(yīng)該就是)。與傳統(tǒng)監(jiān)控系統(tǒng)不同的是:平臺(tái)能記憶大量的過(guò)往案例和處置方法。未來(lái)的這種監(jiān)控,很可能是為無(wú)人化、少人化、移動(dòng)監(jiān)控服務(wù)的。如果是這樣,就會(huì)對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)質(zhì)量、傳輸?shù)目煽啃院蛯?shí)施性產(chǎn)生極高的要求。換而言之,智能制造與工業(yè)大數(shù)據(jù)的相互促進(jìn),會(huì)大大拓展這個(gè)領(lǐng)域的發(fā)展前景。
3、大數(shù)據(jù)能獲得什么知識(shí)
人們很早就意識(shí)到:數(shù)據(jù)質(zhì)量是決定于應(yīng)用的目的。所以,在建立大數(shù)據(jù)平臺(tái)之前,能夠明確希望得到什么樣的知識(shí),而不是泛泛地強(qiáng)調(diào)分析知識(shí)。我想,這些知識(shí)的一端是企業(yè)關(guān)心的結(jié)果,如質(zhì)量、效率、能耗、缺陷率、作業(yè)率、設(shè)備狀態(tài)、完成時(shí)間,另外一端是與這些要素相關(guān)的原因。我們要得到的知識(shí)大概分成兩類:初級(jí)的分析是原因與結(jié)果的關(guān)系,比如A變量與B變量的關(guān)系。但現(xiàn)實(shí)中,這種關(guān)系往往是很不穩(wěn)定的。其他要素變化的時(shí)候,這種關(guān)系也會(huì)發(fā)生變化。所以,進(jìn)一步的知識(shí)是要知道:哪些要素固定下來(lái)以后,變量之間的關(guān)系是穩(wěn)定的。這些知識(shí)可以用于提高生產(chǎn)組織的水平、考核相關(guān)人員、發(fā)現(xiàn)各種跑冒滴漏、明確優(yōu)化的側(cè)重點(diǎn)等。當(dāng)然,理想的情況是分析多變量對(duì)多變量的關(guān)系。但遺憾的是,這樣的分析結(jié)果往往是可遇不可求的。
4、知識(shí)發(fā)現(xiàn)的人機(jī)關(guān)系問(wèn)題
發(fā)現(xiàn)知識(shí)的過(guò)程是認(rèn)識(shí)漸進(jìn)的過(guò)程、是對(duì)知識(shí)可靠性把握不斷深入的過(guò)程。這個(gè)過(guò)程往往是人機(jī)交互實(shí)現(xiàn)的。首先,人要對(duì)可能的相關(guān)關(guān)系提出自己的想法;其次,可以通過(guò)計(jì)算機(jī)對(duì)人的想法進(jìn)行篩選;接著,篩選過(guò)程中可能會(huì)出現(xiàn)大量難以解釋、或無(wú)法確認(rèn)的東西,又需要人進(jìn)行深入的對(duì)比分析:必要時(shí)甚至需要試驗(yàn)和文獻(xiàn)分析補(bǔ)充數(shù)據(jù)、乃至提出新的假設(shè)。我曾經(jīng)想通過(guò)找到自動(dòng)化的算法,把機(jī)理不清楚的問(wèn)題搞清楚。這現(xiàn)實(shí)中是難以實(shí)現(xiàn)的?,F(xiàn)實(shí)中的辦法,往往只是“可靠性”的收斂速度比較快、人的工作量相對(duì)較小。我一直認(rèn)為:人類分析復(fù)雜問(wèn)題的能力,是計(jì)算機(jī)遠(yuǎn)遠(yuǎn)不及的。大數(shù)據(jù)時(shí)代我們有更多的素材,但要做得更好,需要更聰明的人來(lái)完成。當(dāng)然,任何事情都有反例、特別是全體人類都非常關(guān)注的問(wèn)題——這時(shí),人類會(huì)不計(jì)代價(jià),為機(jī)器智能做好各種準(zhǔn)備工作。但對(duì)一般的企業(yè),用機(jī)器代替人的分析,很可能是不合算的。
5、對(duì)概念的認(rèn)識(shí)
研究工業(yè)大數(shù)據(jù),不必糾結(jié)于數(shù)據(jù)的多少。我們關(guān)心的是:如何讓數(shù)據(jù)創(chuàng)造商業(yè)價(jià)值。我一直認(rèn)為,現(xiàn)在的統(tǒng)計(jì)理論,主要是針對(duì)小數(shù)據(jù)集合的,比如幾十個(gè)樣本以內(nèi);幾十年前的數(shù)據(jù)挖掘方法,基本上停留在科學(xué)尺度,勉強(qiáng)進(jìn)入技術(shù)尺度,很少成功進(jìn)入商業(yè)尺度;現(xiàn)在的深度學(xué)習(xí)理論,則很難廣泛地進(jìn)入工業(yè)領(lǐng)域。
違法和不良信息舉報(bào)投訴電話:0377-62377728 舉報(bào)郵箱:fbypt@ex12580.com
網(wǎng)絡(luò)警察提醒你 a>
中國(guó)互聯(lián)網(wǎng)舉報(bào)中心
網(wǎng)絡(luò)舉報(bào)APP下載
掃黃打非網(wǎng)舉報(bào)專區(qū)