郭朝暉:從數(shù)據(jù)中獲得知識
2023年01月10日 10:05:26
來源:云南昌暉儀表制造有限公司 >> 進入該公司展臺
閱讀量:18
最近和幾位朋友談到同一個問題:從數(shù)據(jù)中獲得知識。有人談起,他們準備做工業(yè)大腦,大量應(yīng)用機器學習。對這種做法的成效,我表示了擔憂。
人們很早就知道,可以從工業(yè)數(shù)據(jù)中獲得知識。但是,現(xiàn)實卻往往并不理想。一個重要的原因是:與數(shù)據(jù)分析師相比,工業(yè)人往往并不缺乏專業(yè)知識。所以,數(shù)據(jù)分析師看到的相關(guān)性,或者是假象、或者是工業(yè)人老早就了解的知識,很少增加新知識。所以,數(shù)據(jù)分析的實際作用,往往定位在比經(jīng)驗更準一點。其實,“更準一點”也不容易做到:因為工業(yè)現(xiàn)場數(shù)據(jù)的質(zhì)量往往不理想,分析結(jié)果常常存在“有偏估計”。
從數(shù)據(jù)中難以得到新知識,還有一個原因:工業(yè)過程和工業(yè)對象都是人造的。在正常的情況下,往往反映的就是人類已知的知識。容易發(fā)現(xiàn)新知識的數(shù)據(jù),往往是那些有點“異常”的數(shù)據(jù)。正常生產(chǎn)的數(shù)據(jù)雖然很多,卻不容易蘊含新知識。這有點像人的創(chuàng)新:善于創(chuàng)新的人,往往是那些想到“盒子之外”的人。
但是,異常數(shù)據(jù)也不一定產(chǎn)生知識。在多數(shù)情況下,異常數(shù)據(jù)往往是數(shù)據(jù)的采集或收集過程出了問題。對數(shù)據(jù)分析師來說,真正的“異常過程”往往是可遇不可求的、是難得的機會。因為管理好的企業(yè),應(yīng)該很少出現(xiàn)異常。而且,對數(shù)據(jù)分析師來說,“異常”很可能是對工業(yè)過程和對象的理解不到位導致的,屬于“少見多怪”。
根據(jù)筆者的經(jīng)驗,發(fā)現(xiàn)知識的一種可能性是“知識的融合”。不同的產(chǎn)品、不同的設(shè)備狀態(tài)、不同的流程背后都有人類積累的知識。但這些知識往往是碎片化的,僅僅適合特定的場景。把這些知識融合在一起,形成廣泛適用的知識,是非常值得做的事情。這樣的知識一旦形成,對創(chuàng)新和優(yōu)化的意義非常巨大,也有知識發(fā)現(xiàn)的空間。
數(shù)據(jù)分析有一個非常重大的意義,就是掌握現(xiàn)代化技術(shù)的抓手。
我國的許多*技術(shù)都是從國外引進的。長期以來,我們并沒有把引進技術(shù)消化透。我們或許會用這些技術(shù),卻不能很好地掌握這些技術(shù)。就像會開車的人不一定會修車、不一定會造車。這是個很大的麻煩,使得我們無法擺脫“引進落后,再引進再落后”的怪圈。
要擺脫這個怪圈,需要對引進技術(shù)深入理解。但如何才能深入理解呢?小平同志說:掌握新技術(shù),要善于學習更要善于創(chuàng)新。實踐證明,只有在創(chuàng)新中才能學習到位。但這里又遇到一個困境:學都沒學好,如何創(chuàng)新呢?
答案是從改進型的“微創(chuàng)新”開始。員工小改小革發(fā)揮的作用或許不大,但通過小改小革,卻能深入地了解引進技術(shù)。小改小革的次數(shù)多了,也就容易掌握引進技術(shù)了。所以,小改小革是培養(yǎng)人、培養(yǎng)能力的抓手。
怎樣小改小革?我曾經(jīng)給某公司建議抓兩件事:“不犯二次錯、做得更好點”。產(chǎn)品質(zhì)量或設(shè)備出現(xiàn)問題是難免的,要努力做到不犯第二次錯誤;每次生產(chǎn)都涉及到質(zhì)量、成本、效率等問題,希望每次都有進步或者保持。這兩件事看起來很小,但卻能把數(shù)字化相關(guān)的技術(shù)拉動起來。這個道理我在過去的文章中講過,這里就不多說了。
做這兩件事的時候,幾乎一定會遇到數(shù)據(jù)分析:為什么出問題了?如何做得更好一點?所以,數(shù)據(jù)分析往往是支持“微創(chuàng)新”的必要手段。在數(shù)據(jù)分析過程中,我們可以從微觀角度深入地理解技術(shù)的本質(zhì)。對高度自動化的企業(yè),更是如此。因為生產(chǎn)技術(shù)都寫入了計算機,都由數(shù)據(jù)表現(xiàn)出來了。當年寶鋼批技術(shù)業(yè)務(wù)專家,搞計算機的比例很大,總體上與此有關(guān)。
我們知道:在許多傳統(tǒng)制造行業(yè),美國原本是,但日本制造卻不斷超越美國。這一點,很少國家能夠做到。在我看來,日本人做到這一點的重要原因,是有著精益求精的精神。在求精的過程中,真正認識、掌握新技術(shù),從而超越了美國。我們的企業(yè)往往缺乏精益求精的精神,也就難以實現(xiàn)從跟隨到超越的轉(zhuǎn)變。
數(shù)字化時代的到來,給我們提供了新的機會。數(shù)據(jù)分析,幫助我們抓住機會。但我認為:對機器學習的作用不要過于迷信。智能化我往往是“用人明白的道理,讓機器做得更好”。我們做數(shù)據(jù)分析,往往首先是變成“人明白的道理”,然后再寫入計算機中。如果跨越了人的這一步,工廠敢讓機器去決策嗎?簡單決策可以,復雜就不行了。
作者:郭朝暉(工學博士,教授級高工。企業(yè)研發(fā)一線工作20年;優(yōu)也科技信息公司科學家;東北大學、上海交大等多所院校兼職教授。國內(nèi)智庫、走向智能研究院的發(fā)起人之一。原寶鋼研究院研究員)
版權(quán)與免責聲明:
1.凡本網(wǎng)注明"來源:歐亞貿(mào)易網(wǎng)"的所有作品,版權(quán)均屬于歐亞貿(mào)易網(wǎng),轉(zhuǎn)載請必須注明歐亞貿(mào)易網(wǎng)。違反者本網(wǎng)將追究相關(guān)法律責任。
2.企業(yè)發(fā)布的公司新聞、技術(shù)文章、資料下載等內(nèi)容,如涉及侵權(quán)、違規(guī)遭投訴的,一律由發(fā)布企業(yè)自行承擔責任,本網(wǎng)有權(quán)刪除內(nèi)容并追溯責任。
3.本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品來源,并自負版權(quán)等法律責任。
4.如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系。