http://www.sharifulalam.com 2019-07-25 17:22 來源:中國自動化學會 李培根
7月19日下午,中國工程院李培根院士應邀參加江蘇大數據產業發展高端論壇,并以“數據理念”為主題現場發表了演講。
李培根院士圍繞自動化、數據的理念、理念的數據三個維度對企業如何通過大數據去克服數據的不確定性,正確利用數據價值、實現制造企業數字化轉型作了深入的闡述。以下是演講實錄。
尊敬的各位領導:
非常榮幸有機會能夠參加論壇,我本人到江蘇來過很多次,江蘇的產業發展給我留下了深刻的印象。不光是南京,蘇錫常還有包括其他的城市,經濟活躍、產業發展都給我留下了很深的印象。
我今天的話題是結合會議主題說說我的看法,我現在要說明的一點是什么呢?我其實不懂數據科學,數據科學并不是我的專業,但很多年來我都很關心數據科學的發展。像以前制造業信息化,數字化制造。今天我們講智能制造,這是我所關心的,我說說我的看法,不對的地方大家批評。
其實幾年前奧巴馬和美國國會提交的一份報告里談到:科技不只是在取代組裝流水線上的工作,而是在影響任何可以被自動化的工作。即傳統的自動化替代的是人的體力,但未來不一樣,簡單地講是指人的腦力。
最近大眾的CEO說:不遠的將來汽車將成為一個軟件產品,大眾也會成為一家軟件驅動的公司。我們很多人聽到后都會感到不解,汽車是一個硬梆梆的產品,怎么會是一個軟件產品呢?我認為這句話有兩層意思,一是指汽車未來所應用的軟件產品會越來越多,尤其是自動駕駛,無人駕駛汽車。
二是指影響未來汽車競爭力的主要因素是軟件,而不是硬件。我們現在有個話題是“軟件定義世界,數據驅動未來”,二者是緊緊聯系在一起的。有人講未來世界,我就說數據世界或者軟件,與其相關的大量問題都是處理數據。正如剛才說的汽車是一個軟件產品,由于有軟件產品很多都是和數據緊密聯系在一起的,汽車就會和智慧城市里的很多數據關聯在一起。
下面我將會說三個話題,首先我們從自動化說起,之后會介紹理念的數據,最后會說明數據的理念。
自動化
傳統自動化是替代人的體力的,我們現在比較完善的自動化可以處理一些結構化的、固定模式的、確定性的問題。目前少數非結構化的問題無法通過自動化處理。未來的自動化不僅包括目前已經完善的自動化,還會像奧巴馬所說的替代一切的自動化。
人的腦力包含很多東西,實際上它是非結構化的,沒有固定模式,是一個不確定性的問題。這些問題的處理我們以前沒有什么好的手段。實際上,這些問題需要認知自動化來處理。智能自動是另外一種自動化替代人的腦力的技術。所以替代腦力這個數字智能時代的自動化替代腦力,我們講它超越固定的模式,有些問題沒有固定的模式,例如,一個車間里節能的問題并不是一臺設備上節能的問題,它沒有一個固定的模式,你沒有辦法用一個模型去表達,車間節能的設備沒法建立一個模型,此時我們可能就需要用超越模型來處理。
當然,有時候我們可以通過數據去發現模型,參數化模型等。我們需要超越確定性的問題,從而有辦法處理不確定性的問題。
工業中最重要的是制造,不管是設計效率、質量、成本、綠色等,所有這些問題實際上都存在著大量不確定性,如果我們想清晰地認識,乃至駕馭企業活動那么認識這個企業的整體聯系就會非常重要。
另外,非固定模式不確定性的問題是以前對我們來講比較困擾的問題,系統到底有多少是相關聯的?例如,我們人就是一個很復雜的系統,到底人有多少因素相互關聯,怎么關聯?因此,大數據、人工智能等的出現就像開啟了一扇大門,有可能促使我們去認識整體聯系、非結構化的問題、不確定性的問題等等。
我們可以想想中國的傳統文化。中國古代的金木水火土,的確不能說它是科學的。但我們古人的這種認識還是有一定的合理性的,它強調了整體的聯系。西醫常常是“頭疼醫頭,腳疼醫腳”,但中醫是聯系整體來看的,即頭疼是由于腳上的某個穴位引起的,只是我們現在無法從解剖學的角度去認識它。我曾經腰痛到臥床的地步,后來通過針灸就好了。
所以對于一個復雜系統來講,其整體的聯系是非常重要的。我們強調中國文化里大系統觀整體聯系,它是有合理解釋的,只是以前的現代科學缺乏技術去認識它。我們古人是通過經驗、感悟去互聯的。但現在我們不能通過經驗感悟去處理很多問題,只能通過數據科學、人工智能技術等去認識這些整體聯系,不確定性的問題等等。
要認識整體聯系或控制一些非固定模式,不確定性問題的基礎是數據,但有數據就要互聯。我們需要人工智能技術去決策控制一些非模式、不確定性的問題,而且人工智能技術也是以數據為基礎。
因此有了第三次數字化浪潮,早期的數據驅動過程,比如我們在企業里的數控機床加工過程就是數據驅動的。在數據驅動相關的一些問題中,現在我們強調數據驅動企業,我們講數據化、智能制造,數據驅動,這是我覺得我們從事數據科學的人需要要關注的。當然未來將會涉及到更多的關鍵技術,包括人工智能、5G、區塊鏈等等。
理念的數據
所謂理念的數據,就是圍繞企業的理念去收集處理數據。例如,像海爾這樣的現代企業的基本理念就是“以客戶為中心”,因此,海爾建立了一個工業互聯網平臺,收集了大量的客戶數據,從而能夠在產品開發階段通過客戶數據把用戶的碎片化需求進行整合,與用戶交互,實現“以客戶為中心”的目標。顯然,圍繞企業“以客戶為中心”的理念整合數據是非常重要。
所以海爾的研發模式與傳統的瀑布式模式不同。瀑布式模式是通過市場調查進行需求分析,之后研發產品;即是先有產品再有客戶。而海爾的研發模式是在產品開發的過程中通過網絡,即互聯網平臺與用戶迭代、交互,根據客戶的需求生產產品;既是先有用戶再有產品。因此,理念的數據引起了研發模式的顛覆。
再如,“綠色”也是現代企業的一個重要的理念。“綠色”不光是指沒有污染,也指資源消耗少。雖然美國的用電很便宜,但DeepMind谷歌數據中心的耗電量很大。后來通過改進DeepMind把耗電降低了15%,且實現了設備投資的收回。事實上,他們通過數據中心幾千個傳感器去收集溫度、電量、耗電量等設備及建筑物的結構(不同數據中心建筑物的結構都不一樣)數據,之后對數據進行深度學習等處理實現節能效果。顯然,該例中數據收集的標準即為節能的理念、綠色的理念。因此,類似這類問題是完全沒有固定模式的,我們不可能通過建立模型來解決。
這樣的技術也可以被用在其他方面。如減少半導體生產,半導體耗水很厲害;幫助企業提高生產效率等。同樣我們國內也有應用很好的例子,例如酒鋼鋼鐵企業為了節能減排,在高樓上面安裝了很多傳感器,效果非常好,平均提高勞動生產力5%,降低純鐵成本15元,預期在全行業推廣后,直接經濟效益70億元/年。
數據的理念
接下來介紹數據的理念,首先數據里面實際上隱含著另外一種存在,以尿布和啤酒為例,雖然超市專家以前沒有意識到,但尿布和啤酒銷售存在關聯。我們很多觀點消失在人們的眼睛中,人們看不到,也淹沒在人們的模糊感覺中。
我們有時候可以在相似中發現一些顯著的差異,例如Lexus通過Twitter大數據分析,從倫敦奧運會冠軍中篩選廣告代言人。無論邀請姚明還是劉翔都具有相似性,他們都是體育明星,但他們還是有差異的,就需要通過數據去分析了解。另外,我們可以在巨大的差異之間發現相似的規律,例如,AlphaGo在所有的圍棋對局中,每一個人哪怕是同一個選手,每次對局都很不一樣,所以就要從很多的差異中尋找相似的規律,得到新的認識。
對于企業來說,以財務信息和業務信息的融合為例。實際上,很多企業的財務信息和業務信息并沒有很好地融合,就車間里一些具體設計業務的工藝來說,生產上方方面面的信息并沒有真正地被財務信息所利用,但實際上這個業務流程是和財務信息相關的。我們沒有精細的數據收集,所以傳統的信息和業務信息相互獨立。因此如何從大量的信息中進行挖掘,進行成本控制是非常有意義的工作。
其次,隱處的另外一種存在淹沒在人的自以為是中,AlphaGo這是臭棋,實際上AlphaGo對圍棋有新的認識,這是人類沒有認識到的。有的緊閉地存在深處,有超越人的智慧,特別的思維過程。所以我認為數據其實是“非人類思維”的種子。像AlphaGo有非人類的思維,人類以前沒意識到一樣,數據是“非人類思維”的種子,我們如何從數據到信息,到智能,再到非人類思維。這對我們認識自動化是非常重要的。
我們要超越人的感知,例如,我幾個月前去臺灣一個很普通的大學參觀,其中的一個教授說:控制磨床進刀,老師傅通過聽模具的聲音可以判別出其質量如何,或者應該如何去控制。然而,他們通過測量噪聲,噪聲要測量很容易,測量電流的變化,把數據收集起來和質量等進行深度學習。結果顯示數據分析之后的磨床進刀控制要比人的感知好得多。
剛才所說的AlphaGo實際上就是非人類思維。最可怕的不是人類,是非人類思維。在很多情況下,計算機系統,人工智能系統可能比我們的看法或感知更加細致入微。
以我的一個計算機繪畫作品為例,它實際上是根據我們拍的樹林的照片畫出的作品。我們人作畫的時候,有的地方透著光,有的地方有陰影;但計算機繪畫實際上是計算機對照片的分析,它更加的細致入微,用一種夸張的手法表現了出來。這說明了計算機或者人工智能系統比人的感知更加細致入微。
另外,關于數據的理念,我們需要重視數據收集常常需要跨系統、跨領域、跨媒體的,某一個問題的表征并不一定集中在某一個特定的系統數據之中。例如美國大選時特朗普當選很意外,美國主流媒體認為特朗普不可能當選。如果跨媒體收集數據,絕對不會得出特朗普敗選的結論。因為人們只關注了主流媒體,沒有看民間媒體,所以才會感到意外。再如我們要判斷經濟趨勢,判斷選民的意向,光看報紙是不行的,還需要我們去跨系統,跨媒體了解相關信息。
我們車間的質量問題不一定只和設備、工具、工人有關系,還會涉及到供應商、環境、氣候,甚至是某一特定的時期,社會上的特定活動等。就以正在舉行的世界杯為例,車間的質量說不定與這些比賽有關。跨媒體也是一個很重要的方面,收集不同媒體的數據,例如facebook,微信,中央電視臺等。這些媒體都傳遞了很多數據,而且這些數據可以從一定的程度上反映經濟問題,經濟趨勢等。
之后,我們介紹數據的工作理念,在企業中,我們常說業務數據化、數據業務化。所謂業務數據化,即企業里每一項工作,每一個活動,每一項業務都要數據化。我們企業遠遠沒有達到業務數據化。所謂叫數據業務化,即指數據工作是由專門的業務部門來處理。目前政府部門已有專門的部門來處理數據,如大數據局。但是在企業中,我們所有計算機中心或信息中心和數據中心是不同的。專門處理企業數據收集的范圍,數據傳送的標準等和數據相關的部門才是數據中心。
還有大家熟悉的數字雙胞胎的理念,在企業里現在非常強的。在企業中,數據驅動強調的是無數的流動。企業數據驅動包括在流水線上的。例如,德國巴斯夫企業生產的洗發水、液體肥皂是可以根據香味和顏色等喜好定制的,而且定制過程是根據記錄了數據的芯片實現的,體現了數據驅動。而雙胞胎強調的是數據從一個程序無縫流到另一個程序的過程。
最后,需要注意的是,不要指望一切都在預測和控制之中。近幾年有專家說:大數據、人工智能計劃經濟成為可能,馬云也有這樣的觀點,認為什么都可以掌握,但我覺得這是不可能的。人是有自由意志的,你發布了什么計劃,你一定要我種花生,那我想種別的東西,假如說我是一個農民的話,除非你規定任何你只能夠生產什么、工作什么,這個是不可能的事情。如果說你有一些預測,而我因為你的預測馬上做出改變。顯然,經過改變,原來的東西實際上已經發生了變化。因此,很多個體行為是無法預測的,但對一個群體來說,預測又是可能的,因為群體之內的自由意志可能相互平衡抵消。但我們認為一切都在掌控之中、控制之中是不大可能的。
另外不能迷信數字與智能技術,數字與智能技術依然存在漏洞。更復雜的社會,也意味著更復雜的糾錯機制、更高昂的糾錯成本。正如墨菲定律所說,“如果事情有變壞的可能,不管這種可能性有多小,它總會發生。”我相信這句話還是有一定道理的。
總之,數據驅動不是一切,大數據、人工智能開啟了認識整體聯系,認識不確定性,認識非固定模式等問題的大門。我們應該圍繞企業的理念和目標去收集、處理數據。嘗試去深刻地理解數據的一些基本理念等。
謝謝大家。