|
黃暉:數據挖掘應幫助中國企業塑造新的領導者(2)http://www.sina.com.cn 2008年03月22日 16:02 新浪財經
那么還有一個是專題的模型信息。這個專題的模型,比如說這是典型企業里面碰到的問題,我們經常搞一些促銷的活動,就是你的銷售收入和宣傳的投入,以及你的價格措施還有產品分析,究竟跟你有什么關聯?這里面我講述一個3到4個要素之間有什么關系,所以每動一個會影響其他的哪些,那么講述之間的量化的關系出來,這是我們比較關心的。所以,我一直鼓勵每一個經營者他要關心的幾個關鍵的因素,就是產量、價格、銷量、成本、利潤。我的銷量多少,我的價格多少,我的利潤多少,最后拿到了多少。所以,這是專題的信息模型。 然后就是預測和預警。一講到預測,我們中國很多的企業,尤其是國有企業,他就覺得預測沒有必要做。他說,我們每年都做預測,但是怎么做的呢?他的預測是,今年我的產量或者是我的收益是多少,我明年估計要增加百分比是多少,我用這個百分比乘以我的總量,加上我的結果,就是我明年的總量。這種做法是不科學的,實際上我們是要用數據挖掘的方法,來改變企業科學地預測。所謂的科學預測,就是我們要從不同的模型加上你的時間特征、周期特征、季節特征,用各種因素來歸納出一個模型。 最近,我們拿了一個建模的機會,中國的CPI的指數。中國的CPI指數每個月在發布,每個月讓總理坐立不安。后來國家總理找到我們,他一直試圖用我們這個軟件來算,那么這次我們找出了一些原因。就是他用了一些模型,比如說X11的模型,這個模型里面計算的時候沒有考慮到季節和節假日的因素,很多的因素沒有考慮進去。所以,我們現在幫他做一個X12的東西,就是中國有特色的東西全部放上去。 所以,這個例子說明了,你要考慮各種不同的因素構成的結果。所以,我估計到4月份這個軟件可以正式給國家的統計局使用,所以那個時候分析出來的結果會更準確一些。因為這個事情的影響太大,統計局長和總理都坐不住了,所以我們必須科學地統計這個問題。而不是說每個省的CPI必須降低多少,這個做法是大家已經不能接受的。 所以,要從不同的因素、不同的模型來做預測。我們用的比較多的,比如說Arima模型,是把時間的特色全部總結進去。所以,王總剛才說的證券的模型,當時國外也找我們去做預測,其實里面有很多的因素考慮在里面。我們現在用的BRF神經網絡也做很多這方面的預測,你要靠工具和方法去做,而不是人為設定一個比例去做預測。我在政府待過一段時間,他們說計劃計劃都是鬼話,因為都是比例增長。 那么最難的這是我們最難下決策的,就是出現一個情況的時候,總經理和決策者都有哪些選擇項。這是我們最關心的問題,就是我們說的“假如……那么……”。就是假如出現一種情況的話,你有哪種選擇,這種選擇可能出現的情況。那么比如說原材料漲價,你有哪些選擇,這個選擇會產生什么情況。第二個,比如說同業競爭對手的兼并你怎么辦?這個也是可以建模的,那么會出現很多的其他的因素,比如說市場的調整、價格的調整、產品業界的調整等等。那么還有一個,是說我的市場價格,競爭對手出現惡意的競爭價格你怎么辦?所以,在這種情況下,出現各種不同的情況的時候,我們應該怎么應對?我們目前做得最多的是,當你的庫存量達到某一個級別的時候,你應該怎么做?所以,真正的決策支持系統,應該是在這些方面,完全給決策者提供選擇項的系統,但是這一點做起來很難。目前,尤其是一些數據的完備性,技術已經有了,關鍵是有沒有這么多的數據。所以,我們碰到的很少,有還是沒有,但是,在很多的方面有限制。 就像我這里列的幾個境況。一個是定價,價格和你自己產品的定價還有利潤之間的關系,還有一個是你的廣告費用、客戶量、價格、產量、市場占有率,你必須要清楚,究竟是一個什么樣的關系。然后,我設計一個客戶服務的套餐,我打折打到多少是合理的,我打了多少的折,可以增加我多少的銷量,給我帶來多少的效益。財務就更不用說了,到了去年的年底有一個企業發獎金,怎么發?最后沒有辦法用模型算,他算了我這個獎金發下去之后,我最后的公司財務狀況是一個什么水平,我可以支撐多久,我可以帶來多大的效益?所以,這些東西都可以用一個量化的形式做出來。 這就是數據挖掘為決策支持可以帶來的情況。那么,數據挖掘是一個大的概念,它實際說是一個數據分析的概念,就是包括兩個部分。包括傳統的統計學,也包括挖掘。挖掘是一個新興的領域,統計學是一個傳統的學科。統計學指的是什么呢?Y和X1、X3的量化的線性的關系。但是挖掘不管這么多,他是要找出我的銷量或者是利潤與我的銷量、成本、價格的關系,你可以做一個模型,Y=X1+X2。這是一個量化的,就是一個1對1的挖掘的關系。但是,挖掘不考慮量化的成本,是把所有的變量放在一起,找出相關的程度最高的變量,給你建一個模型,算是一個結果,中間的過程是不讓你知道的。所以,有的時候我們說黑箱操作,但是這個最大的優點是什么?你不用一個一個人為地設定Y=X1+X2+X3。而現在語音挖掘又在數據挖掘的基礎上,又做了一個變革。 還有高級統計,這是用得比較多的像回歸、因子、時間序列、生存分析、聚類分析。這里面我要強調的是計量經濟學的模型是很新的,這是其他的沒有的。但是,最重要的還是數據挖掘這一塊。這里面包括了我剛才講的,實際上還有一些新的,剛出來的一些。像貝葉斯網絡我們已經做進去了,還有神經網絡等等我們已經做了,但是現在還有很多的模型是其他人沒有的。很多人問你們做什么圖形?我們做的圖形都是人家所沒有的,所以這個要區分一下。 那么剛才我已經講到了,數據挖掘是一個大的概念,它現在有很多新的發展,比如說語音挖掘等等都在出現很多新的東西。上午我提到了現實挖掘,現在美國正在變成現實,就是基于語音挖掘。就是挖掘手機,他要找出人的生活規律和生活方式,手機第一個暴露的是你在什么地方,還有你聯系的人,你每天的活動、社交圈子全部在里面。所以,美國已經開始設置生活模型,就是叫做生活挖掘。像聚類、分類、預測、預警等等都在這里面。 那么曾經出現了一個反對,就是在不同的區域用筆記本電腦上網,然后把這個帳號破壞了以后,就把錢盜走了。你要挖掘這種高端的技術,你是難找。還有一個是一個人從云南到了上海,然后打了電話,你怎么追蹤這個人。這個挖需要把所有的關聯的東西一步步找出來,然后進行跟蹤。還有計算機受到了攻擊,也是有我們這個過濾點分析。當一臺計算機或者是很多的計算機同時發生流量的時候,我就發現這臺計算機不對了。這說明了這臺計算機要么出現了攻擊,要么就是有很熱門的東西受到了大家的關注。所以,我覺得挖掘不再是學術領域的東西,可以活生生的用到很多的領域里面。 這個是我們真正國產的馬克威分析,這是被很多的500強企業都在用的。以后有機會我們再詳細介紹,這里我是以一種學者的身份在講話,我不是在介紹我們公司,我是在講某一個主題,大會和小會都是這樣的,所以我避免做推銷的嫌疑。 軟件方面基本上已經比較成熟了,但是我有一個理念,數據挖掘應該幫助中國的企業,塑造一種新的領導者,這種領導者要能夠及時地、宏觀地把握企業的能力,同時能夠科學、準確地去做決策,應對各種情況。這就是我的夢想,就是數據挖掘怎么能實現這個目標?我想,有機會我們可以一起討論這個事情。那么還有一個理念,我希望中國的企業真正變得靈活、智能化。所謂的智能化,你要及時地反映,比如說5臺電梯都同時動的時候,你要智能地掌握,哪臺電梯為你服務。當市場發生變化的時候,你怎么去掌握?這就是我們需要達到的目標。現在的企業家應該是什么樣的企業家?應該是非常聰明的決策者,他應該是站在業務的高度上去決策。 我在外國一個公司,我是部門的經理,他是我的領導。他說作為領導,你的任務是什么?就是你是做決策的。我每天的工作是什么呢?就是做決策。所以,領導真正的職責就是做決策。大的決策、小的決策、各種各樣的決策。你不應該關注很具體的事情。所以,我的夢想就是數據挖掘讓領導決策得準、決策得快、決策得有一定的科學性。這就是我的夢想,我是希望中國的企業能夠實現這種智能。謝謝!
【 新浪財經吧 】
不支持Flash
|