2013年10月17日,中國服裝大會第三場平行會議在北京國際飯店召開,會議主題為“大數據在服裝產業中的應用”。北京賽智時代信息技術咨詢有限公司總經理趙剛博士參與會議并發表觀點。趙剛重點解析了服裝行業大數據的應用:如何從理念到實踐?
以下為演講實錄:
【趙剛】:謝謝鄭教授,尊敬的各位服裝行業各位朋友,今天跟大家交流一個話題,是關于在大數據時代,我們服裝行業在接觸到這樣一個大數據的理念的時候,如何去用大數據技術和應用去支撐我們自身業務的發展。這樣一個話題,我是來自北北京賽智時代信息技術咨詢有限公司,做信息咨詢這樣一個行業的理念。大家都知道服裝行業在整個的電子商業領域里頭,占比較大的比例,那么經過這么多年的發展,在企業信息化,服裝電子商務基礎上。在現代這樣一個時代下一步,在服裝行業如何分析和利用這些數據。給我們提出了一些問題。那么今天我希望通過我這樣一個介紹,來跟大家共同交流,作為一個服裝企業,如何來開展大數據的應用。
主要從三個方面闡述,第一個方面首先大家對大數據要有一個基本的概念的了解。什么是大數據?
第二個方面大數據對我們服裝企業自身的業務管理來說,究竟有什么用。第三個方面那么作為我們這樣服裝企業,面對大數據洶涌而來的這樣一個浪潮我們該怎么做,具體有什么樣的方法,讓大數據推動我們業務的發展,從這三個角度去跟大家進行交流。
那么大數據顧名思義一定和大有關系,和數據量的大小有關系。這里頭我們簡單做一個概念上一個普及,因為后面會用到關于大數據量這樣一個說法。那么計算機中,對于數據存儲基本一個單位。那么大家都知道,前面幾個大家都知道,最基本的是自己bite。那么一個字母就是一個字節,那么一個漢字大概兩個字節,那么我們整個的名字是幾個字節,再往上的十次方的存儲量是k。大家寫一篇簡單的故事。或者是簡單的文章,簡單的Word文檔,大概幾K,那么再二十次方一兆,我們看到一個CD光盤大概是600兆這樣的概念。那么再往上走,二的十次方這是一個G。
大家可以看到我們現在拿到的U盤,通常是多少多少G,這么這個存儲的量相當于我們幾部電影這樣一個存儲量,再往上現在也知道,我們去買移動硬盤,買幾個G的硬盤。應該說對我們大多數應用來說,這幾個數量應該是到了比較大的一個數量。但是對于我們從事更多的互聯網行業這些企業來說。那么他們有更大一個數據量化面臨一個更大數據量一個要求。
那么是P,一個P就相當于這個全美學校圖書館藏書一個內容,再往上一個次方叫1I,那么現在我們類似百度[微博]、像谷歌[微博],處理的數據20TB。這個再往P上,一個P再往上走,就是我們Z。一個Z,那么這個數據量是目前全球進入的數據量一個存儲的時代,那么我們大概在2010年,進入了ZB的時代,全世界的數據量一個總量,那么再往上沒有進入一個時代,這樣一個時代。當然后面還會有,隨著這個數據量的增長,這是大家對數據量一個大小有一個宗旨概念。
那么我們剛才提到了,事實上2010年,全球就進入了DB級的大時代,那么在09年的時候是0.8ZB,12年就達到了1.2ZB的數據,隨著互聯網的發展,數據還在增長,大約每兩年還在翻一翻,從每兩年翻一翻,相當于之前歷史上采用一個數據。我們在2020年預計全球擁有的數據量是35ZB,這是統計一個數據。那么這么大一個數據量,所帶來我們一個信息,所反饋出來的真實。對于我們來說有非常大一個潛在的價值。所以有一篇文章提到了,大數據正在像我們的水,像我們的礦石、像我們的石油一樣,正在成為新的自然資源,能不能夠挖掘資源中潛在的價值,成為這個時代能不能走向創富一個非常重要一個方面。大家關注這么多的數據從哪來,實際上他是和我們近幾年來,近十年來信息技術的發展息息相關,特別是在我們的互聯網、移動互聯網,社交網絡和物聯網的發展,所帶來數據量一個爆發式的增長。整個我們現在大家也知道,我們整個全球的活躍的網站有幾億這樣一個活躍的網站,我們全球的網民達到22億,中國的網民接近7個億,在這個過程中,這些大量的互聯網的應用,采用一個大量的數據。伴隨著移動互聯網發展,我們每個人都通過手機,通過各種移動終端上網,每個人都成為數據的生產者。
那么在社交網絡的過程中,大家都通過人與人之間相互的交互,相互的轉發,又產生了大量的數據。更大的數據從物體?(英文)連接到這個網絡中來誕生。我們現在看到很多視頻的監控頭,我們的傳感器,未來會將各種物體信息聯絡到這個當中。這些數據通過這幾種力量,共同的注入,我們的數據量會越來越大。
這里頭也給大家幾個印象,就是通過數據來看一下,一秒鐘,亞馬遜[微博]上每秒鐘產生72.9筆商品訂單。全球每秒鐘發出290萬個電子郵件,新浪微博每秒要接100萬以上的響應請求。每分鐘會有20個小時的視頻上傳到Youtube,每天被每個家庭消費的平均數據有375M,google每天要處理24pb的數據,百度每天要響應60億,幾十平米的數據。而且在座每一位在這個過程中,也在通過自己的微博,通過自己的短信,在產生著信息,那么這些數據都是什么類型的數據?我們把數據簡單從他這個結構化這個程度來看,分為結構化數據和非結構化數據。在數據庫表中用行和列所表示這個數據?梢杂媒Y構性的查詢語言查詢這類數據,我們叫結構性數據,在我們的整個這個財務系統中所存儲的數據中,是結構化數據。占到我們整個類型中的10%,大部分數據是那種復雜的非結構化數據,一段文字一個圖片,一段視頻,一個點擊一個日志,一段語音等等。更多的是這種文檔、Web網頁、電話呼叫,移動設備,社交網絡復雜性的非結構性的數據。這些分析技術難以很好的去注入這樣一些數據。
那么從這些數據的產生來看,那么最初就是我們這個數據,都是通過我們業務系統,交易系統產生的這些數據。那么更進一步在web2.0時代上人與人互動產生更多的數據,像微博、微信,通過我們frd,傳感器,我們物與物之間交流產生更大范圍的數據,那么這個數據量越來越大。當然他的價值密度會越來越低,但是從這個價值力度低中挖掘的價值越來越大。系統交易中的數據,通過人與人的交互,物與人的交互,物與物的交互。交互數據也會不斷的產生出來。所以在操作過程當中,就要去把握,我們在交易過程中一些數據。同時要很好的去分析和理解,我們在交互中的色彩和數據。
所以通過這樣一個,我們前面對于數據一個大小,數據的類型,數據的一個產生的源頭,這樣一些分析。我們對大數據有一個初步的印象。那么大數據目前來說,沒有一個特別統一的定義,但是大家有一個基本的共識,大數據是在一定時間內,用傳統的數據庫工具無法對它內容進行抓取、管理、處理這樣一個大數據結合,有四個特征:從這四個特征對這個概念作出定義?
第一數據量巨大,第二數據類型很復雜,第三數據密度比較低,但是數據潛在價值比較大。那么第四個是這些數據需要我們快速的對他進行處理和分析。大家都知道在谷歌百度上搜索一個東西,如果這個內容超過一分鐘,超過兩分鐘,沒有人會再去等待。對數據快速的響應,大家有一個非常高的要求;旧显趲酌胫畠,作出響應。所以對數據的處理,利用的效率的要求。對速度的要求是非常高的。這是說,我們現在對大數據一個基本的定義,有這四個概念,數據量巨大、數據類型復雜、數據價值密度低潛在價值大、數據快速響應,這樣的數據我們叫大數據,這是對什么是大數據有一個基本的定義。
那么第二個部分大數據,對于我們有什么用?特別是對我們企業,和我們業務有什么關系?對我們究竟有什么樣的價值?這是調查的第二個問題,也是我今天介紹的一個重點內容。應該說大數據現在在全球都非常的重視他的一個發展。那么從這個美國的政府,到聯合國[微博],到世界經濟論壇都在談大數據,每年都有很多的大數據方面的相關累計報道出來。那么這是去年十二月,世界經濟論壇發布一個關于大數據大影響這樣一個報告,描述了大數據為國際上經濟社會發展帶來新的機會。建議各國工業界,學術界機構管理者,利用大數據創造的機會,那么對于談到了大數據對個人,對于我們政府事業單位、對我們私人企業都有什么樣一個作用、價值?
那么最終通過數據的采集數據的分析,對經濟的發展有什么樣的價值。從宏觀的角度闡述了這樣一個價值。它提到了四點,就是第一通過大數據的分析,更快的對變革進行跟蹤,響應全球經濟快速的變化。