朱小黃：數據重構與數字化進程

2022年11月25日17:06 作者:朱小黃

　　文/意見領袖專欄作家朱小黃

　　在電腦、互聯網、通訊技術等科技進步的過程中，人類生產和服務的發展也突飛猛進。20世紀初以來，我們大致可以觀察到幾個不同的階段：從信息化與自動化，到數據化與智能化，再到目前的到大數據與數字化，都是信息技術發展的不同階段，核心還是數據和數據運用。

　　在數字化轉型的今天，如何認識和理解數字化，是向數字經濟和數字化社會轉型的關鍵。在專業認識層面上，各種觀點和議論很多，筆者總覺得意猶未盡，希望再做一些深入的討論。

　　一、數字化的含義

　　在數字化熱潮中，我們聽到的設想大都是20世紀六七十年代發達國家已經實現的信息化與自動化。無非把固化的生產流程和生產要素的配置通過后臺電腦和軟件進行信息處理，機器自動操作。隨著互聯網技術和IT技術的提升，這種信息處理的能力越來越強大，越來越具有智能的算法，但仍然長期處于自動化的階段。

　　那么什么是數字化呢？隨著大數據技術的發展，對生產和生活環境中的邊際（實時）數據的處理能力，即算法和捕捉數據的能力也越來越強大，智能化程度（即機器模擬人腦的能力，機器運用知識和快速處理數據的能力）也大幅提高，那么社會就會逐步進?數字化階段。到了這個階段，人們對數據質量的要求（即科學性和運用的準確性、有效性的要求）也越來越高，傳統的數據觀和數據運用方式已經不能滿足數字化時代機器對人腦模擬的要求。

　　數字化階段的本質特征就是具備能夠動態、實時、智能地捕捉相關數據并及時處理生產與生活場景中的微觀變化，指揮機器進行同步調適，保持生產與生活場景良好狀態的能力。包括相應的計算機技術、網絡技術、通訊技術和一整套組織系統和運行規則。如果元宇宙是未來那數字化就是必由之路。

　　所以既不要把自動化誤以為是數字化，也不要急于構建元宇宙，數字化階段要做好這個階段的事情，失去數字化的基礎，會迷失未來的方向。

　　二、不確定性數據重構與數據治理

　　不確定性研究認為，世界的本質是不確定性的，而人類社會是?個偶然性社會。按照熱力學熵增定律，宇宙客觀世界是充滿無序動力的，由此決定了不確定性的客觀性和人類社會發展的偶然性特征。為了對抗無序和不確定性，人類發展了自己的文明，不確定性的分布狀態也是多樣化的，在變化比較緩慢，時間跨度比較長的領域（如風化和氧化），人類建立了科學知識和社會秩序等文明成果，以此減少熵增，建立相對穩定的環境和預期，以求生存發展。從這樣的認識出發，我們發現到目前為止，所有的數據如同一團亂麻，還需要按照不確定性原理進行分類，才能更合理、有效地加以運用。

　　按照不確定性原理將數據分類重構大致可以做以下分類：

　　歷史數據與邊際數據。前者主要用于分析過往和預測未來，后者主要用于大數據技術條件下，實時現象的快速準確處置與反應以及智能化支撐。

　　自然數據和行為數據。前者是客觀世界運行狀況的紀錄，后者是人類行為活動的紀錄。前者中有的數據對人的行為有影響，有的沒有影響，需要進行選擇運用。后者中有的數據對未來有影響，有的沒影響，同樣需要選擇運用。

　　可重復數據和不可重復數據，也稱之為必然性數據和偶然性數據。前者來源于人類測量計算的科學成果，如物理、化學定律和地理測繪成果，這些數據都是可驗證可重復利用的，另外也來源于人類社會秩序規范下的人類行為數據，由于秩序對人的行為的約束，大量的行為數據也是可重復，可預測，有一定必然性的數據。可重復數據往往可以預測未來可能發生類似事件的概率。后者是一次性發生的偶然事物的紀錄，是不可重復不可驗證的數據。可以運用于分析過往，但很難用于預測未來。有些在數學上稱為離散分布的數據，即離散值，就是偶然性數據，很多計算場景下需要剔除。

　　原生數據衍生數據。前者直接反映了事物的原貌特點，后者是在前者基礎上主觀分析的產物。例如各種指數，各種對客戶的評價評分，是經過抽象與人的主觀判斷的數據。在不同的運用場景中對這兩類不同的數據需要賦予不同的權重。

　　模型變量因子的樣本選擇對模型的影響

　　任何經濟預測模型或者計算函數的確定，都是在大量歷史數據和邊際數據中提取樣本分析確定變量、因?，確定模型需要的變量。在數據未能按不確定性原理進行分類之前，因為數據中混雜大量不可重復的偶然性數據，對這些數據直接進行分析極有可能發生偏差和錯誤，影響模型的科學性和計量的準確性，這樣的現狀需要做根本性的改變。所以不確定性原理下的數據重構對經濟模型的改進和完善也具有重大意義。

　　數據治理首先是數據的科學分類

　　數據治理更多地被賦予了安全性方面的意義，這是不全面的，更底層的問題還是數據的真實性、完整性、有效性問題。

　　歷史數據浩如煙海，在社會、經濟、法律、道德等方面如何有效運用，是數字化社會的重要問題。從法律上看，有數據產權制度、個人隱私信息保護等問題；從道德上看，有商業模式的選擇如何有助于科技向善、守護倫理邊界的問題；在經濟上，數據治理主要是發揮數據生產要素效率的問題。科學的分類和符合客觀屬性的數據運用是數據治理的核心問題。

　　三、邊際數據與智能化

　　實時發生并被捕捉收集的數據是智能化的基礎。大數據技術被廣泛應用以來，人類海量數據的收集能力和計算能力越來越強大，在不確定性原理中，邊際數據與歷史數據?樣，也有大量偶然性數據應該被忽略，以節省算力，這就有賴于算法上智能程度的提升。真正的智能化，即機器模擬人的思維的能力，體現在對邊際數據的收集、計算并快速作出反應，所以捕捉收集到有用的邊際數據、據以進行智能計算，發出反應，是有效智能，經濟智能的必要條件。因此，在正確分類基礎上對邊際數據的選擇、收集和計算，是智能化重要環節，也是數字化的核心技術。

　　四、數字化的人文考量

　　科技的創新進步本來就是對傳統生產與生活方式的挑戰，但正確處理科技運用與傳統人文價值觀念之間沖突卻是關系到科技運用價值的關隘問題。在數字化轉型的過程中，有兩個人文立場的考量應該有所思考。

　　一是科技運用同傳統文化的沖突。

　　科技進步與運用會帶來新的生活方式，也會摧毀?部分舊的生活方式。科技帶來效率和更多樣的選擇。例如，電子感光數碼相機的產生，使得膠片相機和顯影劑定影劑、暗房沖洗等傳統照相技術和電影、攝影等技術逐漸消失，但人文觀念傳統價值卻是人類能夠不斷繁衍生息的價值支撐。數碼相機在人文觀念上仍然是膠片相機的繼承和發展，柯達膠卷沒有了，攝影、電影、電視更豐富。所以任何新技術總是在創新與傳統之間形成平衡，使傳統人文價值得以傳承。

　　科技向善的口號是一種值得肯定的平衡科技與人文傳統的價值取向。科技創新和科技運用中關照不同群體，尤其是弱勢群體的需求，是科學家和科技企業的重要文化元素和社會責任。

　　從不確定性?度看，自由是自然無序和偶然性社會的本質屬性，而約束自己的自由放縱和遵守秩序的自律，則是人類文明不斷進步的原因，是對抗無序熵增和不確定性的唯一途徑。人類文明不斷發展只是需要在自由和秩序，自律與放縱之間找到平衡點。

　　二是科技創新要守住倫理隔離邊界。

　　科技創新倫理隔離，實際上是對人類無限好奇心的約束。從可行性上來說，隨著人類對宇宙的不斷探索、知識的不斷積累，科技創新幾乎看不到邊界，各種異想天開或新穎奇特的主意或念頭，都可能依托科技創新找到實現的路徑。“不怕做不到，就怕想不到”，從科技創新發展史來看，只要能想到，幾乎都能做到，頂多時間有長有短而已。科技創新的倫理隔離，就是對科技創新的無限擴張提出符合人類自身整體利益的應有邊界，其本質是對人類無限的好奇心的約束。

　　倫理隔離的必要性。倫理到底是什么？倫理是自然法則的某種表述。倫理不是人類的理想，而是自然的鐵律。意識當然有物質基礎，就像人的意志與肉體。但幾乎也可以肯定，上帝在意識和物質之間一定設計了某種隔離，就像動物生殖隔離?樣，不會允許它們之間互相操縱，騾子和獅虎獸是無法繁殖后代的。人的意志無法控制自己的身體，身體的成長、豐富與衰老，即生老病死，只遵循自然法則，這就是造物主的隔離。那些企圖研究其關聯并試圖加以操縱，企圖長生不老的人最終會失敗。生物學家可以通過動、植物雜交獲得動植物遺傳上的某些優勢，但動、植物雜交也不能產生新的可傳承的品種，每年都要制種。這就是說存在某種自然所設定的邊界，試圖突破邊界是沒意義的，反而增加沉沒成本。轉基因、無性繁殖等都觸及倫理，而倫理的本質，就是自然的力量所設定的各種邊界。科技創新活動亦是如此。

　　在數字化轉型這樣一場浩大的科技運用活動中，如何使技術向善，關照不同社會群體的需求，守住一些科技運用的隔離邊界，既是科技界，也是經濟界、法律界人士不可忘卻的重要觀念。

　　(本文作者介紹：原中信銀行行長)

責任編輯：宋源珺

　　新浪財經意見領袖專欄文章均為作者個人觀點，不代表新浪財經的立場和觀點。

　　歡迎關注官方微信“意見領袖”，閱讀更多精彩文章。點擊微信界面右上角的+號，選擇“添加朋友”，輸入意見領袖的微信號“kopleader”即可，也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。

保存 | 打印 | 關閉

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

朱小黃：數據重構與數字化進程

微博推薦

作者簡介：朱小黃

最新文章

熱文排行

首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

朱小黃：數據重構與數字化進程

微博推薦

作者簡介：朱小黃

最新文章

熱文排行

首页国产亚洲小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看