首页 国产 亚洲 小说图片,337p人体粉嫩胞高清视频,久久精品国产72国产精,国产乱理伦片在线观看

朱小黃:不確定性與數據重構

2022年07月18日18:03    作者:朱小黃  

  文/意見領袖專欄作家 朱小黃

  在異度均衡理論的研究中,需要深入討論不確定性在人類文明秩序尤其是在經濟生活中所具有的意義。隨著這一研究的深入,引起了筆者對數據、經濟計量模型的邏輯與運用的思考,并得出了在不確定性認知框架下,現有數據必須重構的結果,本文試圖加以闡述。

  ?、深刻認識世界的不確定性本質

  到目前為止,我們對不確定性的認識還有待深入,因為人類整體上還是生活在偶然性之中的。經濟研究、風險研究等多方面的研究,主要應是尋找各種偶然性的成因條件或可能的后果。不確定性是風險管理的理論來源,現代風險管理主要是對不確定性,即賴特所說的可計量的不確定性進行管理,但如果提升到不確定性的層?上來看的話,不可計量的不確定性在廣義上是否也是風險管理的應該考慮的問題。

  看不見的手作為現代經濟學的起點,它的哲學背景其實是基于不確定性的,是通過市場價格讓市場自發地形成均衡狀態,而不是通過自以為是的行政手段。其實計劃經濟的弊端根本上就在于它是以確定性為前提而設計的經濟運行規則。

  世界的本質為什么是不確定性的呢?我們知道這個世界的本源是無序的,熱力學第?定律,就是熵增定律,說明所有的事情都是在熵增,熵增就是?個無序的結果。無序的物理世界決定了世界的不確定性本質。所謂人類文明,就是人類通過自律,建立秩序、建立規則、產生知識。通過規則的建立和遵循來減少熵增,本質上就是人類在對抗不確定性方面的努力。

  除了物理學上的依據之外,人性的差異也是?個重要的不確定性的來源。世界上沒有兩個相同的人,就像沒有兩片相同的樹葉?樣。人性的差異導致了人類行為的高度不確定性。人性的自負是人性差異的深層根源,而自負是基因所決定的。

  人類對宇宙自然的認知總的來看未知遠遠大于已知。由于宇宙與自然的無窮,人類的認知能力永遠只是浩瀚之一角,對人類而言,已知的越多,則未知的越大。這就在客觀上決定了人類?臨著未知所挾帶的不確定性。人類認知的能力永遠是有限的,人類文明的規則邊界也永遠是有限的,因此人的行為的不確定性永遠存在。

  傳統知識的傳承和運用的偏差帶來的不確定性也是驚人的。知識的傳承是有偏差的,離世界的本源永遠會存在或大或小的偏差度。《人類進化史》的作者也講到,人類變成現在的這個樣子,找不到必然的道理和根據,都是偶然性的產物。這種偏差可以體現在概率論的計算公式中。任何事情發生的概率,其實質就是與常識判斷的偏差。在現代工業文明社會,由于知識與技術運用越來越廣泛,認知偏差愈來愈多,事物發生偏差的概率也越來越大。

  在不確定性的框架下,我們應該清醒地意識到:人類其實生活在偶然性之中。必然性的自由王國是可望不可及的。正如某位經濟學家所言:身處偶然性之中的人類卻在夢想過著必然的生活。這是?個方向性的認知偏差。

  不確定性的分布方式和形態是多樣化的,其中許多事物的變化具有較長的時間跨度,具有相對的穩定性,這就為人類生存和文明發展提供了窗口,產生了各種自然科學并積累成知識。而另?些事物尤其是人的行為,則是偶然性的,如果失去秩序的約束,走向無序才是本質。

  ?、不確定性框架下的數據分類和重構

  人類的行為產生數據,人們的決策依賴于數據,數據的重要性不言而喻。在實際經濟生活中,運用數據觀察現狀、預測未來,是宏觀經濟、微觀經濟和各種交易活動中的常態。各種數據分析、數據樣本的確定,經濟模型中的變量和常量的選擇和計算,都基于數據。

  近年來數字經濟蓬勃發展,數據應用的廣度和深度在不斷拓展,導致數據及其應用模型的風險已成為影響世界的重要風險現象。因此,數據的使用理應慎之又慎,且應建立在堅實的理論認知基礎上。但是當前數據使用過程中,尤其在計量模型的運用上,拿來主義頗多,缺乏對數據根源和性質歸屬的底層思考,在實際經濟計量中,造成了兩類問題,?種是歷史數據和邊際數據混雜在?起,將許多偶然性的、不可重復(即對未來并無表達意義)的數據用來建立模型預測未來;另?種是將許多自然界產生的可重復數據應用到預測人類行為上,作為經濟預測模型、金融風險模型和智能模型的樣本,產生風馬牛不相及的問題。這兩類問題愈演愈烈,導致了大量的模型失真或算力浪費現象的產生。由于世界的本質是不確定性的,在不確定性的框架下,萬事萬物具有偶然性的特征,也有相對確定性的特征,在自然科學領域,由于相對穩定的自然環境,產生了自然科學的諸多文明和算法,所以自然科學產生的數據基本上是可重復的、可驗證的。這類數據對未來具有指導性,而人文領域中的許多現象,都與人的行為有關,具有偶然性的特征,除了人類文明規則指導下的行為,其他的行為都很難重復和驗證。基于這樣的不確定性判斷,我們將人類全部可以采集到的數據劃分為歷史數據和邊際數據(即終端數據、實時數據),這兩類數據都混雜著可重復的數據和不可重復的數據,即必然性數據和偶然性數據。前者對觀測未來無效,后者對觀察現狀有用。厘清從客觀世界到數據采集的過程,并在此基礎上按照不確定性的原理對數據進行重構是當務之急。

  物質領域?的規則相對穩定、時間較長,例如巖石風化、火山爆發,這就給像牛頓定律這樣的規律留下了時間窗口,在這個時間窗口中,實驗是可重復的,數據就是可重復的。而在人文科學領域則不然,很多行為是無法重復的,既然是不能重復的,那么憑什么拿這些不可重復的數據來建立模型預測未來?因此,現有的數據要重新定義、分類,只把那些在不確定性前提下具有重復空間的數據拿來使用,才能指導未來。

  經濟社會每個時期會有當時的文明秩序,而這個秩序在短期之內不會改變,在這種時期內的數據是可以重復,可以觀測未來的。這種相對確定下的數據我們可以視為必然性數據,是可以重復驗證的。但是,很多不可重復、不可實驗的數據拿來建模、提煉因子、計算未來,是不合理的,這是目前風險管理、經濟測算等領域邁不過瓶頸的?個重要原因。其本質在于數據沒有按照不確定性的原理做好分類和重構。

  風險計量和測算是未來發生收益和損耗的可能性或者概率,而不是預測未來會發生什么具體的事件,其必須建立在可重復性數據基礎上。如需研究未來會發生什么具體的事件,按照不確定性原理,主要是研究因果關系,只能以實時數據為主要資源。所以需要重新審視各類數據的來源。

  數據到底怎么分類?筆者認為,數據大概有三種形態,即時間維度上的歷史數據和邊際數據(或實時數據)、不確定性的形態決定的可重復數據和不可重復數據、從人文科學規則的穩定性不同而形成的必然性數據和偶然性數據。

  大體上物質關系有相對的確定性。人的行為就比較復雜,有?些可重復,有?些不可重復,有秩序的是可重復的,例如交通規則就是相對穩定的。如果把數據這么?分,有?些問題就需要重新考慮了,例如風險計量通常是通過歷史數據來確定、違約概率、損失概率,然后建立模型計算未來的風險成本,這是假設歷史數據都是可重復的,但是事實上歷史數據并不是全部可重復的,那這樣的計算可行嗎?可信嗎?

  為此,筆者提出了獨特的數據重構思路,?是從時間維度出發,將數據分為歷史數據和終端數據(或邊際數據),?是從產生數據的源頭出發,將數據分為自然數據和行為數據,三是從不確定性出發,將數據分為必然性數據(可重復)和偶然性數據(不可重復)。

  三、經濟周期與規律再認識

  從不確定性原理出發,把數據按照上文做出重構后,經濟周期的存在性就需要重新考量。我們目前劃分經濟周期,通常是采用歷史數據,觀察期波峰波谷,以兩次波谷或兩次波峰之間作為?個經濟周期,但是正如上文所言,歷史數據中并?全部是可重復的數據,歷史長河中,社會和經濟的秩序也?直在發生著變化,在不同的秩序之下產生的數據,按照我們上文中的定義來看,是不可重復的。因此,數據不可使用或不可直接使用,那么基于歷史不可重復數據得出的結論就是不可行的。

  但是,在經濟周期問題背后,經濟規律的研究是另外?個問題。經濟周期的形成是必然性還是偶然性?如果是偶然的,那么就不存在經濟規律,如果是必然的,那就是有?個經濟規律在其背后發生作用,那其規律?該如何發現?這就需要我們對數據做出劃分之后,選取其中可重復的部分,對可重復的數據進行研究,才能發現其規律。

  所以到目前為止,筆者很難確定有所謂經濟周期的存在,但可以確定的是可以從事物的因果關系來預判即將發生的變化。

  四、智能化與邊際數據

  數據重構的?個重要應用場景是智能化。通常智能化需要機器學習的支持,而機器學習需要大量歷史數據的訓練,然后應用到邊際數據上做出智能化的建議、應對、動作等。我們看到工廠操作的智能化就相對容易,因為在工廠這樣?個相對獨立的環境中,動作重復、秩序穩定,因此其數據都是可重復的,機器的訓練基于這些可重復的數據效率就很?。但是在社會和經濟的范圍內,其?臨的環境復雜多變,機器學習所需的訓練雖然可能看似龐大,但其中可重復部分可能極少,不可重復的部分可能還會對學習過程產生很多干擾,這就導致機器很難找出其中的規律。

  另外在使用邊際數據時,也要對其能否重復進行區分。尤其是現在每天產生數據規模巨大,這些都屬于邊際數據。雖然在大數據技術突飛猛進的環境下,算力也在快速的進步,但如果可以甄選出其中可重復的數據后,再利用大數據的技術對其進行處理,那就可以節約大量的算力并迅速得出更有針對性的動作。

  所以智能化的數據結構也需要升級優化。

  五、經濟模型與量化投資

  另外?個數據重構的應用場景是經濟模型與量化投資。在量化投資的實際操作中,經常會發現同樣的策略,使用不同的樣本訓練出的結果可能大相徑庭,而且同樣的策略在不同的時期做出的回測結果可能也存在很大的差異,甚?在各階段回測時都表現很好的策略在實際操作中也可能表現不盡如人意,同樣,在計量模型、銀行違約模型等類似領域都存在這樣的問題。造成這些問題的根本原因就在于?融市場也存在秩序的變化,其歷史數據中也存在不可重復的部分。

  在數據科學中,有?個數據“有效性”的概念,其實與上文所提類似,但是有效性這?說法只是?個模糊而籠統的概念,有效?詞也沒有反應出其有效本質在于可重復。用不可重復數據做出的模型、做出的預測,其在未來應用中的實際使用效果令人堪憂,因此,如何對數據重構,如何剔除龐雜的歷史數據中不可重復的部分,就是?個非常重要的投資模型升級問題。

  (本文作者介紹:原中信銀行行長)

責任編輯:余坤航

  新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。

  歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。

意見領袖官方微信
分享到:
保存  |  打印  |  關閉
北京:研究適時將限制進入五環車輛范圍擴大到國三汽油車 張小泉總經理:中國人切菜方法不對 米其林廚師不這樣切 理想L9試駕車疑似空懸斷裂,廠家稱緩沖環為“試制件”受質疑 燒光170億后,“中國特斯拉”走向破產 德國總理:在決定歐盟外交和安全政策時 歐盟成員國不應保留一票否決權 熱搜!張小泉總經理稱中國人切菜方法不對 米其林廚師不這樣切 該公司客服曾稱菜刀不能拍蒜 俄戰機飛過立陶宛上空,準備對立全面開戰? 女子違停后被交警老公貼罰單:他是個正直的人,想讓我長長記性 增程式汽車引發華為、魏牌高管口水戰 技術相對簡單就是落后? 張小泉總經理道歉:網傳視頻有語境被誤解,過往五年斷刀都可換