新浪財經 > 期貨 > 第六屆中國期貨暨衍生品市場論壇 > 正文
新浪財經訊5月14日,由北京期貨商會舉辦的“第六屆中國(北京)期貨暨衍生品市場論壇”在北京國賓酒店召開,新浪財經作為獨家門戶網絡合作伙伴全程圖文直播本次論壇。本屆論壇將以“通脹背景下的衍生品市場”作為主題,內容包括2011中國宏觀經濟形勢分析與展望、通脹背景下的宏觀調控、動蕩的國際局勢下衍生品的發展機會等。以下為上海寰融信息技術咨詢有限公司首席執行官李大鵬先生演講實錄。
李大鵬:因為我的時間很短,就直接講了。今天我主要講的內容有這五部分,量化投資綜述,量化交易環節分析,技術環境綜述,技術環境分類,以及案例分析,實際上都是圍繞量化投資來介紹。首先量化投資在國內不光是期貨界在談量化投資,而且證券行業他們也在談量化投資。一般來講,我認為講量化投資其實很多人用不同的觀點,其實在一個最簡單的基礎上就在數據的基礎上使用計算機實現投資目標的行為,就是一個量化投資。
當然你具體用什么樣的方式是百花齊放,所以他底下有一個,我給出幾個外延定義,比如說有人叫做投組交易,或者叫做程序化交易,這些都是直接從英文翻譯過來的。還有一些叫系統交易,這個東西含義是什么呢?實際也是最早,但是你感覺本質上就是通過計算機代替我們的人為策略制定去進行執行。底下真正講的量化交易是從英文詞直接來的,講的就是我說的這個定義,核心就是說以數據為基礎,用計算機去執行,至于策略你怎么定,都是仁者見仁智者見智。
底下爭議比較大的高頻交易,你現在聽很多人講HFT,后面可能會涉及到,也是實際量化投資的一種。底下還有一種叫統計套利,這個用的也是很多的,也是量化交易的一種。實際上在機構上用的是比較多一點而已,我在這講,今天因為我是從技術角度去講,我不想去討論很多真正量化交易模型的問題。因為說句實在話,量化投資不管是程序化交易,高頻交易,核心盈利本質是你模型好壞,但是很多人都忽略了一點,你模型有時候寫的非常好,但是膚淺,就忽略了技術環節分析,你再好模型真真正正在計算機里面算,但是你拿到的信息他的質量不好,你算出來的東西可能并不是反映真實的市場情況。
第二點即使你得到非常高質量的信息,而且你及時算出來了,用你的算法做出決策了。我們大家都知道,你把報單送出去以后,并不是按你理想情況執行了,所以說就是我們俗話說的手工操作,大家各位如果在市場都知道,你搶單搶不著,也賺不著錢。但是從量化交易來講,這個問題同樣存在,這就是我們要講技術環境分析,為什么會造成這種情況,這是我今天要說的。
所以,關鍵因素里頭,投資模型不是我們今天要考慮的東西。真真正正能拿出來公開討論的模型都是不賺錢的模型,凡是賺錢的模型誰也不會拿出來跟別人分享,我告訴你這是一個鐵律。所以,我說教授網站上,當然作為教育去教育后來者,或者讓大家朝這個想法去做公開討論算法是對的,我完全支持,我希望哪天也到教授網站上去看看。但是我知道美國非常有名高頻教育網站,你甚至沒有盈利的記錄,他都不讓你進去,你不能成為他的會員,這個你們可以去找找。
所以,我們不討論模型。但是交易成本,風險控制這是大家都要討論的。我說的市場數據,實時行情,還有歷史行情,再加上其他非常重要的最后一個,信號,因為什么呢?交易信號,這個交易信號是買方跟賣方,作為賣方交易信號是什么,作為買方交易信號又是什么,你在設計你自己的算法時候,這點不清楚設計東西不適用,我不會說你設計反了,但是不適用。
還有我剛才講的執行程序延時度一定設計好,中國的期貨市場,股票市場,執行程序的環境到底是什么,也是我們今天要討論的事情。這個實際最主要一點就是延時度的問題,還有參數控制。最后一點就是系統環境,系統環境里頭我說了一個是單市場質量,比如說金融期貨交易所他的單市場質量是什么,如果在后邊講多市場有效性是什么,我既然要做這種無風險跨市套利做滬深300,我在金融期貨交易所他的環境是什么我們了解清楚了,但是你做無風險跨市套利一定要到股票市場做反向套利,他的市場是什么,能不能實現這種無風險的套利策略,你設計模型理想很好。
各位今天都知道,在現貨市場是不滿足我們這個期貨真正無風險套利的。那你的算法應該怎么去修正,這從技術角度驅動我去想這個問題。當然我在這列了一些,我列了最基本標準教科書的算法,參考書我擱在最后,算法的分類以關鍵因素去分的時候,以時間表怎么觸發,以時間基準,有交易量基準,還有一個是比例,所以是量比,前頭這幾個是非常流行的,你要研究量化交易一定要懂這幾個基礎模型。
底下這個是動態標桿,以價格作為動態標桿,還有做比例的東西。底下動態標桿,我不知道中文叫做什么,Price Inline,還有Market On Close,這就是基本幾大類。這不是具體做法,我就不忽悠各位沒寫出來。核心交易模式我們講技術模式,在技術上有幾個比較大交易模式,它的對比,好壞對比,我大概列了一個表在這,這也是參考書上有的,但是各位可以看一看,是什么呢?他主要有四大類,兩大類里頭的四種,一種就是中間手工的,不知道你們喉頭能不能看的清楚,喉頭三個都是屬于直接連到市場,市場用電子化交易的。電子化交易里頭有三種,一個就是DMA,另外一個就是非常有名的暗池交易,你不是機構也沒有辦法做,他一般都是機構做的。
最后這個就是很有名,根據你的反映速度,持倉短,有高頻交易,低頻交易,喉頭會進行減少。各位可以看到,我們不講仔細什么,他幾種交易方式從技術角度來講,有效性上頭,可以看最強的就是比較好的我用紅的標出來,算法交易前兩項從容量和速度來講是最好的,所謂容量講的是什么呢?你可以使用的資金量,你用來去做的東西,因為有的東西你資金打的時候實現不了,所以資金量是一個限制,你一定考慮這個事情。
還有一個控制度跟透明度,所謂透明度就是說,因為歐美市場很講逆命性。這一點透明度對市場信息披露DMA是最強的,是這么比的。所以,各位來看,從總列來看,各項指標評下來,算法交易平均值最高,因為有四項是最好的,有兩項是弱的,其他都是中的。所以,你可以看出平均數最好,從技術環境角度來講。我們下一步去仔細看一看,他有一些什么東西。
首先我們講量化交易環節分析,參與者的類型。其實兩大類,就是買方跟賣方,我說的買方賣方各位在期貨市場比較知道無論是買一個股票,賣一個股票,我在期貨市場我是看多,中文老講不明白,你是買方還是賣方很難講。我講的這個買方賣方是你在市場里的地位,所以賣方是誰就是機構。咱們以這個債券為主,如果我是債券發行商我肯定是賣方,我只要把它發行出去才不管他平不平倉,我發行完了就行了。
買方就不一樣了,你買了這個債券,你就要想這個債券達不達到我的盈利目標,達到之后我要不要賣出去。所以,各位如果你是投機的話,我說的投機期貨市場投機產生流動性,是一個非常好的參與群體,你是投機的投資者的話,你肯定是買方。因為你要建倉以后要平倉獲利,賣方他只是把這個交易完成,至于他后面沒有什么后續的平倉獲利問題,你說他賣出去建倉了嗎,建設不建倉。當然在期貨市場不一樣,你只要是開倉就有倉位,就要想到平倉獲利的問題,所以期貨市場基本上是雙方買方市場,如果是套期保值買方至少持倉在一個星期以上,這是我們定義。
所以,你一定要清楚市場參與者是誰。我做投資策略的時候,這個策略是完全不同的,從技術角度來講你的要求也不一樣。有的時候我買了這個系統,他說他能贏錢,為什么我用的不一樣,其實一個本質你把這個決策給用錯了。底下講這個歷程,實際上量化交易流程無非就是這些,行情堅守,決策制定,交易執行,結果處理,風險監測,還有后面很多人忽略了獲利退出,是專門一個環節,不是你一個模型里頭的東西。所以,你做模型流程的時候,如果缺了這個模型,我開了倉什么時候平倉獲利,你這個環節不考慮好,開始設計模型就不設計好的話你就麻煩大了。
所以,最后一點也是屬于每天晚上要反思,我獲利了也要反思,我虧損了也要反思的參數反饋,你不做該虧錢還得虧錢,你說贏錢可能今天贏了明天人家做更好模型就虧了。這些環節大家都要注意,后兩個環節往往就忽略了。當然量化交易的目標,剛才我說了買方的目標跟賣方目標是不同的,舉個例子,因為我沒有詳細列在這。賣方他唯一的目標是什么?我們在股票市場來講,量化交易可能在期貨里也相同,你有大量的持倉,你要在市場上拋出的話,或者買入的話,你的目標是什么,最高的目標就是用最低的成本完成這個交易,這個交易完成我就不管了,因為我沒有平倉的問題。但是這個時候你要做的是什么,所謂的要是用最小的成本是什么,就是真真正正在市場這么透明的一個市場如何去隱藏你的買賣方向,讓市場不知道,這是你制定策略的時候最重要的一點。
所謂量化交易最早就是從這來的,我有100萬股,比如IBM股票,我為了不引起市場價格波動,我會拆成一萬份,在不同所有能交易的市場去投,讓別人不知道我的交易意圖。這是真正量化交易最早的名詞就是這么來的,當然后來很多人賣方,其實賣方算法發展非常完善,所有的投行都有自己完善的賣方算法,這是很早就有了。而只不過像我們講,買方后來也跟隨,我發現市場價格動的時候,第一我要從價格動向里探索出來賣方意圖,我不管意圖只要發現就做短期交易,所以目標完全不同,控制參數當然也就不一樣,我就不細講了。
技術環節,真真正正細節,各位每天你要在設計算法已經接觸到了,首先一點所謂算法交易,量化交易他的一個源頭就是交易所的行情,你這個數據拿到的行情質量如何,你怎么去評判,還有一件事,像我們大家可能都是做期貨交易都知道,我們國內4家期貨交易所大概發出來行情是統一的,都是500毫秒一次打包。你接到以后,一解包看起來是逐筆,實際上是500毫秒之后的事,你看的是歷史,你根據這段歷史去測制定我的投資策略的時候,你已經晚了500毫秒。所以,你讀到的這些報單,成交都不是當前在這個交易所撮合最前端的東西。
所以,交易所行情你要了如指掌怎么去處理,這是我說的延時處理。實際上有一個算法,我看了所有談算法交易的書上都忽略一個,我就在這提醒各位,這個其實從數學上來講很簡單,你怎么去做差值算法。他這個差值有兩種,一種是歷史的,我沒有拿到的數據,我去做差值補充。還有我做預測的時候,我拿的是500毫秒之前,我要執行的訂單很可能是500毫秒之后,加在一塊差一秒鐘,這是一個災難性,決定性的延遲。所以,預測的差值跟歷史回顧的差值,你用積分其他復雜算法也可以,我們會談到你做這個算法交易模型的時候,這個模型越簡單越有效越好,因為計算機不允許你多做,幾毫秒都是災難性延時,所以差值是最簡單方式,但是你要做的有效,怎么去做很多人沒有注意這一點。
還有歷史數據庫的引用,因為所有的算法交易其實各位你要做設計都知道,我是根據歷史數據去判斷將來的走向,統計分析的。但是這個時候做的時候,引用的數據越少越好,原理其實很簡單。我引用數據越小,我想的時候越少。但是你少的時候是非常快速地反映了,但是這個反映你數據引用的時候少的時候,你想的不精確,這時候怎么做平衡,這就是做測試的時候,真正做算法研究的時候怎么做,這也就是掙錢的人,我相信做的好模型都在這種小的地方,比別人高出一籌,你要時刻問自己我這個模型是不是能再簡單,結果能不能做精確,我說每天晚上最后一個環節交易回復就是這個問題,不斷問自己怎么簡單模型再簡單,準確再準確。
當然了,決策制定的時候目標一定要明確,我說的決策制定是交易決策,執行問題,在下單之前,其實這跟人工完全一樣。你下單的時候!你這個目標一定要明確,我在什么價位成交,這個價位能不能成交,這個策略很多人忽略一個參數,叫最大可執行度。什么意思?其實說白了各位天天在干的,那會我還在交易所的時候知道,每天下午一點半一開始你接單子,你送一萬張今天搶到一張就可以下班了,你不搶到單子就沒有盈利地機會。所謂最大可執行度,你在送報單出去的時候,不要想最佳點,你要想想人家搶到最佳點,我搶第二個最佳點,或者第三個的時候可能性多大,我損失一點點利潤,但是我只要能執行我這個單子就能獲得利潤,這是最重要的一點,做這個模型設計的時候。
當然了底下的策略執行,所謂策略執行在我們國家市場沒有那么復雜,我們就是單市場,一個市場交易一種品種,沒有跨市場的問題。但是你在美國市場,我給你講,比如股票期權,一個股票期權可以在6個交易所進行,每個報價和交易成本不同,我怎么去分,把這個單子分成多少份去做。當然在中國市場這個很簡單,你們可以不考慮,但是一旦某天你到境外投資的時候要想這個問題。
還有結果分析,所謂結果分析是什么呢?我把這個單子成交之后,拿過來了,我要看我的盈利目標要不要調,因為你的成交價位可能不是真正你送出去的價位,我真正盈利的時候是不是能達到,別到最后還按原始價位平倉了,你最后算下來交掉手續費之后反而虧錢了。所以,所謂成果分析是成交成果分析,你在開倉的時候,這就是買方一個特殊要考慮的,賣方他用不著考慮這個問題,我只要成交我今天就萬事大吉了完成任務了,因為這是國家給我幾百億,像央行債券發行一樣,今天180億我只要把180億誰給我認購完就行了,你說央行什么時候平倉買回來獲利他才不想。
在技術環境分析里頭,就是我剛才說的投資者環境里面就是我們要說的,數據接受,你接受。當然交易所的行情各位都直接從交易所行情發布服務器上收來,但是我知道大家可能一定要測你的接受服務器延遲跟交易所送出來延遲。我問問各位,你心里有底沒有,你延遲是多少?你們都答不出來,上汽所期貨大廈跟張江之間,這兩個主機之間如果要切換的話,這兩個之間的延遲說是忽略不計,但是你要到微米級是有差別,因為大廈跟張江之間有25公里區別,盡管是光纖。你說你接受服務器擱在大廈里,但是你今天發布機在張江,發出來東西是一樣的嗎,你這個算法能保證你今天設計盈利嗎,這些東西精細點心里要有數,我不是說到時候哪一天切換你會虧損,其實你不會虧損,但是你心里有數之后,算法參數怎么調這是一個精細的東西。
還有成本因素,不光是說交易所的收費了,還有一個我在這一個單子執行的時候,我這個單子下去,很多算法是這樣。比如趨勢型交易,各位都知道趨勢化交易不是那種價差套利是追這個趨勢走的,你追這個趨勢走的時候,你這個成本分析要沒有,你追到什么時候為止,非要到成交,成交以后回來一算,今天價格不到,最后你平倉的時候把手續費一交反而還虧本了,這種東西怎么算,這個模型有沒有在算法里頭,這個都是要做的。
當然底下通道環境會員,可能是期貨公司給你提供的這些東西好不好,有的期貨公司說我的服務器是舊的交易所托管里頭的,其實我給你這個沒有太大區別,關鍵在你的算法。如果我是期貨公司,我的機器就在交易所機房里,他們就隔了一層樓,2、3樓的問題,但是問題在這了。他的機房發出來的東西是一樣的,可是你真正接受的時候,你的模型算法服務器在什么地方,你這個通道能不能解決時差問題,你心里有數嗎,如果沒有數的話,你光把服務器擱到最近的地方是一點用沒有。
所以,這個東西我說的就是整個一個全鏈條。為什么剛才說流程呢?剛才說的那個流程里我沒有畫圖,因為時間不夠。他每一個圖形中間都有技術的服務器跟你的運行地點因素在那,你把它都畫出來,看看他每一個延遲是多少,就知道你這個算法要調整多少了,這個非常重要。當然了交易所的監管措施,跟行情發布,還有撮合效率,我所說的監管措施是什么?現在交易所,比如說每天開倉總數限制大概是多少,我離開交易所一年也不去看。這種類似的,你在監管措施允許的程度下,你能不能去實現你的模型,如果你的模型一天一定要交一個500筆才能盈利的話,那就不就歇菜了,第二天行情不一樣你還做什么,監管措施很重要,不是開玩笑的事情。
還有一個行情發布,撮合效率。撮合效率第一你要心里有數,跟各位講一個實話,上汽所,大商所和證商所他們撮合速度不一樣,跟你成交率也是非常有關的。所以,這個東西你要沒有測過,實戰地測過你設計模型也等于留了一個洞,你都不知道為什么不成交,你的模型為什么不好。通訊網絡各位都知道,但是我為什么不想多說,這不是咱們管的事,是電信的事,但是你一定要想到別讓他給你掐了,就跟陸家嘴一樣一施工把光纜給挖了,這你找誰去。
我們剛才實際上已經基本談過了,各種量化投資技術環境綜述。我現在把這個列出來,大家看一下。國內期貨市場這個行情延遲,我剛才已經說了500毫秒,這個東西是一個硬指標,你在這個環境下,我怎么去設計模型,但是有一點如果你拿那個模型,比如像教授說的,我把這個模型做的很成功你搬到臺灣去了,我相信90%你會虧錢。臺灣行情延遲跟大陸是不一樣的,是不是500毫秒我不知道,沒測過,香港也不一樣。美國大概行情延遲應該是在50毫秒,這就是為什么美國模型拿到大陸來,往往全輸錢,就是這個地方,這是一個很關鍵一點。你看的是50毫秒行情反映,結果你拿到國內之后我這個同樣在美國賺的一塌糊涂,到這里必定賺,這不是胡扯的事,我這個歷史數據拉長了10年。美國200年歷史,你拿到中國來也學,中國5千年的歷史,人家拉長25倍,你怎么去不一樣的事情,這是同樣級別。
還有一個國內期貨市場持倉限定,其實國外也有。持倉我沒有看到仔細,扯單在國內是500次/天,當然500次以后,反正各個期貨老總就開始接到電腦你怎么扯單超過了找客戶停止。芝加哥我知道,你大概一個小時或者多長時間你要扯單50次當天罰款,不僅不讓你做,所以國內還是比較人性化的,你以為中國期貨市場監管嚴,還是非常不錯的,中國哪個交易所罰你款了。
停板限定,所以說這個也是一個成本,我說成本因素剛才已經提了不重復,F在國內證券市場,其實他也在考慮這個事,為什么?ETF,基金也在考慮量化,確實在國內賣方市場最早,其實國內也在做,當時我們國家上證所深交所有一個特點,叫做大宗交易平臺,但是一般人不能參與。另外一點,如果很多人就是要在二級市場去賣的話,你怎么去做,這個行情怎么做。我知道上證所也在研究這個事情,另外國內證券市場為什么他是純量化交易在國內只是賣方市場,沒有買方市場就是后邊這個原因,證券就是T+1,你得等明天行情變了。
當然我們做期貨做慣了隔了24小時一個天上一個地下,股票還比較好還可以睡覺,至少不會差那么遠。可是他這個T+1,實際上不能做,至少我們高頻交易現在不可能做的。我知道歐美市場也不可能做這種高頻,高頻交易都是在衍生品市場,歐美都一樣,股票不行,還有一個停板限定也一樣。我為什么說國內OTC市場,國外有一些OTC市場也在研究量化交易,我是想不明白,這個從哪去做,所以我擱了一個問號在這,各位可能比我更有體會。
我們國家最明顯一個OTC市場就是銀行間拆借市場和外匯交易市場,我就琢磨不出來哪些人怎么去做量化交易,他報價都是公開的,而且OTC本身就是大單一筆幾十個億,反正咱們兩個人一談完成交夠行了,也沒有必要隱藏什么東西,也是一個封閉,就2千個會員其他人不能介入。通信網絡已經講過了,現在期貨技術可行性分析,本來想找幾個例子咱們聊一聊,但是我現在時間已經超了,就跟各位講一個。
黃金跨市套利量化交易,各位都知道,上海期貨交易所有黃金操作,我不知道各位誰試過,我能在這講就不做這種交易。我從來不講一句話了,沒準我去做交易了,可能你們有這種體會。黃金跟他這種T+D,和上海黃金期貨交易的套利怎么個套法,各位可以研究研究,很有講究,有一個固定價差,好象是100塊人民幣,你要弄好跨市套利是穩賺錢的地方,你模型弄不好可能兩邊虧錢,虧了別找我,賺了念著我行。
所謂高頻交易,現在大家爭議最大,不光是我們在討論這個東西是不是在哄抬物價還是什么,美國證監會從去年5月6號股市大跌又開始重新做了,其實美國對高頻交易批判不僅這一次,87年那一次就在使勁批判,中間那幾次只要股市有大跌批判高頻交易就一定有。反正,他們苗頭一致對準高頻交易。所謂當日無持倉,他的一個特點你們也想得到,他基本不看基本面,股票你能做,股指你要能做用不著看基本面,就看幾苗種幾個價格位變化,我只要算法做對了就可以盈利,而且盈利了我馬上就走。所以,你用不著看基本面,就是一個純行情的博弈作為技術分析。
我所說中頻就是隔日持倉到一周之內持倉,一定跟短期行業信號有關的。所以,你不看行業,你只看高頻一樣純看技術基本面,我看價差等等,但是你只是隔日持倉,你沒有行業基本知識你這一個禮拜持倉絕對是賭博,不是一個理性的投資。所以,這個要做。一周以上,我說賣方還行,我們講套期保值經常一個月,而且要持倉,他是對宏觀經濟對自己的實體經濟走勢需求,你如果也是跟蹤這種,在你模型里也要去做這一把。其實這個東西大家都知道,如果這個是低頻交易,你只要走對了是真真真正賺大錢,這個沒有宏觀經濟考慮你也不可能。
為什么?看到我這個GFT就是我現在公司,我們為什么做這個事情,我把整個現金流動向跟國家宏觀經濟提供給投資者,讓你也看到我這個市場行情走動,他背后暗流涌動跟宏觀經濟到底有什么感到。但是這里頭有一個非常重要因素是什么,提出一個新的,不光是現在行情數據分析,而是一個新的領域,叫“新聞分析”。
現在華爾街有一種叫話機器人讀數據,我們現在也做類似事情。我不光是行情數據數字分析,這個東西已經做很成熟了,一個事件一出來,比如說本拉登一被擊斃,這個事件一出來,我怎么能馬上知道他的金融含義是什么,明天各個市場一開市反映應該是什么,這就是新聞分析的一個核心點。實際就是一個金融事件的信號產生,這是我們真正要做的。
當然了我們產品還沒有出來,出來以后希望能給大家帶來收益。再一個就是跨市場套利,我就不想多說了,F在經驗就是在這,成本中套利保險,各位如果你做套利的話,你一定要清楚,我的這個反向,你只要有一個作為是正向,另外有一個是反向你一定要堅持去做,所以算法建議強調一點嚴格地紀律,這句話一說,我到軍隊里,連隊里軍訓一個月就成了,不是那回事。第一個非常重要,不管我的單向,為什么在算法交易里我個人不看好趨勢化模型在哪,他趨勢模型里不強調這個反向對沖設置,你要是無風險套利的時候反向對沖是一個紀律,我必須要做,這是我買保險。就跟各位開車一樣,當然現在交給搶險一定要有的,沒有就別上路。
還有一個執行紀律的體現在哪,堅持這個參數設置。所謂堅持這個參數設置,你每天要去反思今天的模型怎么回事,這個參數是否反映情況,如果不反映為什么,要不要調,這個東西每天不去做作業,做城市化交易的人不是去逛公園,真正開市最放松的時候,是機器給你做,一閉市就是你干活了。這個東西你要不做,你程序化交易今天賺錢明天就虧。
還有買方執行力度,沒準哪天你替客戶發行一個東西,發行債券,發行股票,你這個執行力度在這是非常重要的一個問題。我怎么能替客戶把這個執行好,但是這個怎么做,今天跟我們期貨市場沒有太大關系就不多說了。還有一個薄利多銷,在算法里面也有一個紀律就是不能貪,你今天幸運可能挺好,你明天就虧了,到了點就走人,薄利多銷盈利。
底下這幾點不多說了,我已經超了。當然可能南華期貨因此上證所都是內部資料,不知道你們能不能拿到,但是第一本英文書書店里面都可以買得到,非常好的一本書,向大家推薦,謝謝大家。