新浪財經訊 9月12日,由南方基金、新浪財經和深圳證券信息公司三方聯合編制的南方-新浪大數據100指數、大數據300指數在深圳交易所新大樓舉辦敲鐘儀式及新聞發布會。南方基金總經理助理、權益投資總監史博在新聞發布會上表示,大數據投資是對現有投資的有效補充,補充基礎上大數據投資做得好,有可能對傳統投資會產生顛覆式的影響。
以下為其發言實錄:
曹總、鄧總以及各位新聞媒體的朋友,今天非常榮幸能夠和大家交流一下對大數據投資南方基金的看法。
我們看傳統的投資,傳統的投資分成兩大類,主動投資和被動投資,主動投資實際上又可以把它分成兩大方向,一種是基于基本面的投資,一種是基于技術分析的投資,如果把傳統投資統一一下,其實傳統投資都是基于數據的投資。
基于基本面的投資,統投資價值投資,基本面分析的投資者注重企業的經營數據的分析,企業的歷史經營效率、企業的收入、企業的毛利率、凈資產收益的水平,這些都是企業日常經營過程中產生的數據。
技術分析注重投資過程中,不同投資額產生的數據,投資者共同產生交易量的數據,形成的股價變化的數據,這是技術分析面進行投資的基礎。
我們來看主動投資本質來講依托的是數據,對數據進行分析,指數化投資把企業,根據它的市值情況和收入的情況進行選股,進行劃分以后構建出指數、指數組合進行投資。傳統的投資也是基于數據的投資,大數據時代我們要做投資應該說是對傳統投資不斷的補充甚至是超越。我們基于數據不僅僅是傳統投資中的企業財務報表中的數據,不僅僅是企業投資者在投資過程中形成的股票交易量、股票的交易價格變化的數據。
同時我們關注投資者對數據的反映,基本面的數據是否超越的投資者的預期,投資者是否會對交易的數據如何進行反映,對于公司相關的報表,投資者的觀點是什么,都會產生新一輪的數據,基于對數據的反映。我們認為大數據投資是對現有投資的有效補充,補充基礎上大數據投資做得好,有可能對傳統投資會產生顛覆式的影響。
我們收集歷史上的數據,2005年一直到今天以來,資本市場、A股市場表現得有好、有壞,表現最好的是2006、2007年市場平均的收益率在100%以上,表現比較差的比如說2008年,市場下跌了63%,2011年下跌了22%,我們把歷年超越市場30%的股票拿出來,這些股票數量有多有少,多的是2013、2011年2013年有810只,2014年有535只,少的時候2011年有77只,超越市場30%的股票,即便在市場最不好的2008年,超過市場30%的收益率也有1.09%,整個市場下跌了63%,能夠超越市場30%的股票平均收益率仍然是這么多。2006、2007年市場比較好的時候,這些股票的收益率甚至可以達到300%以上。如果我們真的能夠找到相對表現比較好的股票,市場表現好、表現差都能給投資者帶來比較豐厚的收益。
問題出來了,如何能找到表現比較好的股票?市場是由人形成的,由人的行為形成的,基于的數據不僅僅是企業的經營數據,不僅僅是市場的成交量數據、價格的數據,同時要了解整個市場的參與者對這些股票、對成交量、對股票價格有什么樣的反映,這些反映往往只能通過現在的大數據進行體現。同時,我們看到隨著數據量的增加,數據的分析難度也越來越大。
南方想通過有效的量化平臺,通過我們的量化股票投資的平臺和新浪財經的大平臺有效融合,通過有效的融合分析我們獲得的大數據,隨著數據數量的增加,對數據的分析來講壓力值越來越大了,如何能快速的分析數據,得出有效的結論,這種價值也會越來越高。南方的量化股票投資平臺,傳統來講是基于價值成長和企業質量的因子,這些因子是會篩選股票的行業屬性,篩選股票行業指標的數據以及篩選市場反映的數據,同時我們會把新浪財經的大數據也結合進來,新浪財經的大數據,我們會把個股的熱度、市場報表和文章反映個股的情緒都結合進來。同時我們會找出股票的熱度預期、成長預期、估值提升預期,這些預期將會影響股價將來的預期,把這些預期形成權重,對這些權重構成動態的調整,形成指數構成的基礎。
在指數的過程中,樣本的選擇空間是非常大的,全市場所有的股票中我們扣除三類股票,ST股票扣除以及*ST股票,上市不滿一年的股票我們也扣除,至少在目前的情況下,上市不滿一年數據量有些時候是不夠充足,利用大數據分析偏差可能比較大。選股因子包括三大因子:一是企業的財務因子;二是大數據的因子;三是市場的驅動因子。財務因子包括最新的市盈率的指標,凈資產收益率的情況,企業年度收入和凈利潤增長率,以及對這些指標變化的預測。市場驅動因子包括股票近期的換手率、波動率、股價變化率、成交量變化率。對于新浪大數據因子包括以下幾個方面,新浪財經頻道下的頁面點擊量,微博正負面文章報道,以及文章報道的影響。南方基金想利用自身強大的投資量化平臺,把這些因子進行優化,優化權重后最終創造出我們的i指數。
我們對i指數的歷史收益和歷史表現做了分析,2010年以來到現在,對于大數據的100權重指數和300指數進行回撤,我們對標的百發100都進行了比較分析,過去五年大數據100等權重的話,大數據100的等額收益是222.4%,大數據300有148.58%的收益率,百發有137.15%的收益率,滬深300指數、深證100指數,中小板指數和A股指數都是負的。
我們想比較不同的大數據效果也是一致的,我用一個原理說一下,世界上存在一些集合,集合類的數據是無窮多的,比如說0到1之間有多少個小數,可以說是無窮多的,0.1,0.01、0.001,無窮多之間是否可以比較呢?也有數據是無窮多的,無窮多的數值也是可以比較的,數值再多也是可以比較的,0和1的無窮多比1和2之間的無窮多還要多,不同的大數據質量有可能是千差萬別的,新浪的大數據質量在我們看來,財經數據里是非常優秀的,它不僅有新聞報道、事件報道的數據,而且有投資者對數據的反映,這種反映往往過去的時候我們認為關注度的反映,關注度的反映很重要,同時在投資過程中,正面關注和負面關注也是非常重要的。而微博的數據不斷的可以看到關注度,而且能分出是正面的關注度還是負面的關注度,這對我們來講是非常重要的一點。
構建大數據的指數除了看歷史收益以外,我們也對數據指數的波動性做了分析,所謂指數的波動性做這個分析最重要的要看風險調整后指數的情況,這個了數據分析我們做的下圖比率做了計算,下圖比率是指指數的預期收益率,減去無風險收益以后和指數波動的方差進行比較,數值越高認為你在同等風險下能創造收益的水平是越高的。
按照我們回撤的下幅比例,大數據100的下跌指數是7.35%,300下跌是5.63,百發100的下跌幅度是5.03,其他的指數像A股指數、滬深300、中證100都是負值。通過指數的風險特征我們可以看出,利用大數據不僅可以給投資者帶來很好的收益,而且是風險調整較好的收益率,風險低同時收益比較高。新浪和南方基金共同構造的大數據i指數充滿信心,我們南方基金也會推出大數據i指數產品,占領一席之地。
在大數據時代,信息可能不再昂貴了,海量信息中獲取信息將變得昂貴,希望南方基金和新浪攜手共進,創造更好的投資產品,為廣大投資者創造福利,謝謝大家。
已收藏!
您可通過新浪首頁(www.sina.com.cn)頂部 “我的收藏”, 查看所有收藏過的文章。
知道了