相關新聞:
馬斯克:目前沒有證據表明推特虛假賬號占比小于5%,最火的推文也只有2%日活用戶點贊
新浪科技訊 北京時間5月16日早間消息,據報道,特斯拉CEO埃隆·馬斯克收購Twitter(推特)的交易節外生枝。馬斯克自己抽樣調查了推特虛假賬號比例,但其方法被專家評價太“愚蠢”。
當地時間上周五,他突然宣布讓440億美元收購推特的計劃暫停,理由是要親自研究推特平臺上虛假和垃圾信息賬號的比例。這一舉動導致推特股價當天暴跌。
質疑推特數據
稍后,馬斯克予以澄清,表示自己仍致力于收購推特,不過他依然強調了虛假賬號問題帶來的困擾。馬斯克透露,他自己的團隊會進行獨立研究分析。對于推特在最近財報中公布的虛假賬號數據,馬斯克表示懷疑。
在公布第一季度財報時,推特管理層表示,在平臺上的確存在一些虛假和垃圾信息賬號,另外還有“合法牟利”的日活躍用戶。
推特表示,公司對一批推特用戶賬號的樣本進行了內部分析,在今年第一季度,公司估計虛假賬號和垃圾信息賬號占到日活用戶的比例低于5%。
推特還承認,在過去三年時間里,公司對于平臺活躍用戶的數據高估了140萬人到190萬人。據介紹,2019年3月,推特曾經推出一個功能,可以讓一個用戶把不同的推特賬號鏈接在一起,以便方便切換,但是這個功能犯了一個錯誤,即母賬號進行的一些互動活動,導致所有的關聯賬號都被認定為日活躍用戶。
有專家表示,馬斯克接下來要采取的一些行動力度可能不夠。
馬斯克的統計方法
在推文中,馬斯克介紹了自己的團隊將如何確定推特上虛假賬號、垃圾信息賬號和重復賬號的情況。
馬斯克團隊將隨機抽樣關注“推特公司官方賬號”的100名粉絲,他邀請其他用戶重復這一方法。馬斯克進一步解釋說,可以隨便找一個擁有很多粉絲的推特賬號,忽略前面的1000名粉絲,然后每隔10個粉絲挑出一個(作為統計樣本),馬斯克也表示愿意聽取其他更好的研究方法。
馬斯克還表示,之所以拿100人作為粉絲調查樣本,是因為這是推特在財報中計算用戶數量的單位。
馬斯克表示,任何合理的隨機抽樣過程都是可以的,如果很多獨立賬號得出了有關虛假賬號、垃圾信息賬號和重復賬號的類似比例,那么這可以反映出一個重要信息。
對于馬斯克是否清楚描述了團隊將要采用的統計方法,推特方面拒絕評論。
并非真正隨機
Facebook平臺的聯合創始人Dustin Moskovitz也發表推文,加入到了這一問題討論中。他表示,馬斯克的統計方法并不是真正隨機,使用的樣本數太少,可能導致巨大偏差。
Moskovitz也表示,如果不相信推特團隊抽取的樣本,這本身也是問題。
美國科技公司“BotSentinel”的創始人兼首席執行官Christopher Bouzy表示,其公司分析,推特不真實的賬號比例高達10%到15%,其中包括虛假賬號、垃圾信息賬號、重復賬號、從事惡意活動的機器人賬號,以及單一目的的仇恨賬號(主要攻擊和騷擾其他人),另外還有大量賬號故意傳播虛假信息。
BotSentinel的研究方法主要采取眾包模式,該公司采用計算機軟件和人工審查員聯合的方式,來研究推特的不真實賬號活動。目前,該公司監控了推特上250萬個賬號,主要是英文用戶。
布奇還表示,根據相關內容話題的不同,推特上不真實賬號的數字也會呈現高低變化。他自己公司的研究發現,在政治、加密貨幣、氣候變化、新冠病毒等爭議性話題上,不真實賬號的數字高于其他非爭議話題,比如養貓、折紙藝術等。
馬斯克方法太“愚蠢”?
美國華盛頓大學的教授Carl T. Bergstrom表示,對于高達440億美元的大型并購交易來說,拿出一個單一用戶的100名粉絲來進行抽樣調查,這并不是合格的盡職調查。
Bergstrom表示,相比于社交媒體研究人員進行的抽樣數量,100個的樣本小了幾個數量級。馬斯克自己的統計方法可能出現所謂“選擇性偏差”的錯誤。
這位學者表示,沒有任何理由來支持這個想法,即某個推特官方賬號的粉絲,是推特平臺用戶的代表樣本。也許機器人賬號為了避免被發現,可能不會去關注官方賬號,也許這些機器人賬號會比人類賬號更加熱衷于關注他人,但是馬斯克的抽樣研究方法有些“愚蠢”。
“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)