數據的收集方法
本次在線英才薪資調查,被測試者不需填寫姓名,系統只將e-mail地址作為唯一識別號,這就減小了被測試者的作弊動機,并且通過技術手段,三層篩選,確保同一回答者不能回答同一問卷兩次及更多次。
本期2003年下半年(7月1日--12月31日)收集的原始數據總量為49377條。
數據的探索方法
邏輯規則探索——排除不合理數據
說明:我們對不符合邏輯規則的數據做相應的處理,以保證數據的有效性。所有的邏輯規則按照序號由小到大執行;如果某個紀錄中含有多個邏輯錯誤,那么,它將被序號最小的規則所處理。
例子:某紀錄中年薪大于月薪的100倍,而且月薪小于200元(規則5、8),那么它將由規則5來處理。
規則
序號
|
邏輯錯誤類別
|
本期發生記錄數(條)
|
1
|
對本期數據按照e-mail地址排序,相同e-mail地址的數據只保留最早的一條記錄,刪除其余重復記錄
|
362
|
2
|
未滿18歲就已工作
|
199
|
3
|
前一職位薪資大于現職位薪資的10倍
|
35
|
4
|
現職位薪資大于前一職位的50倍
|
30
|
5
|
年薪大于月薪的100倍
|
55
|
6
|
工齡一年以下,但年薪超過240000(上期99%分位點)
|
42
|
7
|
北京地區月薪少于260元
|
21
|
8
|
其他地區月薪小于200元
|
38
|
9
|
年薪高于240000元(上期99%分位點值),工齡少于5年
|
149
|
10
|
本科學歷以上,但年薪少于6000元
|
122
|
11
|
有過海外經歷,但年薪少于10000元
|
116
|
12
|
年薪高于240000元,工作單位性質為'政府機關'
|
4
|
13
|
行業累計任職時間1年以下,年薪超過240000(上期99%分位點)
|
107
|
14
|
薪資各位數數字相同,如111111
|
0
|
15
|
行業涂鴉(如“什么也不是”)
|
414
|
|
總計
|
1694
|
排除非研究范圍數據
類別
|
本期發生數(條)
|
(1)職業類別為'學生/無工作/下崗’
|
335
|
(2)行業為'學生/無工作/下崗’
|
158
|
經過數據的探索階段,提出不合理數據2187條,得到符合研究范圍的合理數據為47190條記錄。
均值的計算方法
數據探索后,符合研究范圍內的合理數據為47190條記錄。針對這47190個合格參加者的年薪收入水平作頻數分布分析,均值受高值影響顯著(高出中位數55.2%—見下表)。為了體現大多數被調查者的真實年薪收入水平,取年薪收入位于99%分位點以下的人進行均值分析。因此,據此得出的年薪均值代表了至少99%的被調查者的平均水平(見4.3部分)。
總體樣本目前稅后年薪
(RMB 元)
|
樣本數n
|
47190
|
均值
|
40676
|
中位數
|
26200
|
眾數
|
24000
|
1%分位點值
|
9600
|
25%分位點
|
16800
|
50%分位點值
|
26200
|
75%分位點值
|
45500
|
95%分位點值
|
102000
|
99%分位點值
|
240000
|
從上面的表格可知,大于240000元年薪的人數只占全體參加調查者的1%。對比上期的調查結果,平均薪資下降了將近1/6(上期均值48275元)!
指數的計算方法
為了清楚明了的反應各個層次參加此次調查網民的薪資水平,即不僅體現大眾薪資水平,同時反應高收入者的薪資狀況,本次分析同時給出大眾指數和高薪指數,均采用穩定性強的百分位數進行計算。
大眾指數:用全體參與者的薪資中位數做分母,各分類的中位數做分子
高薪指數:用全體參與者的薪資95%分位點數做分母,各分類的95%分位點數做分子,用來體現高收入人群在各行各業的相對可比狀況。
|