本報告的限制
由于本報告基于中華英才網的在線薪資調查,參加者都具有上網的條件,因此本報告不能代表沒有上網條件的人群的薪資水平;
盡管采取了多種措施(我們一共設定了15條數據篩選規則)過濾不合理數據,但是仍然有可能包含了某些精心制作的假造數據。
另外,盡管我們采集樣本數量很大(超過49377條),但是這些樣本的分布并非十分均勻的(主要集中在幾個大城市)。對某些參加者較少地區或者行業,本報告的數據可能沒有代表意義。
數據的收集方法
本次在線英才薪資調查,被測試者不需填寫姓名,系統只將e-mail地址作為唯一識別號,這就減小了被測試者的作弊動機,并且通過技術手段,三層篩選,確保同一回答者不能回答同一問卷兩次及更多次。
本期2003年上半年(1月1日--6月30日)收集的原始數據總量為43883條,經過篩選后有效數據為42165條。
數據的探索方法
邏輯規則探索——排除不合理數據
說明:我們對不符合邏輯規則的數據做相應的處理,以保證數據的有效性。所有的邏輯規則按照序號由小到大執行;如果某個紀錄中含有多個邏輯錯誤,那么,它將被序號最小的規則所處理。
例子:某紀錄中年薪大于月薪的100倍,而且月薪小于200元(規則5、8),那么它將由規則5來處理。
規則
序號
|
邏輯錯誤類別
|
本期發生記錄數(條)
|
1
|
對本期數據按照e-mail地址排序,相同e-mail地址的數據只保留最早的一條記錄,刪除其余重復記錄
|
393
|
2
|
未滿18歲就已工作
|
56
|
3
|
前一職位薪資大于現職位薪資的10倍
|
37
|
4
|
現職位薪資大于前一職位的50倍
|
23
|
5
|
年薪大于月薪的100倍
|
34
|
6
|
工齡一年以下,但年薪超過240000(上期99%分位點)
|
42
|
7
|
北京地區月薪少于260元
|
5
|
8
|
其他地區月薪小于200元
|
12
|
9
|
年薪高于240000元(上期99%分位點值),工齡少于5年
|
135
|
10
|
本科學歷以上,但年薪少于6000元
|
86
|
11
|
有過海外經歷,但年薪少于10000元
|
49
|
12
|
年薪高于240000元,工作單位性質為'政府機關'
|
4
|
13
|
行業累計任職時間1年以下,年薪超過240000(上期99%分位點)
|
121
|
14
|
薪資各位數數字相同,如111111
|
42
|
15
|
行業涂鴉(如“什么也不是”)
|
317
|
|
總計
|
1356
|
均值的計算方法
數據探索后,對符合研究范圍內的合格參加者的年薪收入水平作頻數分布分析,為了體現大多數被調查者的真實年薪收入水平,取年薪收入位于99%分位點以下的人進行均值分析。因此,據此得出的年薪均值代表了至少99%的被調查者的平均水平。
|