說明:我們對不符合邏輯規則的數據做相應的處理,以保證數據的有效性。所有的邏輯規則按照序號由小到大執行;如果某個紀錄中含有多個邏輯錯誤,那么,它將被序號最小的規則所處理。
例子:某紀錄中年薪大于月薪的100倍,而且月薪小于200元(規則5、8),那么它將由規則5來處理。
規則
序號
|
邏輯錯誤類別
|
本期發生記錄數(條)
|
1
|
對本期數據按照E-mail地址排序,相同E-mail地址的數據只保留最早的一條記錄,刪除其余重復記錄
|
216
|
2
|
未滿18歲就已工作
|
77
|
3
|
前一職位薪資大于現職位薪資的10倍
|
13
|
4
|
現職位薪資大于前一職位的50倍
|
23
|
5
|
年薪大于月薪的100倍
|
44
|
6
|
工齡一年以下,但年薪超過240000(上期99%分位點)
|
47
|
7
|
北京地區月薪少于260元
|
13
|
8
|
其他地區月薪小于200元
|
29
|
9
|
年薪高于240000元(上期99%分位點值),工齡少于5年
|
106
|
10
|
本科學歷以上,但年薪少于6000元
|
153
|
11
|
有過海外經歷,但年薪少于10000元
|
76
|
12
|
年薪高于240000元,工作單位性質為'政府機關'
|
3
|
13
|
行業累計任職時間1年以下,年薪超過240000(上期99%分位點)
|
91
|
14
|
薪資各位數數字相同,如111111
|
0
|
15
|
行業涂鴉(如“什么也不是”)
|
333
|
|
總計
|
1224
|
類別
|
本期發生數(條)
|
(1)職業類別為'學生/無工作/下崗’
|
284
|
(2)行業為'學生/無工作/下崗’
|
126
|
經過數據的探索階段,提出不合理數據1634條,得到符合研究范圍的合理數據為37564條記錄。