淺論審計工作中的電子數據質量 | |||||||||
---|---|---|---|---|---|---|---|---|---|
http://whmsebhyy.com 2005年09月27日 11:50 審計署網站 | |||||||||
來源:審計署蘭州辦【摘要】:電子數據作為審計過程的基礎依據,它的質量影響著整體的審計質量,因此,在審計實務中需要對取得的電子數據的質量進行正確評價和合理提升。本文首先討論數據質量的評價指標和評價方法,然后對常見的引起數據質量低下的原因進行分析,并提出提升數據質量的措施。【關鍵詞】:審計電子數據數據質量計算機業有一句名言:“garbage in,garbageout(無用信息輸入,無用信息輸出)”,說的是信息系統只能對有意義的輸入資料進行處理,產生有意義的輸出,無法依賴于錯誤數據得出正確結果。其
數據質量的評價指標 數據質量的評價指標 根據行業不同有很多劃分方法,在審計工作中主要關注真實性、完整性、一致性、自治性和可用性五個指標。這五個指標并不是按照體系嚴格劃分的,只是在審計工作中需要關注的幾個方面,它們之間相互影響并在一定程度上存在交織和重疊。 真實性 ,指數據必須真實、準確的反映實際發生的業務。有兩點需要關注,一是真實,二是準確。真實是指數據中記錄的業務必須是真實發生的。準確是指數據對業務的重要屬性表述明確,無歧義,不含糊,能夠準確的描述所記錄的業務。 完整性 ,可以從兩方面解釋,縱向上是指數據無重復或缺失,發生的業務沒有被重復記錄或遺漏;橫向上指數據中關鍵屬性無缺失,能夠完整的描述所記錄的業務。 一致性 ,指相關聯的各個數據在邏輯上是一致的。其包括概念一致性、值域一致性和格式一致性三個子指標。概念一致性是指在不同的數據中,同一概念所指的事物是相同的。比如價格這個概念,在采購數據和銷售數據里可能不一致,一個代表采購價格,另一個代表銷售價格。值域一致性是指同一概念的值域范圍在不同的數據中是相同的。如一個大型單位的財務數據中,一些二級單位的財務系統每年設置13個會計期間,而其余二級單位設12個會計期間,當這些數據合并到一起時,就出現了會計期間這個概念的值域不一致。格式的一致性比較好理解,是指同一概念在不同數據中表達方式是一致的。最常見的是日期/時間類型,可能是在部分數據里用標準的date類型,而在另一些數據通過字符串來表示。 自治性 ,指數據內部必須滿足特定的約束。數據并不是孤立存在的,數據之間往往存在著各種各樣的約束,這些約束描述了數據的關聯關系。數據必須能夠滿足相互間的關聯關系,而不能夠相互矛盾。比如,科目余額數據中有科目年借方發生額這個屬性,該屬性的數值從理論上來說應該等于憑證數據中該科目的借方發生額的合計值,不能出現不一致的情況。 可用性 ,指數據的可利用程度。可用性又可以分為幾個子指標,其中最主要的是可理解性。數據要有容易理解的存儲格式,才能被審計人員正確理解、合理利用。比如對普通的審計人員來說,中文字段名稱比英文字段名稱、英文字段名稱比字母編號的字段名稱要容易理解。 數據質量的評價方法 當評價指標確立之后,就可以開始對數據質量進行評價,常用的評價方法主要有自動檢測評價和人工檢測評價兩種。 自動檢測評價方法 ,是利用專業的計算機軟件或編寫檢測程序,來自動檢測數據在各個評價指標上的質量情況,依據檢測結果評價數據質量并確定影響質量的關鍵因素。 人工檢測評價方法 ,指借助于計算機等工具輔助或直接用肉眼檢測數據,并依據檢測結果評價數據質量。在實際工作中,往往是數據量龐大,結構復雜,要完整的評價數據質量相當困難。因此,審計中通常是利用隨機抽樣方法對數據進行抽樣,再通過自動檢測評價或人工檢測評價,以便利用最小的成本得到接近于真實的檢測評價結果。 數據質量低下的原因分析 在對數據質量進行評價后,如果數據的質量不能滿足審計工作需要,就要分析引起質量低下的原因,常見的原因主要有以下幾種。 一是由于系統開發和審計行為的出發點不同而引入的固有缺陷 。被審計單位在開發信息系統時,會盡量將數據庫設計為較高的范式,以便在系統使用過程中減少數據冗余、保持數據一致和防止數據丟失;或在設計時采取了一定加密措施,屏蔽數據庫結構來滿足數據保密要求。而審計過程中為方便使用需要較低范式和清晰明了的數據庫。如果取得的數據不經處理直接在審計中使用,會使其可用性大打折扣。 二是被審計單位信息系統存在缺陷 。信息系統由于開發過程中受需求定義、開發方式等因素的影響,使得系統產生的數據在完整性、自治性等方面出現質量低下的情況。 三是不當的數據下載轉換 。我們下載數據時,由于下載方法的不當和手工操作中的疏忽等原因,會丟失或者遺漏部分數據;數據轉換過程也會由于格式不一致等原因而丟失部分信息或對數據造成破壞。這就影響到數據的完整性和自治性。 四是不當的數據合并 。我們在審計工作的得到的電子數據大多是來自不同系統的,以財務系統為基礎,涉及生產、銷售等系統。各個系統大部分是分別開發的,未經選擇、處理就將這些數據合并,會使合并后的數據在一致性、自治性等方面存在一定問題。 提升數據質量的措施 明確了數據質量低下的原因,就需要采取措施提升數據質量來達到工作要求,常用的方法有轉換和清洗兩種。 轉換 ,是利用專用軟件、SQL語句或編寫程序,對數據的存儲格式、類型、值域和特殊值等進行轉換,提升其一致性和可用性。 清洗 ,則是利用SQL語句、編寫程序或人工操作,對沖突數據進行選擇,對冗余數據進行清理,對缺失數據進行修補,來提升數據的自治性、可用性和完整性。當數據內部出現不自治時,需要我們在幾個互相沖突的數據間作出選擇,選擇出正確的數據來利用,這就是沖突數據的選擇。當數據出現大量無用數據時,容易分散審計人員的精力和干擾職業判斷,對其進行清理可以提升數據可用性。對缺失數據進行修補是指當數據中缺少關鍵屬性,導致其無法被正確利用時,需要對這部分數據進行修補來提升數據的完整性。進行審計實務中的數據轉換和清理,需要審計人員掌握精深的與被審計單位相關領域的專業知識和計算機技術水平才能熟練駕馭。因本文主題所限,在此不做深論。數據質量是一個專業而深奧的論題。上述僅做淺顯討論,如何合理的評價和提升數據質量還需要在工作中進一步研究和實踐。(作者:審計署駐蘭州特派員辦事處 李春青) |