掃碼下載APP
及時接收最新考試資訊及
備考信息
「內容摘要」本文從計算機審計中審計數據轉換的必要性入手,給出了審計數據轉換涉及的相關操作,結合這些操作設計出審計數據轉換系統(tǒng),并對審計數據轉換日志進行了深入探討。
1、引言
審計數據轉換是計算機審計中非常重要的一環(huán)。以下兩個方面決定了在計算機審計過程中必須進行審計數據轉換。
(1)提高數據質量
審計數據來源眾多,這些來源于不同被審計單位的數據中可能存在方方面面的質量問題,具體表現(xiàn)為數據不清潔、不完整,甚至有些數據可能是不真實的、錯誤的。數據質量問題必然會影響數據分析的結果。例如,對錯誤的數據進行分析將得不到正確的結果。為了有效開展審計,必須最大程度地消除這些數據質量問題。
(2)形成集成的數據
一方面,被審計單位的數據組織通常是面向業(yè)務處理的,不是面向分析的。而審計工作要求根據審計目標和分析主題來組織數據,這就需要將不同的數據經過整理和轉換后集成到一起,形成審計分析用的統(tǒng)一數據集合。這個集合通常稱為審計中間表。也就是說,審計分析必須建立在一個數據清潔、結構良好的審計中間表的基礎上。另一方面,審計所需的數據并不單單局限于某個系統(tǒng)或某家被審計單位。利用不同系統(tǒng)間的數據以及外部數據進行關聯(lián)分析已經成為一種有效的手段,它可以有效克服信息不全面帶來的審計風險。例如財務數據和業(yè)務數據之間的對比分析,利用商業(yè)銀行的存貸款數據、人民銀行的統(tǒng)一授信數據、稅務部門的納稅申報數據和金稅工程數據、工商部門的企業(yè)登記數據、社保部門的社會保險數據、技術監(jiān)督局的企業(yè)編碼數據、海關部門的進出口數據及退稅數據、電力公司的電費數據、自來水公司的水費數據進行企業(yè)行為的綜合分析,等等。從多個數據源中抽取數據進行集成,必須消除數據的不一致性和沖突。這些都對數據轉換提出了很高的要求。
2、相關概念
2.1 審計中間表
數據轉換過程中經常使用審計中間表。審計中間表是指將清理、轉換后的數據按照提高審計分析效率、實現(xiàn)審計目標的要求進一步選擇、整合而形成的數據集合。它有兩個特點:一是面向分析主題。審計中間表的構建總是針對具體的審計項目進行的。同樣的數據庫,如果審計目的不同,構建的中間表也不相同。在構建的過程中,審計人員應該依據審計方案既定的審計目標進行數據的選擇、整合,構建出面向主題、滿足審計目標的數據集合。二是相對穩(wěn)定。審計中間表是在具體的審計項目實施過程中所形成的,是對采集到的被審計單位數據進行清理、轉換,并進一步根據審計目標選擇、整合而形成的數據集合。由于這些集合具有比較固定的結構,并且保存的是被審計單位的歷史數據,一般不進行更新,所以審計中間表是相對穩(wěn)定的。
2.2 審計元數據
所謂審計元數據,指的是描述審計中間表內部數據的結構和建立方法的數據。在審計數據的采集和轉換系統(tǒng)中,元數據可以幫助審計人員非常方便地找到他們所關心的數據。它有兩方面用途。首先,審計元數據能提供審計人員所需的,基于計算機審計的各種信息,如被審計單位數據項的業(yè)務描述信息和審計中間表的結構與關系信息等,從而幫助計算機審計人員有效使用各種與審計任務相關的數據。其次,審計元數據能支持系統(tǒng)對審計數據的管理和維護,如關于審計中間表數據項存儲方法的元數據能支持系統(tǒng)以最有效的方式訪問數據。
3、審計數據轉換系統(tǒng)中涉及的相關操作
審計數據轉換系統(tǒng)的功能是否強大,在很大程度上取決于轉換規(guī)則集是否健全。通過分析被審計單位數據和審計項目的具體需求,我們發(fā)現(xiàn)幾乎所有被審計單位數據都是采用關系數據庫來存放的,審計中間表的設計與存儲也是建立在關系數據庫基礎之上的,因此我們制定的審計數據轉換規(guī)則都是針對關系數據庫來定義的。同時,我們的轉換規(guī)則集設計采用開放的方式進行管理,也就是說審計人員可以根據自己的需求添加轉換算法。如果審計人員需要復雜的審計數據轉換,可以通過一系列的轉換操作組合來達到目的,這個轉換組合就是一個轉換活動。
3.1 數據的合法性檢查
審計中間表中的數據來自于被審計單位的多種數據源,這些數據源可能是在不同的硬件平臺上,使用不同的操作系統(tǒng),因而數據往往以不同的格式存在不同的數據庫中。所以,在審計數據轉換的過程中,有時需要對被審計單位的數據進行合法性檢查,將那些語義相同但格式不同的數據轉換成統(tǒng)一的格式,以便更加適用于審計中間表的設計,這也就是數據的格式化的過程(如對不一致的摘要進行處理的問題)。
3.2 數據清理
數據清理主要涉及到數據的匹配與合并。通過匹配,發(fā)現(xiàn)重復的對象;通過合并,保留或生成一個完整的對象。數據清理活動的核心是近似重復對象的識別。所謂近似重復對象是指表現(xiàn)形式不同但語義上相同的對象。從狹義的角度來看,如果兩條記錄在某些字段上的值相等或足夠相似,則認為這兩條記錄互為近似重復
數據清理包括以下幾個步驟:
記錄排序:選擇一個或幾個字段作為關鍵字進行排序;
識別重復記錄;
合并重復記錄:從相似記錄集中獲得記錄的完整信息,并作為該記錄的表示。
3.3 數據變換
常見的數據變換操作包括:簡單變換,日期、時間格式的轉換,由代碼到名稱的轉換以及字段(值)拆分和字段(值)合并等。
簡單變換:是指變換源數據庫表中某些字段的類型、長度以及NU約束;
日期、時間格式的轉換:是指將來自各個數據源的不同格式的日期和時間數據變換為目標數據庫的規(guī)范格式;
字段值合并:是指將源數據庫中的多個字段的值合并成一個字段的值;
字段值拆分:是指將源數據庫中的一個字段值拆分成多個字段值。
3.4 丟失的數據處理
數據丟失是指某個或某些數據元沒有值。解決數據丟失問題的方法有:
忽略該元組;
用一個全局常量填充空缺值;
用屬性平均值或其他推導值來填充空缺值;
用相關的外部數據填充空缺值。
3.5 數據集成
數據集成是將被審計單位數據從一個或多個來源中取出,并逐字段地將數據映射到審計中間表的數據結構上。這種轉換最大的困難在于將被審計單位數據集成為一個緊密結合的審計中間表數據模型。這是因為數據可能來源于多個數據源,這些數據來源往往遵守不同的業(yè)務規(guī)則,在生成審計中間表數據時,要建立它們之間的關系,消除它們之間的不一致性。數據的集成分為兩個層面:字段層面的集成和關系表層面的集成。
4、審計數據轉換系統(tǒng)組織結構
我們把從被審計單位數據到審計中間表數據之間所需要的各種操作均刻畫為轉換操作,因此在審計數據轉換系統(tǒng)的設計過程中,可以把對被審計單位數據的轉換操作定義為一系列的審計數據轉換活動。
在審計數據的轉換過程中,一個轉換將源對象利用一種轉換規(guī)則轉換成一組目標對象。源對象和目標對象都是數據對象集合的元素。數據對象集中的元素能夠是任何類型的數據元素,但是典型的是表、列或表示在內存中暫存對象的模型元素。數據對象集可以是不同轉換活動的源和目標。具體來說,在同一個邏輯單元中,一個給定的數據對象集可以是一個轉換的目標和一個或多個轉換的源。通常,轉換也可以產生一系列的臨時數據。那些必須一起執(zhí)行的轉換被歸類到相應的轉換任務中。在執(zhí)行時,轉換步驟是用來協(xié)調轉換任務之間執(zhí)行情況的控制流。每個轉換步驟執(zhí)行單一的轉換任務,這種轉換任務既可以是從源對象利用一種轉換規(guī)則轉換成一組目標對象,又可以是源對象經過多種轉換規(guī)則轉換成一組目標對象。轉換步驟可以進一步被歸類成轉換活動。在每個轉換活動中,它的轉換步驟的執(zhí)行序列可以通過審計元數據定義。
5、審計數據轉換日志
根據以往審計經驗,在審計數據轉換系統(tǒng)的設計和開發(fā)時需要考慮:對被審計單位數據庫系統(tǒng)及相關業(yè)務的了解是否充分;審計中間表的設計是否合理,關注的焦點應該是被審計數據的業(yè)務內涵;被審計單位數據是否存在質量問題,質量問題是特殊性的,還是普遍性的;審計數據轉換與審計元數據之間的關系;由于審計的特點,往往也需要看到被審計單位數據的原貌,因此審計數據轉換日志問題也需特別關注。
審計數據轉換日志有兩種類型,一種是記載審計數據轉換過程中產生的轉換錯誤的日志,稱之為轉換錯誤日志;另一種是能反映審計數據在轉換過程中變化情況的日志,稱之為轉換變化日志。
5.1 轉換錯誤日志
在審計數據轉換過程中,從被審計單位采集的數據可能來自異構的數據源,這些數據之間可能存在著不同層面的沖突。對這些沖突如果考慮不周就會導致審計數據轉換錯誤的發(fā)生,從而影響審計中間表的數據質量,進而影響審計人員的數據分析。常見的沖突有:
(1)模式層的沖突
當審計中間表的實體及其聯(lián)系在被審計單位數據庫中被用不同的概念模式表示時,就必然產生模式層的沖突。
命名沖突
主鍵沖突
結構約束沖突
表達格式沖突
(2)實例層的沖突
將被審計單位的數據轉換到審計中間表的過程中,轉換錯誤的來源并不僅限于模式層沖突,還有各種各樣的實例沖突:
數據缺失
不正確的數據
數據不一致
以上是審計數據轉換時常見的一些沖突,也是設計審計數據轉換系統(tǒng)時需要解決的主要問題。這些問題同時也是產生審計數據轉換錯誤的源泉。轉換錯誤日志不僅記載著這些在進行審計數據轉換時由于種種沖突所產生的錯誤,而且還記載著審計數據轉換過程中由于系統(tǒng)編程失誤而產生的出錯信息(比如某些表中的某些記錄沒有轉換成功等),為審計人員最終能得到最準確可靠的數據提供一定的幫助。
5.2 轉換變化日志
審計工作的對審計數據有著特殊的要求,不僅要求轉換前后保持一致性,而且要求有一定的可追溯性。即當審計人員要進一步查閱數據的原始面貌時,能夠保證通過審計中間表中的數據追溯到其被轉換前的原始狀況。這一工作就需要對審計數據轉換過程及有關數據的變化情況進行記載,稱為轉換變化日志。
轉換變化日志包含兩個層面:
(1)面向審計數據轉換流程步驟的轉換流程日志
審計數據的轉換過程就是審計數據通過不同的轉換活動,最終形成審計中間表數據的過程。而轉換活動又由許多不同的轉換步驟組成,每個轉換步驟又包含多個轉換任務。轉換流程日志記錄的就是審計中間表中的不同數據都是被審計單位哪些數據都經過哪些轉換任務、轉換步驟以及轉換活動而來的,這期間又運用了什么樣的轉換規(guī)則。它實際上是審計元數據中有關審計數據轉換的結構描述的具體化,比較容易實現(xiàn)。
(2)面向審計數據變化情況的轉換數據日志
審計數據變化主要記錄著為避免在審計數據轉換過程中由于被審計單位數據中存在的沖突而導致的審計數據轉換錯誤而進行的對被審計單位數據的不同處理過程,比如對日期時間數據、缺失數據以及不正確或不規(guī)范數據的處理等。
被審計單位的數據量往往很大,如果對每個數據的變化都進行記載,轉換數據日志量就會非常龐大,保存這么龐大的日志數據會增加審計人員的負擔。通過分析,我們發(fā)現(xiàn)在進行審計數據轉換的過程中,有些數據處理(比如日期時間型數據的處理、定義規(guī)范不一致的數據處理等)對審計人員的分析將不產生實質性的影響,這些數據通過轉換流程日志就可以實現(xiàn)其可追溯性。所以對于這樣的變化轉換數據日志可以不記錄。但其他的數據處理(比如缺失數據處理等)要實現(xiàn)其可追溯性就必須對其進行記載。轉換數據日志的數據量取決于轉換活動中是否包含這樣的數據處理。
6、小結
本文的審計數據轉換系統(tǒng)是審計署承接的國家863課題《計算機數據采集與處理技術》的一個子課題,它結合當前的計算機審計實踐,根據審計數據轉換的需要,提出了數據轉換系統(tǒng)的實現(xiàn)技術,并對審計數據轉換過程中應關注的審計日志進行了深入的探討。
上一篇:經濟責任審計的難點問題
Copyright © 2000 - m.galtzs.cn All Rights Reserved. 北京正保會計科技有限公司 版權所有
京B2-20200959 京ICP備20012371號-7 出版物經營許可證 京公網安備 11010802044457號