01
資料輸入
上傳檔案、貼上資料,或載入範例
拖曳檔案至此處
或
支援 .csv / .xlsx / .xls
貼上數據
或載入範例資料:
05
知識導覽
了解班佛定律的原理與應用
班佛定律(Benford's Law)指出,在許多自然產生、跨越多個數量級的數值資料中,首位數字的分布並非均勻,而是遵循對數規律:
P(D₁ = d) = log₁₀(1 + 1/d),d = 1, 2, ..., 9
以 1 開頭的數字約佔 30.1%,而以 9 開頭的僅佔 4.6%。
直覺解釋:從 1 增長到 2 需要翻倍(+100%),但從 9 增長到 10 只需 +11.1%。因此數值在自然增長過程中,「經過」以 1 開頭的區間最久。
歷史沿革
| 1881 | Simon Newcomb 注意到對數表前幾頁磨損更嚴重 |
| 1938 | Frank Benford 系統驗證超過 20,000 組數據 |
| 2002 | 美國 Znetix/HMC 詐騙案首次在司法程序大規模應用 |
✅ 適合
- 財務分錄 / 傳票金額
- 採購發票 / 應付帳款
- 銷售收入 / 退款
- 城市人口 / 國家 GDP
- 股價 / 成交量
- 稅務申報金額
❌ 不適合
- 身分證號 / 電話號碼
- 身高 / 體重(範圍太窄)
- 真隨機亂數
- 百分比資料(0-100)
- 流水號 / 編碼
- 心理定價(.99 結尾)
首位數異常
| 首位數 1 明顯偏低 | 造假者刻意避開低額數字 |
| 首位數 5、6、7 偏高 | 人工填數字傾向「中間值」 |
| 某一首位數突出 | 刻意在某金額區間集中交易 |
| 整體過於均勻 | 電腦亂數產生假數據 |
第二位數異常
| 0 偏多、9 偏少 | 可能反映數字向上取整 |
| 9 偏多、0 偏少 | 可能反映刻意壓低數字 |
| 0 與 5 同時偏高 | 可能存在系統性四捨五入 |
| 5 單獨偏高 | 可能為人工輸入(心理偏好) |
1確認資料本身適合班佛定律
↓
2鎖定異常數字區間
↓
3檢查是否集中於特定期間、部門、供應商
↓
4檢查是否靠近授權門檻或免審門檻
↓
5查核原始憑證(發票、合約、收據)
↓
6對照業務規則,排除合理偏差
↓
7撰寫查核報告
安隆案(Enron)
財務報表分錄分布顯著偏離班佛理論,成為史上最大企業舞弊案的證據之一。
瑞幸咖啡(Luckin Coffee)
中概股財報數字分布特徵與造假財報模式吻合,2020 年被揭發大規模財務造假。
伊朗 2009 總統大選
各投票區得票數異常偏離班佛分布,且 50 個選區投票率超過 100%。
Znetix/HMC 詐騙案
2002 年首次在美國司法程序中大規模應用班佛分析,從 7 萬筆交易中發現虛假匯款。
班佛定律是異常篩檢工具,不是直接證明舞弊的工具。
偏離班佛分布可能是舞弊,也可能是業務特性或資料特性所致。分析結果僅作為「發現問題的起點」,不能作為「定罪的依據」。
正確使用步驟:
- 確認資料適合班佛定律
- 識別異常區間
- 回查原始憑證與業務背景
- 結合內控與授權流程做實質查核