Benford اور آپ کے ٹیکس

کچھ بھی نہیں کچھ لیکن موت اور ٹیکس ہے, وہ کہتے ہیں. موت سامنے, ہم اپنے تمام طبی عجائبات کے ساتھ کچھ پیٹھ کر رہے ہیں, کم از کم اس کو بچانے نہیں تو اصل میں یہ گریز میں. لیکن اس ٹیکس کے لئے آتا ہے, ہم اپنے ٹیکس ریٹرن میں تخلیقی صلاحیتوں کا ایک تھوڑا سا کے علاوہ کوئی دفاع ہے.

کے انکل سیم تم اس $ 75K واجب الادا سوچتا ہے کا کہنا ہے کہ. آپ ایماندار رائے میں, میلے کے اعداد و شمار $ 50K نشان کے بارے میں ہے. تو آپ کو آپ کے ٹیکس کٹوتی رسید کے ذریعے کنگھی. محنت کی ان گنت گھنٹے کے بعد, fyou نیچے تعداد, کا کہنا ہے کہ, $65کرنے کے لئے. ایک quant کے طور پر, آپ کو ایک IRS آڈٹ کے امکانات کا اندازہ کر سکتے ہیں. اور آپ کو ایک نمبر ڈال کر سکتے ہیں (ڈالر میں ایک امید قیمت) اس کے نتیجے میں کر سکتے ہیں کہ درد اور تکلیف کے لئے.

آپ کے بارے میں ایک ٹیکس آڈٹ کے خطرے کا تخمینہ ہے کہ فرض کرتے ہیں 1% اور یہ $ 15K کی دھن پر آپ کٹوتی دعووں میں تخلیقی حاصل کرنے کے خطرے کے قابل ہے کہ اس کا فیصلہ. آپ ٹیکس ریٹرن میں بھیجنے اور تنگ بیٹھ, علم میں خوش آڈٹ ہو رہی آپ کی مشکلات کافی پتلا ہو. آپ کو ایک بڑا تعجب کے لئے میں ہیں. تم اور واقعی randomness کی طرف سے بیوکوف بنا ہو جائے گا, اور IRS تقریبا یقینی طور پر آپ کے ٹیکس ریٹرن کو قریب سے دیکھو لے جانا چاہتا ہوں گے.

ٹیکس ریٹرن میں شمار کی تخلیقی صلاحیتوں کو شاذ و نادر ہی بند کر دیتا ہے. توقع درد اور تکلیف کے آپ کے حساب IRS آپ آڈٹ جس کے ساتھ تعدد کے ساتھ مطابقت نہیں ہیں. ایک آڈٹ کا امکان ہے, حقیقت میں, آپ کو آپ کے ٹیکس کٹوتیوں فلانا کرنے کی کوشش کریں تو بہت زیادہ. آپ کو آپ کے حق کے خلاف سجا دیئے امکان میں اس ترچھا لئے Benford دوش کر سکتے ہیں.

شکوک و شبہات

Benford اپنے مضمون میں بہت انسداد بدیہی کچھ پیش [1] میں 1938. انہوں نے سوال کیا: کسی بھی عددی میں پہلی ہندسوں کی تقسیم کیا ہے, حقیقی زندگی کے اعداد و شمار? پہلی نظر میں, جواب واضح لگتا ہے. تمام ہندسے ہی امکان ہونا چاہئے. کیوں بے ترتیب اعداد و شمار میں سے کسی ایک عددی کے لئے ایک ترجیح ہو گی?

figure1
اعداد و شمار 1. مالی لین دین کی خیالی مقدار میں پہلے ہندسوں کی موجودگی کی فریکوئنسی. جامنی رنگ وکر کی پیش گوئی کی تقسیم ہے. یاد رکھیں کہ معمولی زیادتیوں میں 1 اور 5 لوگوں کی طرح شہریوں کو منتخب کرنے کے لئے ہوتے ہیں کیونکہ جامنی رنگ وکر اوپر توقع کر رہے ہیں 1/5/10/50/100 ملین. اضافی میں 8 یہ ایشیا میں ایک خوش قسمت تعداد سمجھا جاتا ہے کیونکہ یہ بھی توقع کی جاتی ہے.

Benford ظاہر ہوا ہے کہ ایک میں پہلی ہندسوں “قدرتی طور پر واقع” تعداد ہو جائے کرنے کے لئے بہت زیادہ امکان ہے 1 بلکہ کسی دوسرے ایشو سے. اصل میں, ہر عددی پہلی پوزیشن میں ہونے کا ایک مخصوص امکان ہے. ہندسوں 1 سب سے زیادہ امکان ہے; ہندسوں 2 کے بارے میں 40% اور تو سب سے پہلے کی پوزیشن میں ہونے کا امکان کم. ہندسوں 9 سب سے سب سے کم امکان ہے; اس کے بارے میں ہے 6 پہلی پوزیشن میں ہونے کا امکان کم بار.

میں نے سب سے پہلے ایک اچھی طرح باخبر ساتھی سے اس پہلی ہندسوں رجحان کے بارے میں سنا تو, میں یہ عجیب تھا. میں naively کا خیال سے تمام ہندسے کے واقعہ کے تقریبا ایک ہی تعدد کو دیکھنے کے لئے امید کی جاتی ہے 1 کرنے کے لئے 9. تو میں نے مالیاتی ڈیٹا کی بڑی رقم جمع, کے بارے میں 65000 تعداد (ایکسل کی اجازت کے طور پر کئی کے طور پر), اور سب سے پہلے عددی دیکھا. میں Benford بالکل درست پایا, ساخت، پیکر میں دکھایا گیا ہے 1.

پہلی ہندسوں کے امکانات وردی سے بہت دور ہے, کے اعداد و شمار 1 شو. تقسیم ہے, حقیقت میں, لوگارتمی. کسی بھی عدد D کے امکانات لاگ ان کی طرف سے دیا جاتا ہے(1 + 1 / D), جس پیکر میں جامنی رنگ وکر ہے 1.

اس skewed تقسیم میں تلاش کرنے کے لئے ہوا ہے کہ اعداد و شمار میں ایک اسنگتی نہیں ہے. یہ کسی بھی اصول ہے “قدرتی طور پر واقع” کے اعداد و شمار. یہ Benford کا قانون ہے. Benford قدرتی طور پر واقع اعداد و شمار کی ایک بڑی تعداد جمع (سمیت آبادی, دریاؤں کے علاقوں, جسمانی constants, اسی اخبار کی رپورٹ کے مطابق اور کی طرف سے کی تعداد) اور اس کے عملی قانون احترام کیا جاتا ہے ظاہر ہوا ہے کہ.

تخروپن

ایک مقداری ڈویلپر کے طور پر, میں نے مجھے مسئلہ کو سمجھنے میں مدد کرے گا کہ پیٹرن کو دیکھ کرنے کے قابل ہو سکتا ہے کہ امید کے ساتھ ایک کمپیوٹر پر کام انکرن کرنے کے لئے کرتے ہیں. تخروپن میں آباد ہونا پہلا سوال پتہ ہے کیا ایک مبہم مقدار کے امکان کی تقسیم کی طرح “قدرتی طور پر واقع ہونے کی تعداد” ہو جائے گا. میں تقسیم ہے ایک بار, میں تعداد کو پیدا اور موجودگی کے ان کے تعدد کو دیکھنے کے لئے سب سے پہلے ہندسے میں دیکھ سکتے ہیں.

ایک گنیتشتھ یا quant کرنے کے لئے, قدرتی لاگرتھم کہ زیادہ قدرتی نہیں ہے. تو قدرتی طور پر واقع تعداد کے لئے سب سے پہلے امیدوار تقسیم RV EXP کی طرح کچھ ہے(RV), جہاں RV ایک یکساں تقسیم تصادفی متغیر ہے (صفر اور دس کے درمیان). اس انتخاب کے پیچھے ترک قدرتی طور پر واقع تعداد میں ہندسوں کی تعداد یکساں صفر اور ایک اوپری کی حد کے درمیان تقسیم ہے کہ ایک مفروضہ ہے.

درحقیقت, آپ کو دوسرے منتخب کر سکتے ہیں, قدرتی طور پر واقع کی تعداد کے لیے اچھے تقسیم. میں نے دو استعمال کرتے ہوئے دوسرے امیدوار کی تقسیم کے ایک جوڑے کی یکساں تقسیم کی کوشش کی (صفر اور دس کے درمیان) تصادفی متغیر RV1 اور RV2: RV1 EXP(RV2) اور exp(RV1 RV2). ان تمام تقسیم قدرتی طور پر واقع ہونے کی تعداد کے لئے اچھا اندازہ ثابت ہو, ساخت، پیکر میں سچتر طور پر 2.

figure2
اعداد و شمار 2. کے تخروپن میں پہلی ہندسوں کی تقسیم تعداد "قدرتی طور پر واقع", پیشن گوئی کے مقابلے میں.

میں درستگی کے ایک الوکک کی ڈگری حاصل کرنے Benford کے قانون کی پیروی سے پیدا ہے کہ تعداد کی پہلی ہندسوں. یہ کیوں ہوتا ہے? کمپیوٹر انکار کے بارے میں ایک اچھی بات آپ گہرے کھودنے اور انٹرمیڈیٹ کے نتائج میں دیکھ سکتے ہیں یہ ہے کہ. مثال کے طور پر, تقسیم کے ساتھ اپنے پہلے انکار میں: RV EXP(RV), ہم سوال کر سکتے ہیں: ہم ایک مخصوص پہلی ہندسوں حاصل ہے جس کے لئے آر وی کی اقدار کیا ہیں? جواب پیکر 3A میں دکھایا گیا ہے. یاد رکھیں کہ پہلی ہندسوں دے کہ آر وی میں حدود 1 دے کہ ان سے بہت بڑے ہیں 9. کے بارے میں چھ گنا بڑے, حقیقت میں, کے طور پر توقع. پیٹرن مصنوعی قدرتی تعداد کے طور پر خود کو دوہراتا نوٹس کس طرح “رول” کے پہلے ہندسوں سے 9 کرنے کے لئے 1 (ایک odometer میں tripping کے طور پر).

figure3a
ساخت، پیکر 3A. ایک میں حدود یکساں تقسیم (کے درمیان 0 اور 10) RV EXP میں مختلف پہلی ہندسوں کے نتیجے میں ہے کہ تصادفی متغیر RV(RV). یاد رکھیں کہ کے پہلے ہندسوں 1 باقی کے مقابلے میں بہت زیادہ کثرت سے اس وقت ہوتی ہے, کے طور پر توقع.

اسی طرح کا ایک رجحان دو تصادفی متغیر کے ساتھ ہمارے اچھے تخروپن میں دیکھا جا سکتا ہے. RV1 EXP میں مختلف پہلی ہندسوں کو جنم دے کہ ان مشترکہ تقسیم میں علاقوں(RV2) ساخت، پیکر 3B میں دکھایا گیا ہے. گہرے نیلے رنگ کے بڑے قطعات نوٹس (کے پہلے ایشو کے مطابق 1) اور سرخ قابض کو ان کے علاقے کا موازنہ (پہلی ہندسوں کے لئے 9).

figure3b
ساخت، پیکر 3B. دو کے مشترکہ تقسیم میں علاقوں یکساں تقسیم (کے درمیان 0 اور 10) RV1 EXP میں مختلف پہلی ہندسوں کے نتیجے میں ہے کہ تصادفی متغیر RV1 اور RV2(RV2).

اس مشق مجھے تخروپن سے اخذ کرنے کی امید تھی بصیرت دیتا ہے. پہلی پوزیشن میں چھوٹے ہندسے کی preponderance کے لئے کی وجہ سے قدرتی طور پر واقع کی تعداد کی تقسیم عام طور پر ایک tapering کے ایک ہے; تعداد کے لئے ایک اوپری کی حد وہاں عام طور پر ہے, اور آپ کو اوپری کی حد کے قریب حاصل کرنے کے طور پر, شاید کثافت چھوٹے اور چھوٹے ہو جاتا ہے. آپ کی پہلی ہندسوں پاس کے طور پر 9 اور پھر رول 1, اچانک اس کی رینج زیادہ بڑا ہو جاتا ہے.

اس وضاحت تسلی بخش ہے, حیرت انگیز حقیقت یہ ہے کہ قدرتی تقسیم کے امکانات دور tapers کی کس طرح اس سے کوئی فرق نہیں ہے. یہ تقریبا مرکزی حد قضیہ کی طرح ہے. کورس, اس چھوٹے سے انکار کوئی سخت ثبوت ہے. آپ کو ایک سخت ثبوت کے لئے تلاش کر رہے ہیں, آپ کو پہاڑ کے کام میں تلاش کر سکتے ہیں [3].

فراڈ کا پتہ لگانے

ہمارے ٹیکس چوری مشکلات Benford سے منسوب کیا جا سکتا ہے, پہلی ہندسوں رجحان اصل سائمن Newcomb کی طرف سے ایک مضمون میں بیان کیا گیا تھا [2] ریاضی کے امریکن جرنل میں 1881. اس میں فرینک Benford طرف سے rediscovered کیا گیا تھا 1938, جن تمام عما (یا الزام, باڑ کے جس کی طرف کی بنیاد پر آپ اپنے آپ کو مل جائے) گیا. اصل میں, ہمارے ٹیکس کے مسائل کے پیچھے اصل مجرم تھیوڈور ہل ہو سکتا ہے. وہ 1990s میں مضامین کا ایک سلسلہ میں بحث کرنے کے لئے غیر واضح قانون لایا. اس نے یہ بھی ایک شماریاتی ثبوت پیش [3] رجحان کے لئے.

ہمارے ذاتی ٹیکس کی مشکلات کی وجہ سے کرنے کے علاوہ میں, Benford کے قانون بہت سے دوسرے دھوکہ دہی اور بے ضابطگی کے چیک میں ایک اہم کردار ادا کر سکتے ہیں [4]. مثال کے طور پر, ایک کمپنی کے اکاؤنٹنگ اندراجات میں پہلی عددی تقسیم کی تخلیقی صلاحیتوں کی bouts ظاہر کر سکتے ہیں. ملازم آفسیٹ دعوے, مقدار کی جانچ پڑتال, تنخواہ کے اعداد و شمار, اشیائے خوردونوش کی قیمتوں — سب کچھ Benford کے قانون کے ساتھ مشروط ہے. یہ بھی مارکیٹ پھیری پتہ لگانے کے لئے استعمال کیا جا سکتا اسٹاک کی قیمتوں کے پہلے ہندسوں کیونکہ, مثال کے طور پر, Benford تقسیم پر عمل کرنے کی توقع کی جاتی ہے. وہ ایسا نہیں کرتے تو, ہم ہوشیار ہونا پڑے گا.

اخلاقی

figure4
اعداد و شمار 4. ایک نقلی میں پہلی اور دوسری ہندسوں کی مشترکہ تقسیم, ارتباط اثرات دکھا.

کہانی کا اخلاقی آسان ہے: آپ ٹیکس ریٹرن میں تخلیقی نہیں ملے. تم پکڑے گا. آپ ایک زیادہ حقیقت پسندانہ ٹیکس کٹوتی پیٹرن پیدا کرنے کے لئے اس Benford تقسیم استعمال کر سکتے ہیں لگتا ہے کہ ہو سکتا ہے. لیکن اس کام سے یہ لگتا مشکل ہے. میں نے اس کا ذکر نہیں کیا اگرچہ, ہندسوں کے درمیان ایک تعلق ہے. دوسری ہندسوں وجود کے امکان 2, مثال کے طور پر, پہلی ہندسوں کیا ہے پر انحصار کرتا ہے. ساخت، پیکر دیکھو 4, جو اپنے مجازی میں سے ایک میں ارتباط کی ساخت سے پتہ چلتا ہے.

اس کے علاوہ, IRS نظام کہیں زیادہ بہتر ہونے کا امکان ہے. مثال کے طور پر, وہ اس طرح عصبی نیٹ ورک یا سپورٹ ویکٹر مشینوں کے طور پر ایک اعلی درجے کی ڈیٹا مائننگ یا پیٹرن کی منظوری کے نظام کا استعمال کرتے ہوئے ہو سکتا ہے. IRS لیبل لگا دیا ہے کہ اعداد و شمار کو یاد رکھیں (ناکام کو دھوکہ دینے کی کوشش کی وہ لوگ جو ٹیکس ریٹرن, اور اچھے شہریوں کے) اور وہ آسانی سے ٹیکس چوروں budding کے پکڑنے کے لئے classifier پروگراموں تربیت کر سکتے ہیں. وہ ابھی تک ان پیچیدہ پیٹرن تسلیم الگورتھم کا استعمال کرتے ہوئے نہیں کر رہے ہیں, مجھ پر اعتماد, وہ, اس مضمون کو دیکھنے کے بعد. اس ٹیکس کے لئے آتا ہے, یہ آپ کے خلاف سجا دیئے ہے کیونکہ randomness کو ہمیشہ آپ بیوکوف گا.

لیکن سنجیدگی سے, Benford کے قانون ہم کے بارے میں معلوم کرنے کے لئے ہے کہ ایک آلہ ہے. ہم نے خود کو عددی ڈیٹا کے تمام قسم کے کی صداقت پر شک جب یہ غیر متوقع طور پر ہماری مدد کے لئے آ سکتا ہے. قانون کی بنیاد پر ایک چیک لاگو کرنے کے لئے آسان اور دھوکہ کرنے کے لئے مشکل ہے. یہ سادہ اور منصفانہ عالمگیر ہے. تو, کی Benford سے شکست دی کرنے کی کوشش نہیں کرتے ہیں; بجائے اس میں شامل ہیں.

حوالہ جات
[1] Benford, F. “ویشم نمبر کے قانون.” سونے سے proc. عامر. فل. SOC. 78, 551-572, 1938.
[2] Newcomb, S. “قدرتی تعداد میں ہندسوں کے استعمال کی فریکوئنسی پر نوٹ.” عامر. J. ریاضی. 4, 39-40, 1881.
[3] ہل, T. P. “اہم عدد قانون کی ایک شماریاتی ماخذ.” ریاست. سائنس. 10, 354-363, 1996.
[4] Nigrini, M. “میں آپ کا نمبر مل گیا ہے.” J. حساب 187, پی پی. 79-83, مئی 1999. HTTP://www.aicpa.org/pubs/jofa/may1999/nigrini.htm.

Photo by LendingMemo

Comments