Benford এবং তোমার ট্যাক্সসমূহ

কিছুই নির্দিষ্ট কিন্তু মৃত্যু এবং করের হয়, তারা বলে. মৃত্যুর সামনে, আমরা আমাদের সকল চিকিৎসা বিস্ময়কর কিছু inroads তৈরীর হয়, অন্তত এটা পিছিয়ে যদি না আসলে এটা এড়ানো. কিন্তু করের আসে, আমরা আমাদের ট্যাক্স রিটার্ন মধ্যে সৃজনশীলতা একটি বিট ছাড়া অন্য কোন প্রতিরক্ষা আছে.

এর আঙ্কেল স্যাম আপনি তাকে $ 75K পাওনা মনে করে শুরু করা যাক বলতে. আপনার সৎ মতামত, পরিষ্কার চিত্র $ 50k চিহ্ন সম্পর্কে. তাই আপনি যদি আপনার ট্যাক্স deductible রসিদ আঙুলে. হার্ড কাজ অগণিত ঘন্টা পর, fyou নিচে নম্বর আনা, বলে, $65থেকে. একটি quant হিসাবে, আপনি একটি IRS নিরীক্ষা সম্ভাবনা অনুমান করতে পারেন. এবং যদি আপনি একটি সংখ্যা করা যাবে (ডলার একটি প্রত্যাশা মূল্য) এটা থেকে হতে পারে যে ব্যথা ও দুর্ভোগ থেকে.

এর সম্পর্কে আপনি হতে একটি ট্যাক্স নিরীক্ষা ঝুঁকি নিরূপণ যে অনুমান করা যাক 1% এবং এটা $ 15K সুর আপনি সিদ্ধান্তগ্রহণ দাবি সৃজনশীল পেতে ঝুঁকি মূল্য যে সিদ্ধান্ত. আপনি ট্যাক্স রিটার্ন পাঠাতে এবং আঁট বসতে, জ্ঞান ফিটফাট নিরীক্ষিত হচ্ছে আপনার মধ্যে মতভেদ মোটামুটি পাতলা হয় যে. আপনি একটি বড় সারপ্রাইজ আছে. আপনি ভাল এবং সত্যিই যদৃচ্ছতা দ্বারা বোকা বানানো হবে, এবং IRS প্রায় অবশ্যই আপনার ট্যাক্স রিটার্ন সময়ে কাছাকাছি কটাক্ষপাত করতে হবে.

ট্যাক্স রিটার্ন গণনা সৃজনশীলতা কদাপি বহন করেনা বন্ধ. আশা ব্যথা এবং যাতনার আপনার গণনার IRS আপনি audits সঙ্গে যা ফ্রিকোয়েন্সি সঙ্গে সামঞ্জস্যপূর্ণ হয় না. একটি নিরীক্ষা সম্ভাবনা, আসলে, আপনি আপনার ট্যাক্স deductions ফোলান চেষ্টা অনেক বেশী. আপনি আপনার পক্ষে বিরুদ্ধে স্তুপীকৃত সম্ভাবনা এই নৈকতলীয় জন্য Benford দোষারোপ করতে পারেন.

সংশয়বাদ

Benford তার প্রবন্ধে খুব পাল্টা স্বজ্ঞাত কিছু উপস্থাপন [1] মধ্যে 1938. তিনি প্রশ্ন জিজ্ঞাসা: কোনো সাংখ্যিক প্রথম সংখ্যা বিতরণের কি, বাস্তব জীবনের তথ্য? এক নজরে, উত্তর হবে সুস্পষ্ট বলে মনে হয়. সব সংখ্যা একই সম্ভাবনা থাকা উচিত. কেন র্যান্ডম তথ্য যে কোন এক অঙ্ক করতে পছন্দ হতে পারে?

figure1
চিত্র 1. আর্থিক লেনদেনের ধারণাগত পরিমাণে প্রথম সংখ্যা সংঘটন এর ফ্রিকোয়েন্সি. রক্তবর্ণ বক্ররেখা পূর্বাভাস বন্টন. উল্লেখ্য যে অসম্মান বাহুল্যও এ 1 এবং 5 মানুষের মত নাগরিকদের নির্বাচন করার ঝোঁক, কারণ রক্তবর্ণ বক্ররেখা উপরে আশা করা হয় 1/5/10/50/100 মিলিয়ন. বাড়তি এ 8 এটা এশিয়ার একটি ভাগ্যবান সংখ্যা বিবেচনা করা হয় কারণ বলে আশা করা হচ্ছে.

Benford দেখিয়েছেন যে একটি প্রথম ডাক “প্রাকৃতিকভাবে” সংখ্যা হতে অনেক বেশি 1 বরং অন্য কোন ডাক চেয়ে. আসলে, প্রতিটি অঙ্ক প্রথম অবস্থান হচ্ছে একটি নির্দিষ্ট সম্ভাবনা আছে. ডাক 1 সর্বোচ্চ সম্ভাবনা আছে; ডাক 2 সম্পর্কে 40% এবং তাই প্রথম অবস্থান করা সম্ভাবনা কম. ডাক 9 সব, সর্বনিম্ন সম্ভাবনা আছে; এটি সম্পর্কে 6 প্রথম অবস্থান করা সম্ভাবনা কম বার.

আমি প্রথম একটি ওয়াকিফহাল সহকর্মী থেকে এই প্রথম ডাক ঘটনাটি শুনে, আমি এটা অদ্ভুত ছিল. আমি naively থেকে সব সংখ্যা জন্য ঘটনার প্রায় একই ফ্রিকোয়েন্সি দেখতে প্রত্যাশিত হবে 1 থেকে 9. তাই আমি আর্থিক তথ্য বৃহৎ পরিমাণ সংগ্রহ করা, সম্পর্কে 65000 সংখ্যা (এক্সেল অনুমতি দেয় হবে হিসাবে অনেক), এবং প্রথম অঙ্ক দিকে তাকিয়ে. আমি Benford একেবারে ডান হতে পাওয়া, চিত্র হিসাবে দেখানো হয়েছে 1.

প্রথম অঙ্ক সম্ভাবনা অভিন্ন থেকে বেশ দূরে, চিত্র হিসাবে 1 শো. বন্টন, আসলে, লগারিদমিক. কোনো অঙ্ক ঘ সম্ভাবনা লগ দেওয়া হয়(1 + 1 / ঘ), যা চিত্র রক্তবর্ণ বক্ররেখা 1.

এই skewed বন্টন আমি তাকান যে ঘটেছে তথ্য একটি ব্যতিক্রম হয় না. এটা কোনো নিয়ম “প্রাকৃতিকভাবে” তথ্য. এটা Benford এর আইন. Benford প্রাকৃতিকভাবে তথ্য একটি বৃহৎ সংখ্যা সংগ্রহ (সহ জনসংখ্যা, নদী এলাকায়, পদার্থবিদ্যার ধ্রুবকের, তাই সংবাদপত্র রিপোর্ট থেকে সংখ্যা) এবং এই গবেষণামূলক আইন সম্মান দেখিয়েছেন যে,.

সিমুলেশন

একটি পরিমাণগত ডেভেলপার হিসেবে, আমি আমার সমস্যা বুঝতে সাহায্য করবে যে নিদর্শন দেখতে সক্ষম হবে আশা করি যে একটি কম্পিউটারে জিনিস অনুকরণ করার ঝোঁক. সিমুলেশন মধ্যে নিষ্পত্তি করা হবে প্রথম প্রশ্ন জিনিসটা কি একটি অস্পষ্ট পরিমাণ সম্ভাবনা বন্টন মত “স্বাভাবিকভাবেই সংখ্যা ঘটছে” হবে. আমি বন্টন আছে, আমি সংখ্যা উৎপন্ন এবং সংঘটন তাদের ফ্রিকোয়েন্সি দেখতে প্রথম সংখ্যা তাকান করতে পারেন.

একটি গণিতজ্ঞ অথবা একটি quant করুন, স্বাভাবিক লগারিদম যে আরো প্রাকৃতিক কিছুই নেই. তাই প্রাকৃতিকভাবে সংখ্যার জন্য প্রথম প্রার্থী বিতরণ আরভি Exp মত(আরভি), যেখানে আরভি একটি অবিশেষে বিতরণ র্যান্ডম পরিবর্তনশীল (শূন্য এবং দশ মধ্যে). এই পছন্দ পিছনে যুক্তিপূর্ণ প্রাকৃতিকভাবে সংখ্যায় ডিজিটের নম্বর অবিশেষে শূন্য এবং একটি ঊর্ধ্ব সীমা মধ্যে বিতরণ করা হয় যে একটি দায়িত্বগ্রহণ.

প্রকৃতপক্ষে, আপনি অন্যান্য চয়ন করতে পারেন, প্রাকৃতিকভাবে সংখ্যার জন্য কল্পনাকারী ডিস্ট্রিবিউশন. আমি দুই ব্যবহার করে অন্যান্য প্রার্থী ডিস্ট্রিবিউশন একটি দম্পতি অবিশেষে বিতরণ চেষ্টা (শূন্য এবং দশ মধ্যে) র্যান্ডম ভেরিয়েবল RV1 এবং RV2: RV1 Exp(RV2) এবং EXP(RV1 RV2). এই সব ডিস্ট্রিবিউশন স্বাভাবিকভাবেই সংখ্যা ঘটছে জন্য ভাল অনুমান হতে শয্যাত্যাগ, চিত্র দেখানো হিসাবে 2.

figure2
চিত্র 2. সিমুলেশন প্রথম সংখ্যা বিতরণের সংখ্যা "প্রাকৃতিকভাবে", ভবিষ্যদ্বাণী তুলনায়.

আমি সঠিকতার একটি ভুতুড়ে ডিগ্রী Benford এর আইন অনুসরণ উত্পন্ন যে সংখ্যা প্রথম সংখ্যা. কেন এই না ঘটতে? কম্পিউটার সিমুলেশন সম্পর্কে ভাল জিনিস হল যে আপনি গভীর খনন এবং অন্তর্বর্তী ফলাফল তাকান করতে পারেন. উদাহরণস্বরূপ, ডিস্ট্রিবিউশনের সাথে আমাদের প্রথম সিমুলেশন: আরভি Exp(আরভি), আমরা প্রশ্ন জিজ্ঞাসা করতে পারেন: আমরা একটি নির্দিষ্ট প্রথম ডাক পান, যার জন্য আরভি মান কি কি? উত্তর চিত্র 3 এ দেখানো হয়. উল্লেখ্য, প্রথম অঙ্ক দিতে আরভি মধ্যে রেঞ্জ 1 যে দিতে চেয়ে অনেক বড় 9. প্রায় ছয় গুণ বড়, আসলে, হিসাবে প্রত্যাশিত. প্যাটার্ন কৃত্রিম স্বাভাবিক সংখ্যার হিসাবে পুনরাবৃত্তি নিজেই লক্ষ্য করুন কিভাবে “উপর গুটানো” এর প্রথম অঙ্ক থেকে 9 থেকে 1 (একটি দূরত্বমাপণী দ্রুতগামী হিসাবে).

figure3a
চিত্র 3 এ. একটি মধ্যে রেঞ্জ অবিশেষে বিতরণ (মধ্যে 0 এবং 10) আরভি Exp বিভিন্ন প্রথম সংখ্যা হতে যে দৈব চলক আরভি(আরভি). উল্লেখ্য, এর প্রথম অঙ্ক 1 বাকি তুলনায় অনেক বেশি ঘন ঘন ঘটে, হিসাবে প্রত্যাশিত.

একই প্রবণতা দুই র্যান্ডম ভেরিয়েবল সঙ্গে আমাদের কল্পনাকারী সিমুলেশন দেখা যায়. RV1 Exp বিভিন্ন প্রথম সংখ্যা বৃদ্ধি দিতে যে তাদের যৌথ ডিস্ট্রিবিউশন অঞ্চলে(RV2) চিত্র 3b দেখানো হয়. গভীর নীল বৃহৎ swathes লক্ষ্য করুন (প্রথম ডাক সংশ্লিষ্ট 1) এবং লাল swathes তাদের এলাকার তুলনা (প্রথম অবস্থান 9).

figure3b
চিত্র 3B. দুই যুগ্ম বিতরণ অঞ্চলে অবিশেষে বিতরণ (মধ্যে 0 এবং 10) RV1 Exp বিভিন্ন প্রথম সংখ্যা হতে র্যান্ডম ভেরিয়েবল যে RV1 এবং RV2(RV2).

এই ব্যায়াম সম্পর্কে আমি সিমুলেশন থেকে সংগ্রহ প্রত্যাশী ছিল অন্তর্দৃষ্টি দেয়. প্রথম অবস্থানে ছোট সংখ্যা অধিকতর ভারী জন্য কারণ প্রাকৃতিকভাবে সংখ্যার বন্টন সাধারণত একটি সরু এক হয়; নম্বর একটি ঊর্ধ্ব সীমা থাকে, এবং আপনি উপরের সীমা কাছাকাছি পেতে, সম্ভবত ঘনত্ব ছোট এবং ছোট হয়ে যায়. আপনি প্রথম ডাক পাস 9 এবং তারপর থেকে উপর গুটানো 1, হঠাৎ তার পরিসীমা অনেক বড় হয়ে.

এই ব্যাখ্যা সন্তোষজনক হয়, বিস্ময়কর সত্য প্রাকৃতিক ডিস্ট্রিবিউশন সম্ভাবনা বন্ধ tapers কিভাবে এটা কোন ব্যাপার না. এটা প্রায় কেন্দ্রীয় সীমা উপপাদ্য ভালো হয়. অবশ্যই, এই সামান্য সিমুলেশন কোন কঠোর প্রমাণ. আপনি একটি কঠোর প্রমাণ খুঁজছি হয়, আপনি হিল এর কাজ তা জানতে পারেন [3].

জালিয়াতি সনাক্তকরণ

আমাদের করফাঁকি যন্ত্রণার Benford দায়ী করা যেতে পারে, যদিও, প্রথম অঙ্ক ঘটনাটি মূলত সাইমন Newcomb ২ দ্বারা একটি প্রবন্ধে বর্ণনা করা হয়েছিল [2] গণিত আমেরিকান জার্নাল মধ্যে 1881. এটা ফ্রাঙ্ক Benford দ্বারা rediscovered ছিল 1938, যাকে সব মহিমা (বা দোষ, বেড়া যা পার্শ্ব উপর নির্ভর করে আপনি নিজেকে খুঁজে পেতে) গিয়েছিলাম. আসলে, আমাদের ট্যাক্স দুর্দশা পিছনে আসল অপরাধী থিওডোর পার্বত্য হতে পারে হয়েছে. তিনি 1990 সালে নিবন্ধের একটি সিরিজ প্রচারের ছটা থেকে অস্পষ্ট আইন আনা. তিনি এমনকি একটি পরিসংখ্যান প্রমাণ উপস্থাপন [3] ঘটনাটি জন্য.

আমাদের ব্যক্তিগত ট্যাক্স যন্ত্রণার সৃষ্টি ছাড়াও, Benford আইন অনেক জালিয়াতি ও অনিয়মের চেক একটি অত্যন্ত গুরুত্বপূর্ণ ভূমিকা পালন করতে পারে [4]. উদাহরণস্বরূপ, একটি কোম্পানির হিসাব থেকে প্রথম ডাক বন্টন সৃজনশীলতা বাড়াতেও প্রকাশ করা হতে পারে. কর্মচারী পরিশোধ দাবি, পরিমাণে পরীক্ষা, বেতন পরিসংখ্যান, মুদি দাম — সবকিছু Benford আইন বিষয়. এটা এমনকি বাজারে হেরফেরের সনাক্ত করতে ব্যবহার করা যেতে পারে স্টক মূল্য প্রথম সংখ্যা কারণ, উদাহরণস্বরূপ, Benford বন্টন অনুসরণ অনুমিত হয়. যদি তারা না, আমরা সতর্ক হতে হবে.

নৈতিক

figure4
চিত্র 4. একটি সিমুলেশন মধ্যে প্রথম এবং দ্বিতীয় সংখ্যা যুগ্ম বিতরণ, পারস্পরিক সম্পর্ক প্রভাব দেখাচ্ছে.

গল্পের নৈতিক সহজ: আপনার ট্যাক্স রিটার্ন সৃজনশীল করবেন না. আপনি ধরা হবে. আপনি একটি আরো বাস্তবসম্মত ট্যাক্স সিদ্ধান্তগ্রহণ প্যাটার্ন জেনারেট করার জন্য এই Benford বন্টন ব্যবহার করতে পারেন, মনে হতে পারে. কিন্তু এই কাজ কঠিন শোনাচ্ছে হয়. আমি এটা উল্লেখ না যদিও, সংখ্যার মধ্যে একটি পারস্পরিক সম্পর্ক আছে. দ্বিতীয় অঙ্ক হচ্ছে সম্ভাবনা 2, উদাহরণস্বরূপ, প্রথম অঙ্ক হয় উপর নির্ভর করে. চিত্র তাকান 4, যা আমার সিমিউলেশন এক পারস্পরিক সম্পর্ক গঠন দেখায়.

এছাড়া, নির্দেশানুযায়ী IRS সিস্টেম অনেক বেশি বাস্তবধর্মী হতে পারে. উদাহরণস্বরূপ, তারা যেমন স্নায়ুর নেটওয়ার্ক বা সমর্থন ভেক্টর মেশিন হিসাবে একটি উন্নত ডেটা মাইনিং বা প্যাটার্ন স্বীকৃতি সিস্টেম ব্যবহার করে হতে পারে. নির্দেশানুযায়ী IRS লেবেল করা হয়েছে যে তথ্য মনে রাখুন (অসফল প্রতারণা করার চেষ্টা যারা ট্যাক্স রিটার্ন, এবং ভাল নাগরিক যারা) এবং তারা সহজেই ট্যাক্স evaders উদীয়মান ধরা ক্লাসিফায়ার প্রোগ্রাম শেখাতে পারেন. তারা এখনো এই অত্যাধুনিক প্যাটার্ন স্বীকৃতি আলগোরিদিম ব্যবহার করা হয় না, আমার বিশ্বাস, তারা, এই নিবন্ধটি দেখে. এটি করের আসে, এটা আপনার বিরুদ্ধে স্তুপীকৃত করা হয়, কারণ যদৃচ্ছতা সবসময় আপনি মূর্খ হবে.

কিন্তু গম্ভীরভাবে, Benford আইন আমরা সচেতন হতে হবে যে একটি টুল. আমরা নিজেদেরকে সাংখ্যিক তথ্য সব ধরণের সত্যতা সন্দেহ এটি যখন এটা অপ্রত্যাশিত উপায়ে আমাদের সাহায্য করতে আসতে পারে. আইন উপর ভিত্তি করে একটি চেক বাস্তবায়ন করা সহজ এবং ফাঁদে ফেলা কঠিন. এটা সহজ এবং মোটামুটি সার্বজনীন. সুতরাং, এর Benford বীট চেষ্টা করুন না; এর পরিবর্তে তাকে যোগদান দিন.

সূত্র
[1] Benford, ফল. “অস্বাভাবিক নাম্বার আইন.” Proc. আমের. ফিল. Soc. 78, 551-572, 1938.
[2] Newcomb ২, এস. “প্রাকৃতিক সংখ্যায় ডিজিটের ব্যবহার ফ্রিকোয়েন্সি উপর রাখবেন.” আমের. জে. গণিত. 4, 39-40, 1881.
[3] পার্বত্য, টি. পি. “উল্লেখযোগ্য ডাক আইন পরিসংখ্যান আহরণ.” রাজ্য. সী. 10, 354-363, 1996.
[4] Nigrini, এম. “আমি আপনার নম্বর পেয়েছেন.” জে. হিসাববিদ্যা 187, পিপি. 79-83, মে 1999. HTTP://www.aicpa.org/pubs/jofa/may1999/nigrini.htm.

Photo by LendingMemo

Comments