Benford மற்றும் உங்கள் வரி

எதுவும் குறிப்பிட்ட ஆனால் மரணம் மற்றும் வரிகளை ஆகிறது, அவர்கள் சொல்கிறார்கள். மரண முன், நாம் அனைவரும் நம் மருத்துவ அதிசயங்களை சில புகுந்து விட்டன, குறைந்தபட்சம் அதை தள்ளி என்றால் உண்மையில் அது தவிர்த்து. ஆனால் அது வரி வரும் போது, நாங்கள் எங்கள் வரி படைப்பாற்றல் ஒரு பிட் தவிர வேறு எந்த பாதுகாப்பு வேண்டும்.

தான் அங்கிள் சாம் நீங்கள் அவரை $ 75k கடமைப்பட்டிருக்கிறேன் நினைக்கிறார்கள் என்று பார்ப்போம். உங்கள் நேர்மையான கருத்து, நியாயமான எண்ணிக்கை $ 50k குறி பற்றி. எனவே நீங்கள் உங்கள் வரி விலக்கு ரசீதுகள் மூலம் சீப்பு. கடின உழைப்பு எண்ணற்ற மணி நேரம் கழித்து, fyou கீழே எண்ணை கொண்டு, சொல்ல, $65செய்ய. ஒரு quant என, நீங்கள் ஒரு IRS தணிக்கை நிகழ்தகவு மதிப்பிட முடியும். நீங்கள் பல வைக்க முடியாது (டாலர் ஒரு எதிர்பார்ப்பு மதிப்பு) அதை விளைவிக்கும் என்று வலி மற்றும் துன்பம் செய்ய.

நீங்கள் பற்றி ஒரு வரி தணிக்கை ஆபத்தை கணக்கிட என்று நினைக்கிறேன் நாம் 1% அது $ 15k இசைக்கு நீங்கள் துப்பறியும் கூற்றுக்கள் படைப்பு பெற ஆபத்து மதிப்புள்ள என்று முடிவு. நீங்கள் வரி அனுப்ப மற்றும் இறுக்கமான உட்கார, அறிவு சுயதிருப்தி தணிக்கை செய்து உங்கள் முரண்பாடுகள் மிகவும் மெலிதான என்று. நீங்கள் ஒரு பெரிய ஆச்சரியம் இன்னும் உள்ளன. நீங்கள் உண்மையாகவே சீரற்ற முட்டாளாக, மற்றும் IRS கிட்டத்தட்ட நிச்சயமாக உங்கள் வரி ஒரு நெருக்கமான பாருங்கள் வேண்டும்.

வரி கணக்கிட படைப்பாற்றல் எப்போதாவது ஆஃப் செலுத்துகிறது. எதிர்பார்க்கப்படுகிறது வலி மற்றும் துன்பம் உங்கள் கணக்கீடுகள் எஸ் நீங்கள் தணிக்கைகள் அலைவரிசை இசைவானதாக உள்ளன. ஒரு தணிக்கை நிகழ்தகவு இருக்கிறது, உண்மையில், நீங்கள் உங்கள் வரி விலக்கிற்கு உயர்த்துவதற்காக முயற்சி செய்தால் அதிக. நீங்கள் உங்கள் சார்பாக எதிராக அடுக்கப்பட்ட நிகழ்தகவு இந்த வளைவு ஐந்து Benford குற்றம் சொல்ல முடியும்.

ஐயுறவு

Benford தனது கட்டுரையில் மிகவும் எதிர் உள்ளுணர்வு ஏதாவது வழங்கப்பட்டது [1] உள்ள 1938. அவர் கேள்வி கேட்டார்: எந்த எண் முதல் இலக்கங்கள் விநியோகம் என்ன ஆகிறது, உண்மையான வாழ்க்கை தரவு? முதல் பார்வையில், பதில் தெளிவாக தெரிகிறது. அனைத்து இலக்கங்கள் அதே நிகழ்தகவு வேண்டும். ஏன் சீரற்ற தரவு எந்த ஒரு ஐக்கிய ஒரு விருப்பம் இருக்கும்?

figure1
படம் 1. நிதி பரிவர்த்தனைகள் உத்தேச அளவில் முதல் இலக்கங்கள் நிகழ்வு அதிர்வெண். ஊதா வளைவு கணித்து விநியோகம் ஆகிறது. குறிப்பு என்று சற்று மிகையான மணிக்கு 1 மற்றும் 5 மக்கள் போல் தேசிய தேர்வு ஏனெனில் ஊதா வளைவு மேலே எதிர்பார்க்கப்படுகிறது 1/5/10/50/100 மில்லியன். அதிகமாக உள்ள 8 இது ஆசியாவில் ஒரு அதிர்ஷ்ட எண் கருதப்படுகிறது ஏனெனில் எதிர்பார்க்கப்படுகிறது.

Benford காட்டியது என்று ஒரு முதல் ஐக்கிய “இயற்கையாக” பல இருக்க அதிக வாய்ப்பு இருக்கிறது 1 மாறாக வேறு எந்த ஐக்கிய விட. உண்மையில், ஒவ்வொரு இலக்க ஐக்கிய முதல் நிலையில் இருப்பது ஒரு குறிப்பிட்ட நிகழ்தகவு இருக்கிறது. ஐக்கிய 1 உயர்ந்த வாய்ப்பு உள்ளது; ஐக்கிய 2 பற்றி 40% அதனால் முதல் நிலையில் இருக்கும் வாய்ப்பு குறைவாக. ஐக்கிய 9 அனைத்து குறைந்த நிகழ்தகவு உள்ளது; அது பற்றி 6 முதல் நிலையில் இருக்கும் வாய்ப்பு குறைவாக முறை.

நான் முதல் ஒரு நன்கு தகவலறிந்த சக இருந்து இந்த முதல் ஐக்கிய நிகழ்வு கேட்ட போது, நான் அது வித்தியாசமாக இருந்தது நினைத்தேன். நான் naively அனைத்து இலக்கங்களையும் நிகழ்வு கிட்டத்தட்ட அதே அதிர்வெண் பார்க்க எதிர்பார்க்கப்படுகிறது 1 செய்ய 9. எனவே நான் நிதி தரவு பெரிய அளவு சேகரிக்கப்பட்ட, பற்றி 65000 எண்கள் (எக்செல் அனுமதிக்க வேண்டும் என பல), மற்றும் முதல் ஐக்கிய பார்த்து. நான் Benford முற்றிலும் சரி கண்டறியப்பட்டது, படம் காணப்படுவது போல் 1.

முதல் ஐக்கிய நிகழ்தகவு சீருடையில் இருந்து மிகவும் தொலைவில் உள்ளது, படம் என 1 நிகழ்ச்சிகள். பரவல், உண்மையில், மடக்கை. எந்த ஐக்கிய ஈ நிகழ்தகவு பதிவு வழங்கப்படுகிறது(1 + 1 / ஈ), இது படம் ஊதா வளைவு 1.

இந்த திரித்து கூறப்பட்ட விநியோகம் நான் பார்க்க என்ன நடந்தது என்று தரவு ஒரு ஒழுங்கின்மை அல்ல. அது எந்த ஆட்சி ஆகிறது “இயற்கையாக” தரவு. இது Benford சட்டம் ஆகும். Benford இயற்கையாக தரவு ஒரு பெரிய எண் சேகரிக்கப்பட்ட (உட்பட மக்கள், ஆறுகள் பகுதிகளில், உடல் மாறிலிகள், அதனால் பத்திரிகை அறிக்கைகள் மற்றும் எண்கள்) இந்த அனுபவ சட்டத்தை மதிக்க வேண்டும் என்று காட்டியது.

உருவகப்படுத்தப்பட்ட

ஒரு அளவு டெவலப்பர், நான் எனக்கு சிக்கலை புரிந்து கொள்ள உதவும் என்று வடிவங்கள் பார்க்க முடியும் என்று நம்பிக்கை ஒரு கணினியில் விஷயங்களை உருவகப்படுத்த முனைகிகிறேன். உருவகப்படுத்துதல் தீர்வு வேண்டும் முதல் கேள்வி கண்டுபிடிக்க என்ன ஒரு தெளிவற்ற அளவு நிகழ்தகவு விநியோகம் போன்ற “இயற்கையாகவே எண்கள் நிகழும்” இருக்கும். நான் விநியோக முறை, நான் எண்கள் உருவாக்க மற்றும் நிகழ்வு அவற்றின் அதிர்வெண் பார்க்க முதல் இலக்கங்கள் பார்க்க முடியும்.

ஒரு கணித அல்லது ஒரு quant செய்ய, இயற்கை மடக்கை என்று மேலும் இயற்கை எதுவும் இல்லை. எனவே இயற்கையாக எண்கள் முதல் வேட்பாளர் விநியோகம் ஆர்.வி. எக்ஸ்ப் போன்ற ஒன்று உள்ளது(ஆர்.வி.), அங்கு ஆர்.வி. ஒரு பரவியுள்ள சீரற்ற மாறி இருக்கிறது (பூஜ்யம் பத்து இடையே). இந்த தேர்வு பின்னால் காரணம் இயற்கையாக எண்கள் இலக்கங்கள் எண்ணிக்கை சீராக பூஜ்யம் மற்றும் ஒரு மேல் எல்லை இடையே விநியோகிக்கப்படும் என்று ஒரு யூகம் இருக்கிறது.

உண்மையில், நீங்கள் மற்ற தேர்ந்தெடுக்க முடியும், இயற்கையாக எண்கள் ஆர்வலராக வழங்கல்கள். நான் இரண்டு பயன்படுத்தி மற்ற வேட்பாளர் வழங்கல்கள் ஒரு ஜோடி பரவியுள்ள முயற்சி (பூஜ்யம் பத்து இடையே) ரேண்டம் மாறிகள் RV1 மற்றும் RV2: RV1 எக்ஸ்ப்(RV2) அடிக்குறிப்புகள்(RV1 RV2). அனைத்து இந்த வழங்கல்கள் இயற்கையாகவே எண்கள் நிகழும் நல்ல யூகங்களை மாறிவிடும், படம் விளக்கப்பட்டுள்ளது 2.

figure2
படம் 2. உருவகப்படுத்துதலை முதல் இலக்கங்கள் விநியோகம் எண்கள் "இயற்கையாக", கணிப்பை ஒப்பிடுகையில்.

நான் துல்லியம் ஒரு விசித்திரமான பட்டம் Benford சட்டம் பின்பற்ற உருவாகும் என்று எண்கள் முதல் இலக்கங்கள். ஏன் இப்படி நடக்கிறது? கணினி உருவகப்படுத்துதல் பற்றி ஒரு நல்ல விஷயம் நீங்கள் ஆழமாக தோண்டுவது மற்றும் இடைநிலை முடிவுகளை பார்க்க முடியும் என்று ஆகிறது. உதாரணமாக, விநியோக நமது முதல் உருவகப்படுத்துதல்: ஆர்.வி. எக்ஸ்ப்(ஆர்.வி.), நாம் கேள்வி கேட்க முடியும்: நாம் ஒரு குறிப்பிட்ட முதல் ஐக்கிய பெற எந்த ஆர்.வி. மதிப்புகள் என்ன? பதில் படம் 3a காட்டப்பட்டுள்ளது. குறிப்பு முதல் ஐக்கிய கொடுக்க வேண்டும் என்று ஆர்.வி. உள்ள எல்லைகள் 1 கொடுக்க அந்த விட பெரியவை 9. சுமார் ஆறு மடங்கு பெரிய, உண்மையில், எதிர்பார்த்தபடி. முறை உருவகப்படுத்தப்பட்ட இயற்கை எண்கள் தன்னை மீண்டும் கவனியுங்கள் “மேல் ரோல்” முதல் இலக்கம் இருந்து 9 செய்ய 1 (ஒரு odometer திறக்கும் என).

figure3a
படம் 3a. ஓர் எல்லைகள் பரவியுள்ள (இடையே 0 மற்றும் 10) ஆர்.வி. எக்ஸ்ப் வெவ்வேறு முதல் இலக்கங்கள் ஏற்படுத்தும் என்று சீரற்ற மாறி ஆர்.வி.(ஆர்.வி.). குறிப்பு என்று முதல் ஐக்கிய 1 மீதமுள்ள விட மிகவும் அடிக்கடி ஏற்படுகிறது, எதிர்பார்த்தபடி.

இதே போன்ற போக்கு இரு ரேண்டம் மாறிகள் எங்கள் ஆர்வலராக உருவகப்படுத்துதல் காணலாம். RV1 எக்ஸ்ப் பல்வேறு முதல் இலக்கங்கள் ஏற்படுவதுண்டு தங்கள் கூட்டு வழங்கல்கள் பகுதிகளில்(RV2) படம் 3b காட்டப்படுகின்றன. ஆழமான நீல பெரும் பகுதிகளை கவனிக்க (முதல் ஐக்கிய தொடர்புடைய 1) மற்றும் சிவப்பு பகுதிகளை தங்கள் பகுதியில் ஒப்பிட்டு (முதல் ஐக்கிய க்கான 9).

figure3b
படம் 3b. இரண்டு கூட்டு விநியோகம் பகுதிகளில் பரவியுள்ள (இடையே 0 மற்றும் 10) RV1 எக்ஸ்ப் வெவ்வேறு முதல் இலக்கங்கள் ஏற்படுத்தும் என்று ரேண்டம் மாறிகள் RV1 மற்றும் RV2(RV2).

இந்த பயிற்சியை நான் உருவகப்படுத்துதல் இருந்து பலவற்றிலிருந்தும் சேகரித்து நம்பிக்கை பார்வையை கொடுக்கிறது. முதல் நிலையில் சிறிய இலக்கங்கள் அளவில் காரணம் இயற்கையாக எண்கள் விநியோகம் பொதுவாக ஒரு குறுகியது ஒரு உள்ளது; எண்கள் ஒரு வரம்பு வழக்கமாக உள்ளது, நீங்கள் வரம்பு நெருங்கி என, ஒருவேளை அடர்த்தி சிறிய மற்றும் சிறிய ஆகிறது. நீங்கள் முதல் ஐக்கிய கடந்து 9 பின்னர் மேல் ரோல் 1, திடீரென்று அதன் வீச்சு மிக பெரிய ஆகிறது.

இந்த விளக்கம் திருப்தி போது, ஆச்சரியமான உண்மை இயற்கை வழங்கல்கள் நிகழ்தகவு ஆஃப் tapers எப்படி அது ஒரு விஷயமே இல்லை என்று ஆகிறது. இது கிட்டத்தட்ட மைய எல்லை தேற்றம் போன்ற ஆகிறது. நிச்சயமாக, இந்த சிறிய உருவகப்படுத்துதல் எந்த கடுமையான சான்றை ஆகிறது. நீங்கள் ஒரு கடுமையான சான்றை தேடும் என்றால், நீங்கள் ஹில் வேலை அதை காணலாம் [3].

மோசடி கண்டறிதல்

எங்கள் வரி ஏய்ப்பு பிரச்சனைகள் Benford காரணமாக என்றாலும், முதல் ஐக்கிய நிகழ்வு முதலில் சைமன், அரிஸோனா ஒரு கட்டுரையில் விவரிக்கப்பட்ட [2] கணிதம் அமெரிக்கன் ஜர்னல் ஆஃப் உள்ள 1881. இது பிராங்க் Benford கண்டுபிடித்திருக்கிறார்கள் 1938, அனைவருக்கும் பெருமை (அல்லது பழி, வேலி பக்க பொறுத்து நீங்கள் காண்பீர்கள்) சென்றது. உண்மையில், நம் வரி துயரங்களையும் பின்னால் உண்மையான குற்றவாளி தியோடர் ஹில் இருந்திருக்கும். அவர் 1990 கட்டுரைகள் ஒரு தொடர் வெளிச்சத்திற்கு தெளிவற்ற சட்டத்தை கொண்டு. அவர் கூட ஒரு புள்ளிவிவர ஆதாரம் வழங்கினார் [3] நிகழ்வு.

நமது தனிப்பட்ட வரி பிரச்சனைகள் காரணமாக கூடுதலாக, Benford சட்டம் பல மோசடி மற்றும் முறைகேடு காசோலைகள் ஒரு முக்கிய பங்கை முடியும் [4]. உதாரணமாக, ஒரு நிறுவனத்தின் கணக்கு உள்ளீடுகளை முதல் ஐக்கிய விநியோகம் படைப்பாற்றல் போட்டிகள் வெளிப்படுத்த. ஊழியர் திருப்பி கூற்றுக்கள், அளவு சரிபார்க்க, சம்பளம் புள்ளிவிவரங்கள், மளிகை விலை — எல்லாம் Benford சட்டம் உட்பட்டது. அது கூட சந்தை கையாளுதல் கண்டறிய பயன்படுத்தப்படும் பங்கு விலைகள் முதல் இலக்கங்கள், ஏனெனில், உதாரணமாக, Benford பரவலை வேண்டும். அவர்கள் இல்லை என்றால், நாங்கள் எச்சரிக்கையாக இருக்க வேண்டும்.

தார்மீக

figure4
படம் 4. ஒரு உருவகப்படுத்துதல் உள்ள முதல் மற்றும் இரண்டாவது இலக்கங்கள் கூட்டாக விநியோகிப்பதற்காக, தொடர்பு விளைவுகளை காட்டும்.

கதையின் எளிது: உங்கள் வரி படைப்பு பெற. நீங்கள் பிடிப்பட்டால். நீங்கள் மிகவும் யதார்த்தமான வரி விலக்கு முறை உருவாக்க இந்த Benford விநியோகம் பயன்படுத்த முடியும் என்று நினைக்கலாம். ஆனால் இந்த வேலை கேட்பதற்கே விட கடினமாக இருக்கிறது. நான் அதை பற்றி இல்லை என்றாலும், இலக்கங்கள் இடையே ஒரு தொடர்பு இருக்கிறது. இரண்டாவது இலக்க ஐக்கிய என்ற நிகழ்தகவு 2, உதாரணமாக, முதல் இலக்க ஐக்கிய உள்ளது என்பதை பொறுத்தது. படம் பாருங்கள் 4, இது என் பாவனைகள் ஒரு தொடர்பு அமைப்பு காட்டுகிறது.

தவிர, எஸ் அமைப்பு மிகவும் சிக்கலான இருக்க வாய்ப்பு உள்ளது. உதாரணமாக, அவர்கள் இது போன்ற நரம்பியல் வலையமைப்புகள் அல்லது ஆதரவு திசையன் இயந்திரங்கள் ஒரு மேம்பட்ட தரவு சுரங்க அல்லது அமைப்பு அங்கீகாரம் அமைப்புகள் பயன்படுத்தி இருக்க முடியும். எஸ் பெயரிடப்பட்ட என்று தரவு ஞாபகம் (தோல்வியுற்றார் ஏமாற்ற முயன்ற அந்த வரி, நல்ல குடிமக்கள் அந்த) மற்றும் அவர்கள் எளிதாக வரி ஏய்ப்பாளர்கள் அரும்பி பிடிக்க வகைப்படுத்தி திட்டங்கள் பயிற்சியளிக்க முடியும். அவர்கள் இன்னும் இந்த அதிநவீன முறை அங்கீகாரம் வழிமுறைகள் பயன்படுத்தி இல்லை என்றால், என்னை நம்புங்கள், அவர்கள், இந்த கட்டுரை பார்த்து. வரிகளை வரும் போது, அதை நீங்கள் எதிராக அடுக்கப்பட்ட ஏனெனில் சீரற்ற எப்போதும் நீங்கள் முட்டாளாக்கும்.

ஆனால் தீவிரமாக, Benford சட்டம் நாம் விழிப்புடன் இருக்க வேண்டும் என்று ஒரு கருவி. நாம் எண் தரவு அனைத்து வகையான நம்பகத்தன்மையை சந்தேகித்து கண்டுபிடிக்க போது அது எதிர்பாராத வழிகளில் எங்கள் உதவி வரலாம். சட்டத்தின் அடிப்படையில் ஒரு காசோலை செயல்படுத்த எளிதாக மற்றும் மீறும் கடினமாக உள்ளது. அது எளிய மற்றும் மிகவும் உலகளாவிய. அப்படி, தான் Benford அடிக்க முயற்சி வேண்டாம்; அதற்கு பதிலாக அவரை சேர வேண்டும்.

குறிப்புகள்
[1] Benford, எஃப். “அசாதாரண எண்கள் சட்டம்.” ப்ரோக். அமர். பில். சாக். 78, 551-572, 1938.
[2] அரிஸோனா, எஸ். “இயற்கை எண்கள் இலக்கங்கள் பாவனை அதிர்வெண் குறிப்பு.” அமர். ஜே. கணித. 4, 39-40, 1881.
[3] மலை, டி. பி. “குறிப்பிடத்தக்க இலக்கம் சட்டம் ஒரு புள்ளிவிவர வந்ததன்.” மாநிலம். நவீன அறிவியல். 10, 354-363, 1996.
[4] Nigrini, எம். “நான் உங்கள் எண் கிடைத்தது.” ஜே. கணக்குப்பதிவியல் 187, பக். 79-83, கூடும் 1999. http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm.

Photo by LendingMemo

Comments