مطالعات توصیفی و اعمال مجرمانه

دانلود پایان نامه

بررسی داده‌‌ها با کمک شاخص‌ها
با توجه به اهمیت شاخص‌ها در سیستم‌های مبتنی بر داده‌کاوی پس از تعریف و پیاده سازی یک شاخص با هدف شناسایی افراد مشکوک طبق مراحل زیر عمل نمودیم. به این منظور شاخص پولشویی طراحی و اجرا گردید.
(‏4 ‌.‌1 )
(‏4 ‌.‌2 )
در مورد روش محاسبه این شاخص(1.4)، (2.4) اعداد زیر به این شرح تعریف گردید: مجموع پول نقد ورودی، مجموع پول غیر نقد ورودی، مجموع پول نقد خروجی، مجموع پول غیر نقد خروجی که با تلفیق این اعداد و طبق محاسبات مذکور شاخص پولشویی محاسبه گردید. شاخص (1.4) که در حقیقت نوعی میانگین هندسی از تلفیق منطقی مشخصات مشتریان در جهت شناسایی فرایند رفتار پولشویی حاصل شده است و مقدار آن عددی بین صفر و یک است که هرچه بیشتر بودن آن نشان دهنده ریسک بالاتر پولشویی و مشکوک تر بودن آن مشتری است. شاخص (1.4) پس از اجرا بر روی داده‌‌ها از یک توزیع نامتوازن برخوردار میباشد(شکل ‏41 توزیع شاخص MLI ).

شکل ‏4 1 توزیع شاخص MLI
همانطور که مشاهده میشود این شاخص یک توزیع با چولگی از راست میباشد و میتوان مواردی را که در منتهی علیه سمت راست هستند به عنوان بالاتر از کران در نظر گرفت و گزارش نمود (شکل ‏41 توزیع شاخص MLI ). به همین دلیل با جذر گرفتن آنرا به توزیع نرمال تبدیل نموده و مقادیر با میزان انحراف معیار بالاتر را به عنوان مقادیر مشکوک گزارش نمودیم(شکل ‏42 ).

شکل ‏4 2 توزیع شاخص MLISQR
با توجه به اینکه سطح معناداری در آزمون‌های Shapiro-Wilk و kolmogorov-smirnov بیشتر از 0.05 می‌‌باشد می‌توان داده‌ها را با اطمینان بالایی نرمال فرض کرد و با استفاده از قوانین یک توزیع نرمال آنرا آنالیز نمود. میدانیم:
(‏4 ‌.‌3 )
(‏4 ‌.‌4 )
داده‌‌های پرت را بر همین اساس استخراج می کنیم. نقطه بحرانی را مشاهدات محاسبه می کنیم پس داده‌‌های مشکوک، از نظر ما آن مشتریانی هستند که شاخص پولشویی(4.2) برای آن‌ها بیش از این آستانه باشد(4.4).
فیلترینگ و جداسازی اطلاعات مناسب
پس از انجام مراحل فوق با توجه به محاسبۀ شاخص پولشویی می‌توان با استفاده از فیلتر نمودن داده‌‌ها مواردی که بالاتر از آستانه محاسبه شده باشند را مشخص نمود. این گزارش در کنار گزارشات دیگر برای بررسی در اختیار بازرسان بانک قرار میگیرد.
تفکیک داده‌‌های خیلی غیر عادی
بعد از آمایش داده‌‌ها بلافاصله در خلال مطالعات توصیفی و بصری مشاهدات می توان ملاحظه کرد که بعضی ازمشتریان در بعضی مشخصه‌‌های حیاتی حسابشان رفتار‌های خیلی غیر عادی داشته اند که البته تعدادشان بسیار اندک است ولی می توان همین موضوع را پارامتری بررسی کرد و صرفنظر از هرگونه شاخص یا الگوریتم خاصی، این افراد را جداسازی کرد در لیست نهایی قرار داد. به عنوان مثال در شکل نمودار جمع واریز نقدی کل مشتریان آورده شده که تعدادی که سمت راست خط قرمز قرار دارند می توانند غیر عادی درنظر گرفته شوند(شکل ‏43 ).

این مطلب مشابه را هم بخوانید :   جنبه های فیزیولوژیک و محصولات کشاورزی

شکل ‏4 3 نمودار واریز نقدی مشتریان
در این قسمت همچنین داده‌‌های مربوط به افرادی که گردش مالی آن‌ها از یک حداقلی کمتر باشدحذف می‌شوند. این افراد کم درآمد قاعدتا ازرش برسی ندارند چراکه اولا اگر هم درآمدی از اعمال مجرمانه داشته باشند بسیار ناچیز است، ثانیا رفتار‌های متنوع آن‌ها ممکن است باعث پیچیدگی بی مورد و گمراه شدن الگوریتم شود. البته این کار در تمام کشور‌ها مرسوم است زیرا هدف اولیه در بررسی پولشویی، جدا کردن ” دانه درشت‌‌ها ” است.
وقتی کم درآمد‌ها را از انبوه داده‌‌ها خارج می کنیم معمولا حجم داده‌‌ها را تا 73 % کاهش می دهیم، بنا براین بعد از این در تمام مراحل الگوریتم، تحلیل‌‌ها روی 13 % باقیمانده انجام می شود. در شکل زیر نمودار جمع واریز نقدی مشتریان بعد از حذف خیلی غیرعادی‌‌ها و کم درآمد‌ها آورده شده است که می خواهیم ادامه کاوش خود را بر روی این داده‌‌ها انجام دهیم.
تفکیک بر اساس شاخص پولشویی