نرم افزار و خوشه‌بندی

دانلود پایان نامه

حال با توجه به حجم داده‌‌ها و اینکه چند درصد از کل افراد را می توان با ریسک پولشویی بالا مشخص تا معقول و قابل بررسی باشند، آن افراد از جامعه را که دارای مقدار شاخص پولشویی بالاتر از آستانه هستند را به عنوان مشکوک در لیست نهایی قرار می دهیم. در شکل قسمتی از مراحل داده‌کاوی را که مربوط به تشکیل این شاخص می شود، مشخص شده است (شکل ‏44 ).

شکل ‏4 4 مراحل ایجاد شاخص MLISQR


درشکل قسمتی از جدول داده‌‌های تفکیک شده بر اساس شاخص پولشویی نمایش داده شده است به دلیل مسائل محرمانگی شماره مشتری در شکل‌‌ها محو خواهد گردید(شکل ‏45 ).

شکل ‏4 5 جدول داده‌‌های تفکیک شده بر اساس شاخص پولشویی(MLISQR)
فیلتر داده‌‌های غیر عادی (بدست آمده از خوشه بندی) به وسیله شاخص پولشویی
داده‌‌هایی که الگوریتم خوشه بندی به عنوان خروجی غیرعادی برگردانده است، ممکن است به دلایلی غیر از پولشویی، تفکیک شده باشند، ولی همان غیرعادی بودنشان کافی است تا آن‌ها را مجددا بررسی کنیم. لذا کافی است از بین آن‌هایی که الگوریتم غیرعادی بودنشان را نشان می‌دهد آن افرادی را که در عین حال مقدار شاخص پولشویی آن‌ها از آستانه فراتر است را به لیست نهایی اضافه کنیم. البته این افراد با افرادی که صرفا از روی شاخص پولشویی مشخص شده بودند اشتراک دارد که شاید بتوان اشتراکات را به عنوان مهمترین‌‌ها برای بررسی در اولویت قرار داد.
خوشه بندی
برای خوشه بندی از 4 روش استفاده گردید . یکی با هدف شناسایی داده‌‌های نامتعارف که در نرم افزار وکا با استفاده از الگوریتم ای ام پیاده سازی گردید، دومی با هدف شناسایی داده‌‌های پرت که از الگوریتم گروه متناظر استفاده شد. همچنین دو الگوریتم کامینز و کوهنن نیز جهت یافتن کلاس‌‌های مشکوک و مقایسه دو الگوریتم با یکدیگر پیاده سازی گردید. نتایج تمام موارد به تفضیل ذکر می‌گردد
خوشه‌بندی با استفاده از ای ام
به صورت استثناء روش خوشه بندی ای ام با استفاده از نرم افزار وکا صورت گرفت و در این قسمت به جزئیات آن می‌پردازیم.
برای خوشه بندی ای ام از4 صفت به عنوان ورودی استفاده گردید. این ورودی‌ها به ترتیب بدین ترتیب میباشد: مجموع مبالغ واریز و برداشت به حساب شخص و همینطور تعداد واریز و برداشت. همانطور که در شکل مشخص است خوشه 1 هیچگونه تشابهی با دیگر خوشه‌‌ها ندارد و میتوان افراد این خوشه را به عنوان آنومالی در کل داده‌‌ها در نظر گرفت(شکل ‏46 هیستوگرام مجموع واریز در خوشه‌بندی ای‌ام )، (شکل ‏47 هیستوگرام مجموع برداشت در خوشه بندی ای‌ام )، (شکل ‏48 هیستوگرام تعداد واریز در خوشه بندی ای‌ام )، (شکل ‏49 هیستوگرام تعداد برداشت در خوشه بندی ای‌ام )(شکل ‏46 )، (شکل ‏47 )، (شکل ‏48 )، (شکل ‏49 ).

این مطلب مشابه را هم بخوانید :   معامله به معنای خاص و معامله به معنای اعم

شکل ‏4 6 هیستوگرام مجموع واریز در خوشه‌بندی ای‌ام

شکل ‏4 7 هیستوگرام مجموع برداشت در خوشه بندی ای‌ام

شکل ‏4 8 هیستوگرام تعداد واریز در خوشه بندی ای‌ام

شکل ‏4 9 هیستوگرام تعداد برداشت در خوشه بندی ای‌ام
خوشه بندی با استفاده از گروه متناظر
گفتیم که در این مرحله از 3 الگوریتم گروه متناظر (برای تشخیص داده‌‌های پرت)، الگوریتم کا مینز و الگوریتم کوهنن(که در فصل دوم بدانها اشاره گردید) استفاده کردیم که در ادامه به جرئیات آن خواهیم پرداخت.در شکل یک شمای کلی از این سه الگوریتم که هر کدام توسط سه مدل(با پارامتر‌های ورودی متفات) پیاده سازی گردیده اند مشاهده می‌کنید(شکل ‏410 ).