برچسب گذاری و شبکه عصبی

دانلود پایان نامه

شکل ‏4 10 خوشه‌بندی توسط کامینز، کوهنن، گروه متناظر
به منظور تشخیص داده‌‌های آنومالی در خوشه بندی گروه متناظر سه مدل مختلف با توجه به صفات ورودی اجرا گردید. در این مدل 5 صفت به عنوان ورودی به مدل داده شد که شامل مجموع برداشت نقدی از حساب، مجموع برداشت غیر نقدی از حساب، مجموع واریز نقدی به حساب، مجموع واریز غیر نقدی به حساب و شاخص پولشویی(که از توزیع نرمال برخوردار است) می‌‌باشد.
هدف از اجرای این مدل شناسائی آنومالی در داده‌‌ها میباشد و در شکل زیر نتیجه اجرا مدل به تفکیک گروه‌‌ها مشخص می‌باشد. مشخصات هر خوشه و تعداد داده‌‌های غیر متعارف در هر خوشه ذکر شده و میتوان از کل این اطلاعات یک گزارش برای بررسی بیشتر تهیه و در اختیار بازرسان بانک قرار داد(شکل ‏411 ).

شکل ‏4 11 خوشه بندی گروه متناظر مدل اول
مدل بعدی که با همین الگوریتم پیاده سازی گردید از صفات بیشتری بهره می‌برد و شاخص‌‌های ورودی به ترتیب زیر می‌باشد: تعداد برداشت‌های غیر نقدی از حساب، تعداد واریز‌های نقدی به حساب، تعداد برداشت‌های نقدی از حساب، تعداد واریز‌های غیر نقدی به حساب و مواردی که در مدل قبل نیز بیان شد یعنی: مجموع برداشت نقدی از حساب، مجموع برداشت غیر نقدی از حساب، مجموع واریز نقدی به حساب، مجموع واریز غیر نقدی به حساب و شاخص پولشویی.
تعداد خوشه‌‌ها با توجه به انتخاب اولیه همان 4 خوشه می‌باشد اما با توجه به تغییر ورودی‌‌ها نتایج بدست آمده متفاوت می‌باشد (شکل ‏412 ). پس از ساخت مدل بعدی نتایج هر سه مدل به یکی از کارشناسان بازرسی در بانک ارائه میگردد و هر مدلی‌که نتایج بهتری نسبت به بقیه ایجاد نماید میتواند به عنوان الگوی دائمی برای تولید گزارش‌های روزانه مورد استفاده قرار گیرد.

شکل ‏4 12 خوشه بندی گروه متناظر مدل دوم
مدل سوم با تغییر اندکی نسبت به مدل دوم تهیه و با ورودی‌‌های مقابل ایجاد گردید: تعداد برداشت‌های غیر نقدی از حساب، تعداد واریز‌های نقدی به حساب، تعداد برداشت‌های نقدی از حساب، تعداد واریز‌های غیر نقدی به حساب، مجموع برداشت نقدی از حساب، مجموع برداشت غیر نقدی از حساب، مجموع واریز نقدی به حساب، مجموع واریز غیر نقدی به حساب فرق این مدل با مدل قبلی حذف شاخص پولشویی به عنوان یک ورودی میباشد و نتایج اجرا به ترتیب شکل می‌باشد(شکل ‏413 ).نتایج این مدل نیز کاملاً مشخص میباشد و گزارش آن توسط کارشناسان آشنا با پولشویی بررسی خواهد گردید.

شکل ‏4 13 خوشه‌بندی گروه متناظر مدل سوم
نتایج حاصل از هر مرحله را میتوان بر اساس شاخص پولشویی مرتب نمود و مواردی که شاخص آن‌ها میزان بالاترینسبت به کل داده‌‌ها دارد را به عنوان موارد مشکوک اعلام میدارد. با توجه به قابلیت این مدل‌ها در شناسایی الگو‌های پیچیده نسبت به الگو‌های خطی که با کمک شاخص‌ها استخراج میگردد میتوان گفت که تلفیق این دو روش اجماع خوبی روی داده‌‌ها ایجاد خواهد نمود.
خوشه بندی با استفاده از کوهنن و کا مینز
در این قسمت خوشه بندی توسط دو الگوریتم کوهنن و کامینز که در فصل 2 در مورد آن‌ها توضیح داده شد پیاده سازی گردید و پس از خوراندن به عنوان برچسب به شبکه عصبی نتایج این دو با یکدیگر مقایسه گردیده است.
همانطور که در شکل می بینیم قبل از ورود تمام داده‌‌هایی که توسط شاخص خطی جدا گردیده اند به این دو مدل در ابتدا توسط خوشه بندی بر اساس پارامتر‌های واریز (جمع واریز نقذی و غیر نقدی)، برداشت (جمع برداشت نقدی و غیر نقدی) ،تعداد واریز( جمع تعداد واریز نقدی و غیر نقدی) و تعداد برداشت(جمع برداشت نقدی و غیر نقدی) که به خوبی بیانگر رفتار مشتریان می‌باشد آن خوشه که تعلق به اکثریت مشتریان دارد (کادر سبز رنگ) را کنار گذاشته و ادامه مدل را بر روی سایر خوشه‌‌ها دنبال می‌کنیم(شکل ‏414 ).

این مطلب مشابه را هم بخوانید :   سفارشی سازی خدمات و مشتریان شعب بانک

شکل ‏4 14 جدا کردن خوشه اکثریت
در ادامه همانطور که در شکل می بینیم در این دو روش نیز مانند روش خوشه بندی گروه‌‌های متناظر، از سه مدل مختلف برای خوشه بندی استفاده گردیده است و پارامتر‌ها وروی هر مدل نیز همان صفات ذکر شده در سه مدل گروه متناظر می‌باشد(شکل ‏415 ).

شکل ‏4 15 خوشه‌بندی توسط کامینز و کوهنن
در هر مدل گروه‌‌ها را تحلیل کرده و خوشه‌‌های مشکوک را شناسائی می کنیم. پس از اتصال نتایج هر سه مدل الگوریتم توسط گره الحاق، یکبار دیگر توسط گره انتخاب مواردی که شاخص پولشویی آن‌ها بالاتر از آستانه است را انتخاب نموده و به عنوان مشکوک برچسب گذاری نموده و بقیه را به عنوان غیر مشکوک برچسب گذاری می کنیم. با توجه به اینکه داده واقعی در مورد موارد پولشویی در دسترس نیست از این جدول به عنوان برچسب برای فاز بعدی که الگوریتم نظارت‌شده (شبکه عصبی) است استفاده می کنیم. در صورتی که بر روی این خروجی یک مرحله از خبرگی و بررسی بازرسان بانک انجام شود مسلما خروجی بسیار بهتری استنتاج خواهد شد. در ضمن مواردی وجود دارد که در مدل‌‌های مختلف به عنوان مشکوک شناسائی شده و به همین دلیل قبل از جدول خروجی از عملگر موارد مجزا استفاده می کنیم. به صورت حتم درجه مشکوک بودن به چنین مواردی به مراتب بالاتر از سایر موارد می‌باشد.