خوشه بندی سلسله مراتبی و شناسایی مشتری

دانلود پایان نامه
این مدل نیاز به یک مجموعه داده آموزش (دارای برچسب) دارد. این مدل مناسب بانک‌هایی است که دارای مجموعه داده سوابق مربوط به پولشویی باشند. یعنی داده قبل از اینکه مورد کاوش قرار گیرد در یک ساختار مناسبی قرار دارد[34].
رویکرد‌های هیبرید بر روی داده‌‌های برچسب دار
این رویکرد مشابه رویکرد قبلی با در نظر گرفتن ساختار داده، است. مهمترین تفاوت با رویکرد قبلی به کار گرفتن تکنیک‌‌های چندگانه برای افزایش دقت سرتاسر فرآیند می باشد. این رویکرد نیاز مند تجارب قبلی بانک در تشخیص موارد پولشویی می باشد.
روش‌های غیر نظارت شده:
این رویکرد مناسب بانک‌هائی فاقد هرگونه روش بازنگری داده می باشد.این بدان معنی است که این بانک‌ها هیچگونه مجموعه داده آموزش ندارند. با توجه به اینکه بانک‌های ایران معمولا با کمبود سابقه در کشف موارد پولشویی، مواجه هستند، نمی توان از رویکرد‌‌هایی که نیازمند مجموعه داده آموزشی هستند، استفاده نمود[15] .
از مباحث ذکر شده نتیجه‌گیری می‌شود که در فرآیند پولشویی به دو حالت کلی با موضوع برخورد میشود، اول اینکه مواردی از پولشویی که در گذشته اتفاق افتاده به عنوان مشاهدات قبلی یا همان برچسب برای آموزش الگوریتم‌های داده‌کاوی مورد استفاده قرار میگیرد و با توجه به وجود مواردی در گذشته به ناچار این موارد میبایست شناسایی گردد تا بتوان از الگوریتم‌های نظارت شده نیز استفاده نمود. نوع دیگر الگوریتم‌هایی که در فرآیند شناسایی افراد مشکوک به پولشویی میتواند مورد استفاده قرار گیرد، الگوریتم‌های بدون ناظر میباشد که به دلیل نداشتن نمونه و مشاهدات قبلی به عنوان برچسب و هدف برای الگوریتم این روش‌ها به نام بدون ناظر شناخته میشوند.
الگوریتم‌های نظارت‌شده
روش‌هایی که بر اساس مشاهدات قبلی عمل مینماید و حتماً مقدار برچسب آن‌ها مشخص می‌باشد.
الف. درخت تصمیم:
یکی از روش‌های مورد استفاده در شناسایی رول‌ها و در نهایت شناسایی مشتریان مشکوک میباشد. در این پروژه با توجه به عدم دسترسی به سایر اطلاعات مشتریان از درخت‌های تصمیم استفاده نخواهد شد.
ب. شبکه‌‌های عصبی .
این روش نیز مورد مطالعه قرار گرفت و علاوه بر فاز بدون ناظر در الگوریتم خوشه‌بندی کوهنن نیز از آن استفاده خواهد گردید.
الگوریتم‌های بدون ناظر
این روش‌ها بیشترین استفاده را در سیستم‌های ضد پولشویی دارند و به همین دلیل بررسی جامعتری روی آن‌ها انجام خواهد شد.
الف. خوشه بندی با استفاده از. K-means
یک از الگوریتم‌های متداول برای خوشه بندی داده‌‌ها که مورد بررسی قرار می‌گیرد و باید نمونه‌‌های آزمایشی آن اجرا گردد و در بخشی از مدل کارایی دارد.
ب. خوشه‌بندی با استفاده از EM.
ج. خوشه بندی با استفاده از گروه متناظر.
د. خوشه بندی سلسله مراتبی .
برخی تحقیقات مرتبط
در دو دهه گذشته، داده‌کاوی، شبکه‌‌های عصبی، الگوریتم‌‌های ژنتیکی، و غیره به طور گسترده ای برای مدل‌سازی مالی مورد استفاده قرار قرار گرفته‌اند. با این حال، تحقیقات کمی در استفاده از این روش‌‌ها در زمینه تشخیص الگو‌های پولشویی وجود دارد.
نویسندگان در [47] بیان داشته‌اند، درخت تصمیم یکی از پرکاربردترین روشهای استنباط استقرایی از سال 1960 تا کنون است. در این مقاله روش درخت تصمیم برای تعیین میزان ریسک پولشویی، بر اساس مشخصات مشتری بکار گرفته شده است. بدین صورت که یک نمونه 28 تایی با چهار مشخصه برای القای یک درخت تصمیم بکار گرفته شده است. نتایج، کارایی درخت تصمیم را در ساختن قواعد ضدپولشویی از مشخصات گروه های مشتریان نشان می دهد. رویکرد مقاله به روش درخت تصمیم برای تفکیک مشتریان بدین صورت است که،
برنامه”شناخت مشتری” دریکی از بانک های چین برای شناسایی افرادی که از بانک ها)محصولات و خدمات بانکی( برای پولشویی استفاده می کنند، اجرا شده است.