پایگاه اطلاعات و ارزیابی عملکرد

دانلود پایان نامه

مرحله اولیه: گردآوری وایجاد پایگاه اطلاعاتی(تا دهه 1960)
مرحله دوم : نظام‌های مدیریتی مبنی بر پایگاه اطلاعاتی(دهه1970 واوایل دهه 1980)
مرحله سوم : نظام‌های پایگاه اطلاعاتی پیشرفته (اواسط دهه 1980 تازمان حاضر)
مرحله چهارم : انبارش اطلاعات وداده کاوی (اواخر دهه 1980 تا به امروز)
مرحله پنجم : نظام پایگاه اطلاعاتی مبنی برشبکه (دهه 1990 تا کنون)
مرحله ششم : نسل نوین نظام‌های اطلاعاتی یکپارچه شده(از 2000 به بعد)
بدین ترتیب فعالیتی که از دهه 1960 شروع شده بود در دهه 1990 گام‌های بلندی برداشت وانتظار میرود در این قرن به رشد و بالندگی خود ادامه دهد[4].
چارچوبی کلی برای الگوریتم‌های داده‌کاوی
هر چند الگوریتم‌های داده‌کاوی بسیاری برای کشف تقلب مورد استفاده قرار گرفته‌اند، اما کاربرد آن‌ها، همچنان از چهارچوب سنتی داده‌کاوی یعنی انتخاب ویژگی، نمایندگی، گرداوری و مدیریت داده‌‌ها، پیش‌پردازش، داده‌کاوی، پس‌پردازش و ارزیابی عملکرد پیروی می‌کند.
استانداردهای وضع شده در این زمینه، به جنبه های گوناگون و ابعاد مختلف کاربردهای داده کاوی اشاره دارند. از استانداردهای وضع شده برای فرآیند داده کاوی که در این پروژه از آن استفاده شده است استاندارد کریسپ دی‌ام می‌باشد که در ادامه به شرح آن می‌پردازیم(شکل ‏21 ).

شکل ‏2 1 مدل CRISP-DM
بر اساس این استاندارد، فرایند حل مسئله با کمک داده‏کاوی در شش مرحله و در تعامل با کارفرما صورت می گیرد.
کارفرما مشکلی در کسب و کار خود دارد. مشکل خود را با متخصص داده‏کاوی مطرح می کند. این گام اول است. در حالت دیگر، کارفرما نمی تواند مشکلات کسب و کار خود را تشخیص دهد اما می داند سیستم کسب و کار وی دارای نقصان است. در این حالت طرح مسئله را نیز بر عهده ی متخصص داده‏کاوی می گذارد.
متخصص داده‏کاوی، داده‌های ثبت شده در کسب و کار کارفرما را از وی درخواست می کند و به بررسی داده‌ها می پردازد. متخصص داده‏کاوی با توجه به حجم و کیفیت داده‌ها مسئله ی طرح شده در مرحله ی قبل را تعدیل می کند تا نتیجه ی پروسه ی داده‏کاوی واقع بینانه تر بشود.
در مرحله ی سوم عملیات آماده سازی داده‌ها توسط متخصص داده‏کاوی صورت می گیرد. آماده سازی داده ها شامل این موارد می شود:
یکی کردن انبارهای متفاوت داده در کسب و کار کارفرما
شناسایی و حذف داده های پرت و اشتباه
تغییر فرمت داده ها متناسب با مسئله ی تعدیل شده در مرحله ی دوم
قدم چهارم مدلسازی داده های آماده سازی شده است. با توجه به متدهای متفاوت، مدل های متفاوتی ساخته می شود و بهترین مدل ها از نظر متخصص داده‏کاوی انتخاب می شود.
مدل های ساخته شده ارزیابی می شوند و بهترین مدل از نظر مسئله ی طرح شده در مرحله ی یک، انتخاب می شود. سپس در تبادل نظر با کارفرما، موثر بودن مدل انتخاب شده بررسی می شود. در صورتی که مدل انتخاب شده کمکی در حل مسئله نمی کند کل فرایند از مرحله ی یک دوباره انجام می شود.
در صورتی که ارزیابی ها رضایت بخش باشند راه حل‌هایی در قالب توسعه ی مدل نهایی ارائه می شوند که مشکلات مطرح شده در مرحله ی یک را برطرف می کنند. مدل نهایی به متخصص داده‏کاوی نشان می دهد که رفتار مجموعه ی کسب و کار کارفرما در مورد مشکلات مطرح شده در مرحله ی یک چگونه است. این درک از رفتار کسب و کار، در قالب راه حل‌های عددی و چند فرمول یا راهکار عملی در اختیار کارفرما قرار می گیرد تا مشکلات مطرح شده در مرحله ی یک رفع گردد. همچنین متخصص داده‏کاوی می تواند در قالب گزارشات مستند مکانیزم رفتاری کسب و کار کارفرما را برای وی تشریح کند.[1]
کاربرد داده‌کاوی در کشف تقلبات مالی