فن آوری اطلاعات و روش های گردآوری

دانلود پایان نامه

داده های هواشناسی.
جامعه آماری, روش نمونه گیری و حجم نمونه
جامعه ی آماری این تحقیق، 1.135.237 رکورد از بانک داده مرکز سامانه مدیریت شهری 137 شهرداری تهران می باشد که هر رکورد نمایانگر یکی از موضوعات و مشکلات شهری منعکس شده از سوی شهروندان در طول سال 1389 می باشد.
از آن جایی که داده های جمعیتی، آب و هوایی و بودجه ای مناطق در طول سال مورد بررسی در بانک داده سامانه 137 ثبت و نگهداری نشده است، لذا داده های مذکور با مراجعه به سایت های مربوطه استخراج و ذخیره گردید.
با توجه به این که نتایج داده کاوی با داشتن داده های بیشتر از صحت بالاتری برخوردار می شوند، بنابراین نمونه گیری در خصوص این جامعه آماری صورت نگرفته است و تمامی داده ها به جز داده های پرت و داده های ناقص مورد استفاده قرار گرفته است.
روش گردآوری اطلاعات و ابزار سنجش
گردآوری داده های اصلی این پژوهش از طریق مراجعه حضوری به مرکز سامانه مدیریت شهری 137 شهرداری تهران و در اختیار گرفتن برشی از بانک اطلاعاتی این سامانه در مقطع یک سال و مصاحبه با کارشناسان محترم معاونت فن آوری اطلاعات مرکز مدیریت شهری137 که متولی امر پیاده سازی این سامانه از ابتدا و نظارت بر حسن اجرای نرم افزار این سامانه و ارزیابی عملکرد و تهیه گزارش های آماری مرتبط در حال حاضر هستند صورت گرفته است.
هم چنین مطالعات کتابخانه ای، شامل جستجوی مقالات و پایان نامه های با موضوع مشابه، مطالعه کتاب های مرتبط در زمینه ی داده کاوی و نیز شرکت در سمینارهای مرتبط با داده کاوی از جمله روش های گردآوری اطلاعات در بخش ادبیات موضوع بوده است.
نوع داده ها و مقیاس آن ها
نوع و مقیاس داده های این تحقیق به شرح ذیل می باشد:
رکوردهای مربوط به جدول پیام ها یا همان تماس های مشتریان شامل 12 فیلد می شد که اکثراً از نوع اسمی (رشته ای) بود که در مرحله آماده سازی داده ها مقادیر عددی فیلدهای مورد نظر از طریق اضافه شدن ستون های جدید به انتهای جدول ایجاد گردید.
رکوردهای مربوط به جداول جمعیت، بارندگی و اعتبار مصوب همگی از نوع عددی می باشند.
شرح دقیق فیلدهای اطلاعاتی در هر جدول در فصل بعد آورده شده است.
ساختار اجرایی تحقیق
همان طور که در ابتدای این فصل بیان شد، ماهیت تحقیق، داده محور می باشد و پایه اصلی تحقیق حاضر برکشف دانش از پایگاه های داده شهرداری تهران بنا نهاده شده است. از این رو استاندارد جهانی CRISP-DM جهت انجام فرایند تحقیق مورد استفاده قرار گرفته است که در این بخش ساختار اجرایی تحقیق بر اساس مراحل این استاندارد تشریح شده است.
درک مساله کسب و کار
در این مرحله گام های زیر دنبال شده است که جزئیات آن در ادامه بیان گردیده است:
تعیین اهداف کسب و کار
ارزیابی موقعیت
تعیین اهداف داده کاوی
در این فاز، ابتدا اهداف کسب و کار تعیین و تبیین گردید که اصلی ترین هدف کسب و کار، به کارگیری تکنیک های مختلف داده کاوی نظیر Clustering، Classification، Association Rules و … بر روی اطلاعات سامانه 137 و بررسی و تحلیل نتایج به دست آمده به منظور ارتقای کیفیت خدمات شهری.
گام بعدی که در این مرحله انجام شده است تعیین اهداف داده کاوی تحقیق است که به طور کاملاً روشن می توان گفت که نوع داده کاوی، هم از نوع پیش بینی کننده و هم از نوع تشریح کننده می باشد.
درک داده ها
در این مرحله گام های زیر دنبال شده است که جزئیات آن در ادامه بیان شده است:
جمع آوری داده های اولیه
توصیف داده ها