معرفی رشته آمار

هدف

هدف تربیت افرادی است كه بتوانند:

الف ) به عنوان كارشناس آمار در سازمانها و ادارات به تجزیه و تحلیل اطلاعات آماری بپردازند. 
ب ) تمام درسهای آمار و احتمال را در مدارس تدریس نمایند. 
ج ) تحصیلات خود را در سطح كارشناسی ارشد و دكترا ادامه بدهند. 


فارغ‌التحصیلان می‌توانند


الف ) در مسایل ساده آماری به منظور رفع نیاز موسسات صنعتی، اقتصادی، اجتماعی ، كشاورزی، مراكز درمانی و غیره به مدلسازی بپردازند. 
ب ) مفاهیم آماری را درك نموده و به تجزیه و تحلیل اطلاعات بپردازند. 
ج ) با تحلیل اطلاعات به برنامه‌ریزی صحیح و علمی بپردازند. 
د ) از بسته‌های آماری رایانه‌ای به منظور توصیف داده‌ها و انجام استنباط آماری استفاده نمایند.

معرفی علم آمار به زبان ساده، پیشگویی بر اساس اعداد و ارقام است. به عبارت دیگر یك آماردان می‌تواند بر اساس مجموعه اطلاعات عددی و بر مبنای مدل‌های ریاضی و مدل‌های نظریه احتمال، پیشگویی كند. یعنی به یاری اطلاعات گذشته، نحوه رفتار یك فرآیند را پیش‌بینی نماید. از همین رو می‌توان گفت كه علم آمار نتیجه‌گیری از جزئیات و یا رسیدن از جزء به كل می‌باشد. 
كار علم آمار كمك به تفكر علمی است و آمارشناس كسی است كه مشاهده می‌كند و اطلاعاتی به دست می‌آورد و سپس اطلاعات به دست آمده، اتفاقات و حوادث را پیش‌بینی می‌كند. 
علم آمار براساس اطلاعات و داده‌های موجود به مدل‌سازی ریاضی از پدیده‌های طبیعی و واقعی می‌پردازد. و چون امروزه دانشمندان هر علمی سعی می‌كنند از ابراز ریاضی برای مطالعات خود استفاده نمایند در نتیجه علم آمار برای بررسی و مطالعه مسائل دنیای واقعی به یاری مدل‌سازی ریاضی، بسیار مورد توجه قرار گرفته است.


توانایی‌های مورد نیاز و قابل توصیه 

قوی بودن در علم ریاضی برای موفقیت در رشته آمار ، امری ضروری است چون مباحثی كه در علم آمار مطرح می‌شود با ریاضیات ارتباطی تنگاتنگ دارد. قدرت درك علمی مسایل آماری و تجزیه و تحلیل احتمالی مطالب نیز ضروری است. 
علاوه بر دانشجویان، اساتید رشته آمار نیز معتقد هستند كه دانشجویان این رشته باید در دروس ریاضی قوی باشند و حتی در یك نظرخواهی از 12 استاد رشته آمار دانشگاههای مختلف كشور، 10 تن از اساتید به اهمیت بسیار علم ریاضی در آمار اشاره كرده‌اند. دانشجوی این رشته باید توانایی و ابتكار در تجزیه و تحلیل و حل مسائل ریاضی داشته و به آموزش و یادگیری علوم كامپیوتر علاقه‌مند باشد. 
وقتی می‌گوئیم كه ریاضیات در این رشته حرف اول را می‌زند پس باید دانش‌آموزان قوی ریاضی فیزیك وارد این رشته بشوند. اما چون در نظام قدیم متوسطه ، آمار یكی از درسهای دانش‌آموزان علوم انسانی بوده است، دانش‌آموزان رشته ریاضی تصور می‌كنندكه رشته آمار بیشتر به علوم انسانی برمی‌گردد و به همین دلیل هنگام پركردن فرم انتخاب رشته، رشته آمار را به عنوان یكی از اولویت‌های آخر خود انتخاب می‌كنند.
همچنین از دیدگاه دانشجویان فوق علاقه‌ به رشته آمار، قدرت تجزیه و تحلیل خوب ، صبر و حوصله ، پشتكار و تلاش ،‌ آشنایی با كامپیوتر و علاقه به تحقیق و پژوهش برای دانشجویان این رشته ضروری است. 


نكات تكمیلی

چندی پیش مجله Science به دنبال یك نظرخواهی از دانشمندان علوم مختلف 20 كشف و اختراع مهم قرن بیستم را معرفی كرد. كه در میان این اختراعات و اكتشافات علم آمار نیز پس از اختراعات مهمی مثل ترانزیستور و كامپیوتر و قبل از لیزر قرار داشت. البته حضور علم آمار در این فهرست چیز عجیبی نیست چون جهان امروز، جهان مدیریت اطلاعات است و بخش عظیم اطلاعات نیز در هر علم ، رشته‌، سازمان و یا مركز شامل اعداد و ارقام می شود كه در مرحله جمع آوری و تجزیه و تحلیل این اعداد و ارقام علم آمار مورد نیاز می‌باشد. برای مثال هنگام آزمایش تاثیر یك داروی جدید، انتخاب یك نوع بذر در بین بذرهای مختلف ، مقایسه كیفیت دو روش تدریس در آموزش زبان، كنترل كیفیت محصولات، تعیین حق بیمه ، پیش‌بینی نرخ ارز ، نظرسنجی و پیش‌بینی انتخابات ، تعیین نرخ بیكاری، تعیین شاخص هزینه خانوار ، تاثیر و رابطه افسردگی بر تحصیل نیاز به تحقیقات آماری داریم . 
وضعیت ادامه تحصیل در مقاطع بالاتر این رشته تا مقطع دكترا تدریس می‌شود. 
در دوره كارشناسی ارشد 32 واحد تخصصی را می‌گذراند و در دوره دكترا 24 واحد درسی اختصاصی و 24 واحد رساله دكتری را می‌گذراند. 


گرایشهای مختلف رشته آمار در مقطع كارشناسی ارشد

آمار ریاضی ، آمار حیاتی ، آمار بیمه ، آمار و كاربرد آن در اقتصاد و علوم اجتماعی . در مقطع دكتری: آمار ریاضی و آمار حیاتی.


دروس پایه برای كارشناسی آمار 

ریاضی پیش دانشگاهیمبانی جامعه شناسی
مبانی اقتصادمبانی جمعیت شناسی
مبانی ریاضیفیزیك پایه 1و2
ریاضی عمومی 1و2آزمایشگاه فیزیك 1و2
آمار و احتمالروشهای آماری


آینده شغلی و بازار كار

 تقریبا تمامی مراكز دولتی و خصوصی برای انجام برنامه‌ریزی و ارائه گزارش فعالیتهای خود نیازمند تهیه اطلاعات صحیح و به كارگیری تجزیه و تحلیل آنها هستند. از این‌رو، اغلب ادارات و نهادهای دولتی بخصوص وزارت برنامه و بودجه ، مراكز آمار ایران، بانكها ، وزارت آموزش و پرورش ، مراكز تحقیقی، مراكز بیمه و سایر موسسات دولتی و خصوصی از عمده مراكز جذب كارشناسان این رشته‌اند. 
البته گمنام بودن علم آمار و كاربردهای آن در جامعه، مانع از جذب فارغ‌التحصیلان رشته آمار نشده است بلكه به گفته بسیاری از اساتید و دانشجویان این رشته، فارغ‌التحصیلان آمار كمتر با مشكل بیكاری روبرو می‌شوند. 
خوشبختانه فارغ‌التحصیلان آمار هنوز دچار آفت بیكاری نشدند و در سازمانهای دولتی و خصوصی یا دانشگاهها فعالیت می‌كنند. و به دلیل نیاز جامعه به فارغ‌التحصیلان آمار و نیز آشنایی آنها با كامپیوتر در حد نیازهای اجرایی و خدماتی، فارغ‌التحصیلان آمار تاكنون براحتی جذب بازار كار شده‌اند وضعیت نیاز كشور به این رشته در حال حاضر متاسفانه در كشور ما علم آمار و كاربردهای آن بخوبی معرفی نشده است و حتی مسؤولین نمی‌دانند كه فارغ‌التحصیلان این رشته چه توانایی‌هایی دارند. 
بیشتر سازمان‌های دولتی از آمار برای ارائه ارقام و اعدادی كه مربوط به فعالیتهای واحدهایشان می‌شود، استفاده می‌كنند و چون این كار را چندان تخصصی نمی‌دانند به جای به كارگیری كارشناسان آمار از افرادی بهره می‌برند كه آشنایی مختصری با این علم دارند. در حالی كه اكثر برنامه‌ریزی‌های زیربنایی كشور را می‌توان با استفاده از روش‌های پیشرفته آمار انجام داد. اكثر فارغ‌التحصیلان رشته آمار در محیط كار از تخصصهای خود كه در دوران تحصیل فرا گرفته‌اند، بهره نمی‌برند چرا كه هنوز از آمار به عنوان یك ابزار قوی در تجزیه و تحلیل اطلاعات استفاده نمی‌شود.


پیش بینی وضعیت آینده رشته در ایران 


امروزه كارشناسان آمار در جهان و بخصوص در كشورهای صنعتی ، فرصت های شغلی بسیاری دارند و حیطه فعالیت آنها شامل تمامی علوم از جمله اقتصاد ، جامعه شناسی ، زیست شناسی ، پزشكی ، فیزیك ، شیمی ، الكترونیك و عمران می شود.
فارغ التحصیلان این رشته می توانند در سازمان برنامه و بودجه ، مركز آمار ایران ، بانك ها ، ادارات بیمه ، مراكز صنعتی و كارخانجات ، واحدهای آماری وزارتخانه های مختلف همچون كشاورزی ، كار، بهداشت ، اقتصاد و امور دارایی، فرهنگ و ارشاد اسلامی كشور و به طور كلی در هر مركزی كه نیاز به جمع آوری تجزیه و تحلیل آمار و اطلاعات دارد، مشغول به كار شوند.


دروس اختصاصی برای كارشناسی آمار

ریاضی برای آمارزبان تخصصی
مبانی كامپیوتر و برنامه نویسیروشهای پیشرفته آماری
احتمال و كاربرد آنروشهای چند متغییری گسسته
روشهای ناپارامتریروشهای چند متغییری پیوسته
طرح آزمایش ها 1و2جبر خطی 1 برای آمار
فرآیندهای تصادفی 1آنالیز ریاضی 1
آمار ریاضی 1و2رگرسیون
روشهای نمونه گیری 1و2سری های زمانی 1
محاسبه آماری با كامپیوتركنترل كیفیت آماری
پروژه كارشناسی 


 

نوشته شده توسط امين روشني در پنجشنبه نوزدهم مرداد 1391 ساعت 12:19 موضوع | لینک ثابت


جملات آماری

 

جمله سازی زیبا با کلمات آماری

·        بیاییم با احتمال 1 خدا را بپرستیم!

·        توزیع زندگیمون نرمال باشه ولی یکنواخت نباشه!

·        بیاییم فصل اطمینان ها را زیاد کنیم!

·        واریانس ها را کم کنیم!

·        سعی کنیم کواریانسمون صفر نشه!

·        قانون قوی را تو رابطه هامون راه ندیم!

·        یک نمونه خوب از رفیقامون انتخاب کنیم!

·        یک برآورد نااریب از آینده داشته باشیم!

·        آمار کارهامون از دستمون خارج نشه!

·        و در آخر بیاییم همگی مثل یک خط رگرسیون کمترین خطا را داشته باشیم!


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 13:55 موضوع | لینک ثابت


کنترل کیفیت آماری

کاربرد نمودار پارتو

این مساله ازآنجا ناشی می شود که کتابهای درسی تدوین شده در رابطه با آمار کاربردی باتوجه به تعداد نسبتا زیاد آنها، کمتر به کاربرد علم آمار و مسائل عملی آن پرداخته اند. به طور مثال می توان به این نکته توجه کرد که در بیشتر کتابهای درسی تحت عنوان آمار کاربردی به نمودار پارتو که یکی از مهم ترین و کاربردی ترین نمودارهای آماری است و امروزه در فرآیندهای تولیدی و غیرتولیدی مورد استفاده قرار می گیرد اشاره نشده و یا تنها به معرفی کوتاهی از آن اکتفا شده است 


تاریخچه 

در سال 1897 ویلفرد پارتو ''اقتصاددان ایتالیای1848-1923 فرمولی ارائه کرد که نشان می داد توزیع درآمد ناهموار است . او درآمد فردی را روی محور افقی و جمعیت رابر روی محور عمودی نشان داد و دریافت که تعداد اندکی از مردم دارای درآمد زیاد و اکثرافراد جامعه دارای درآمد اندکی هستند، نمودار زیر بیانگر این فرمول است .
براساس اصلی که وی در اقتصاد اجتماعی بیان کرد، حدود 80 درصد نتایج از20درصد علل ناشی می شود. به عبارت دیگر اگرچه برای مسائل موجود، علل بسیار زیادی وجود دارد ولی تعداد کمی حائز اهمیت است . آن چه پارتو روی این نکته توجه کرد، که اگر شما یک ، دو یا سه عامل اصلی را درنظر بگیرید درباره اکثریت عاملها فکر کرده اید،بدین طریق نمودار پارتو در سا1897 به وجود آمد، یک تئوری مشابه به صورت نموداری توسط لورنز ''اقتصاددان آمریکایی '' در سال 1907 ارائه شد. هردو محقق اشاره داشتند که بیشترین سهم درآمد یا ثروت توسط افراد بسیار کمی از مردم نگهداری می شود، بعدها در زمینه کیفیت دکتر ژوزف جوران در سال1954 روش نموداری لورنز رابه عنوان فرمولی برای تقسیم بندی مسائل کیفی به مشکلات اساسی معدود و مشکلات جزیی بسیار به کار گرفت و این روش را تجزیه و تحلیل پارتو نامید.

کاربرد نمودار پارتو


نمودار پارتو یک نمودار میله ای است که علل مشکلات به وجود آمده را با فراوانی آن مقایسه می کند، در نمودار پارتو از زوایای مختلف می توان به یک مساله نگاه کرد و سپس به حل آن پرداخت از جمله :
کیفیت : نواقص ، عیوب ، خرابیها، شکایات ، موارد برگشتی و تعمیرات ;
هزینه : مقدار زیان ، گرانی ;
خرید وفروش :انبارداری ، اشکال در پرداخت ، تاخیر در تحویل ;
ایمنی : حوادث ، اشتباهات ، شکستگی در حمل و نقل ;
اپراتور: شیفت ، گروه ، سن ، تجربه و مهارت ، اشخاص ;
ماشین : ماشینها، تجهیزات ، ابزار، ساختار، مدل ، اسبابها;
مواد خام : سازنده ، طرح ، مقدار و نوع ;
روش ساخت : شرایط، دستورالعمل ، ترتیب و روشها.
چگونگی رسم نمودار پارتو:
برای رسم نمودار پارتو انجام مراحل زیر ضروری است :
مرحله اول : ابتدا مشخص کنید که کدام مسائل برای رسیدگی هستند و چطور اطلاعات وداده ها را باید جمع آوری کرد.
الف - تصمیم بگیرید کدام مسائل را می خواهید رسیدگی و برطرف کنید، مثال مواردنقص ، زیانهای پولی ، حوادث قابل اتفاق .
ب - مشخص کنید که چه داده هایی لازم است جمع آوری شود و چطور آنها را طبقه بندی کنید، مثال باتوجه به موارد نقص ، فرآیند کار، ماشین ، کارگر و روش ، موارد غیرمهم وجزیی را تحت عنوان سایر طبقه بندی کنید.
ج - روش جمع آوری داده هاو دوره زمانی جمع آوری آن را مشخص کنید.
مرحله دوم : یک برگه کنترل ''برگه ثبت اطلاعات '' مناسب طراحی کنید.
مرحله سوم : بعد از علامت گذاری و ثبت موارد مشاهده شده در برگه کنترل فراوانی آنها رابه دست آورید.
مرحله چهارم : یک جدول توزیع فراوانی شامل تمام موارد فهرست شده ، ستونهای فراوانی ، فراوانی تجمعی ، درصد فراوانی و درصد فراوانی تجمعی تهیه کنید.
مرحله پنجم : جدول توزیع فراوانی را برحسب تعداد به ترتیب غیرنزولی مرتب کنید. لازم به ذکر است که مورد سایر، یا غیرو را در آخرین سطر جدول قرار دهید. مورد فوق نبایدخیلی بزرگتر از سایر موارد باشد.
مرحله ششم : یک محور افقی و دو محور عمودی رسم کنید:
الف - محور افقی : این محور را به تعدادی فواصل یکسان شامل تمام موارد، تقسیم بندی کنید.
ب - محور عمودی سمت چپ : این محور را از صفر تا n ''جمع کل داده ها'' مدرج کنید.
ج - محور عمودی سمت راست : این محور را از صفر ت100 ''درصد کل '' مدرج کنید.
مرحله هفتم : یک نمودار ستونی رسم کنید.
مرحله هشتم : منحنی فراوانی تجمعی ، منحنی پارتو را رسم کنید، برای این کار ارزشهای تجمعی را در بالای سمت راست ستون مربوط به هر طبقه با نقطه ای مشخص کرده وسپس این نقاط را به یکدیگر وصل کنید.
مرحله نهم : تمام اطلاعات ضروری را روی نمودار ثبت کنید:
الف - اطلاعات مربوط به نمودار شامل عنوان ، واحد، نام رسم کننده نمودار، موارد بامعنی و...
ب - اطلاعات مربوط به داده ها شامل دوره زمانی ، محل جمع آوری داده ها، موضوع ،جمع کل داده ها و...


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 13:50 موضوع | لینک ثابت


محاسبات آماری

 

نرم افزار رایگان و کم حجم برای تجزیه عاملی

یکی از مهمترین مباحث چندمتغیره، تجزیه عاملی متغیرهای پیوسته می باشد. اکثر نرم افزارهای آماری توان  تحلیل عاملی داده های چندمتغیره را دارند و حتی برخی از آنها مانند SAS ، پکیج های ویژه ای مخصوص این کار دارند اما نرم افزاری که امروز معرفی می کنیم صرفاً مخصوص موضوع است و با حجمی بسیار کم کاملاً رایگان در اختیار شما قرار می گیرد.

نرم افزار Factor با گرفتن داده هایی با فرمت txt موارد زیر را در اختیار شما قرار می دهد.

1- انجام آمار توصیفی برای داده های یک یا چند متغیره (میانگین، واریانس،چولگی، کشیدگی و....)

2- نمودار واریانس برای داده های ترتیبی

3- ماتریس کوواریانس و همبستگی با برآورد ریدج اختیاری

4- تعیین مولفه های اصلی که منجر به تجزیه عاملی مناسب می شود.

همچنین تحلیل های دیگر چون آزمون ماتریس همبستگی، نیکویی برازش (کای دو)، شاخص برازش غیرنرمال، GFI و خطای RMS روش به کار رفته و..... را در اختیار شما می گذارد

 اندازه فایل: ۲۵۴ کیلو بایت

دانلود


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 13:43 موضوع | لینک ثابت


محاسبات آماری

 

اکسل خود را تبدیل به یک نرم افزار کاملا آماری کنید

وارد کردن داده در نرم افزارهای آماری امری مشکل است و اصولاً این نرم افزارها در حفظ داده ها چندان قابل اعتماد نیستند. برای همین منظور اکثر دوستان آماری از نرم افزار Excel برای وارد کردن داده هایشان استفاده می کنند که از کیفیت و دقت بالایی در ورود اعداد و حروف برخوردار و روی اکثر سیستم ها نیز نصب می باشد. امّا مشکل این نرم افزار هم نداشتن منوهای آماری است که باعث می شود بعد از پرکردن ستونها، داده ها را در یک نرم افزار آماری مانند SPSS، S-Plus، SAS، Minitab و... وارد کنیم و سپس تحلیل آماری مورد نظر را انجام دهیم.

ما پیشنهاد جالبی برای حل مشکل شما داریم و آن ترکیب نرم افزار Winstat با Excel است. برای این منظور ابتدا  Winstat را از لینک زیر دانلود کنید.

حجم فایل: 7.17 مگابایت

دانلود فایل

سپس با اطمینان از وجود نرم افزار Excel (ورژن 97 به بعد) Winstat را نصب کنید. نرم افزار به طور خودکار روی Excel نصب می شود. بعد از نصب Excel خود را باز کنید. در قسمت Toolbars گزینه ای به نام Winstat اضافه شده که شامل 4 منوی اصلی و 4 منوی فرعی است.

منوهای اصلی به ترتیب عبارتند از:

1- Statistics (شامل مقایسه دو گروه، مقایسه N گروه، انواع ضرایب همبستگی، رگرسیون، تجزیه عاملی و ...)

2- Graphics (هیستوگرام، دایره ای، میله ای، پراکندگی و...)

3- Data

4- Help Winstat

تذکر: از آنجایی که این نرم افزار یک برنامه ترکیبی است برای شناخته شدن آن توسط Excel یکبار باید روی تمام آیکون های آن کلیک کنید. در این صورت از شما می خواهد که او را در شناخت داده ها همراهی کنید. برای بار دوم که وارد شوید دیگر با این مشکل روبرو نخواهید بود. ضمناً با نصب این برنامه، قسمتی در منوی all program ویندوز تحت عنوان Winstat for Excel نیز نصب می شود که در آن یک راهنما به شکل Winstat Manual با فرمت pdf شامل 137 صفحه وجود دارد که Help شما را تکمیل می کند.


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 13:32 موضوع | لینک ثابت


دانلود رایگان کتاب

 

برای دانلود کتاب رایگان، ساده ترین راه مراجعه به آدرس زیر است.

                                         http://gigapedia.com

کافی است وارد قسمت register شوید و یک نام کاربری و پسورد بری خود انتخاب کنید.

 ایمیلتان را وارد کنید و پس از وارد کردن دو کلمه مشخص در Captcha دکمهregister را انتخاب کنید. به ایمیل شما لینکی وارد می شود که می توانید از طریق آن در سایت login کنید.

 


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 13:15 موضوع | لینک ثابت




 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 9:14 موضوع | لینک ثابت


مقدمه ای در مورد آمار فضایی


استقلال و يکسانی – مدل داده های توزيع شده:

تکنيک هاي آماري استاندارد به کار برده مي شوند تا يک مدل آماري را بسازند و پارامترهاي مدل را برآورد کنند. به عنوان مثال Heyl and Cook در ۱۹۳۶آزمايشات انجام شده بين مي ۱۹۳۴ و ژولاي ۱۹۳۵ را براي تعيين شتاب جاذبه زمين در يک آزمايشگاه از واشنگتن توصيف کرده اند. روش استفاده شده، استفاده از آونگ متحرک بوده و ترکيب هاي متفاوت قطر لوله آونگ و نوع لبه تيغه آن، بکار گرفته شده بود. يک ترکيب خاص که بعد از مي و قبل از ژوئن 1934 بدست آمده ( بعد از تعديلات مناسب براي خميدگي و سرعت ساعت) بصورت زير می باشد:

76،82،83،54،35،46،87،68

اين که اين داده ها را می توان به عنوان رويدادی از يک نمونه تصادفي مدل بندي کرد احتمالاً يک فرض روشن و بي عيب است. اما آزمايش بعدي انجام شده تحت يک ترکيب و شکل متفاوت، انحرافات را به ما مي دهد. ( بعد از تعديلات مناسب به دست آمده است)

76،76،78،79،72،68،75،78

دوباره اين ها مي توانند به عنوان يک نمونه تصادفي مدل بندي شوند. اما براي اينکه هر آزمايش سعي بر آن دارد که ثابت فيزيکي مشابه را اندازه بگيرد، داده ها بطور واضح بايد به چندين روش ترکيب شوند.

سوالی که مطرح می شود اين است که آيا عيبی ندارد که ۱۶ عدد قبلي را به عنوان مشاهدات يک نمونه تصادفي مدل بندي کنيم؟

مدل داده هاي ناهمگن:

عدم همگني در داده ها معمولاً در مدل هاي آماري با فرض داشتن ميانگين غيرثابت محاسبه مي شود، معمولاً ميانگين ، يک ترکيب خطي از چندين متغير توصيفي مي باشد. با اين وجود، حتي بعد از اين که تغييرات با مقياس محاسبه مي شوند دلايلی براي مظنون شدن به تغييرات کوچک ناممکن وجود دارد.

Cressie در ۱۹۸۲ فرض مي کند که داده هاي آزمايش فقط  تحقق های مستقل از توزيع هاي آماري که ميانگين هايشان ثابت ولي واريانس هايشان بطور محسوس متفاوت هستند، توصيف می کنند. تئوري يک نمونه استاندارد کاربرد زيادي ندارد. اما هنوز ساختن يک فاصله اطمينان براي ميانگين بر پايه آماره t وزني امکان پذير است.

فرض استقلال يک راه روشنتر براي تعميم مدل هاي آماري مي باشد. اما آيا مدل هاي کليتری براي هر مقدار علمي وجود دارد؟  اميدوارم که خواننده را متقاعد سازم که به اين سوال بطور قاطع پاسخ بلي دهد.

مدل داده هاي وابسته:

استقلال يک فرض خيلي راحت و مناسب است که بسياري از تئوري هاي آماري- رياضي را قابل فهم   مي کند. با اين وجود مدل هايی که وابستگی آماری را شامل می شوند اغلب واقعی تر هستند. دو دسته از مدل هايي که به طور مشترک مورد استفاده قرار مي گيرند شامل ساختارهاي همبستگي درون گروهی و ساختارهاي همبستگي جزء به جزء مي باشند. اين ها ميدان کوچکي براي داده هاي فضايي پيشنهاد  مي کنند که وابستگي در همه جهات از خودشان نشان می دهند.

ما تا کنون قادر به گريز از جهان سه بعدي که در آن زندگي مي کنيم نبوده ايم. مفهوم اينکه داده ها در زمان يا فضا به يکديگر نزديک باشند که به معنای همبستگی است، يک امر طبيعي است و بطور موفقيت آميزی توسط آماردانان مورد استفاده قرار گرفته است و توانسته اند پديده هاي فيزيکي و اجتماعي را مدل بندي کنند. مدل هاي  زمانی يا مدل هاي سري هاي زماني، از جمله مدلهاي مشهوری هستند که تاکنون شناخته  شده اند و معمولاً بر اساس هم توزيع بودن مشاهدات که وابسته به يکديگر و با يک وقفه زماني يکسان رخ مي دهند استوار هستند.

مدل هاي فضايي اخيراً به ادبيات آمار اضافه شده است. زمين شناسي، علم خاک، فرآيندهاي تصويري، اپيدميولوژي( علم بيماري هاي همه گير)، علم کشاورزي، زيست شناسی، علم جنگل، نجوم، هواشناسي يا هر رشته اي که با داده هاي جمع آوري شده از موقعيت هاي فضايي متفاوت کار مي کنند، نياز به گسترش مدل هايی دارند که نشان دهنده وجود وابستگی بين اندازه ها در موقعيت های مختلف می باشند. با اين وجود مدل هايي نياز است که تغييرپذيري بيشتري نسبت به همتاهاي زماني اشان داشته باشند. براي اينکه در گذشته و حال و آينده هيچ قياس و شباهتي در فضا نداشته ايم و علاوه بر اين منطقي نيست که فرض کنيم که موقعيت هاي فضايي داده ها به طور منظم رخ مي دهد (مانند اکثر مدل هاي سري زماني).

وقتي با داده هاي مربوط به فضا يا زمان سروکار داريم که نوع  وابستگي هايشان مشابه است، دو روش مي توان در نظر گرفت. ساختارهايي که از نمونه هاي مستقل مي توانند مدل بندي شوند.

مجموعه هاي داده هاي زمان- مکان هواشناسي به منظور بررسي مطالعات اثرات آلودگي هوايي جمع آوري شده اند، مثلاً باران اسيدي . مجموعه داده هاي روزانه يک تعداد از سال ها در موقعيت هاي متفاوت مثلاً شمالي ترين منطقه آمريکا، يک مجموعه داده ها ي چگال را بدست مي دهد. اما بيشتر آنها وابسته به زمانند، به زبان فضايي: داده ها هنوز نسبتاً  تنک و پراکنده اند. با اين وجود پيش بيني فضايي از لحاظ اهميت مشابه پيش بيني زماني است.

داده های فضايی و مدلهای فضايی:

اولين ظهور آمار در زمينه داده هاي فضايي با ايجاد فرمي از ترسيم داده ها پديد آمد. به عنوان مثال، Halley در ۱۶۸۶ ، براي يك ترسيم از فرم بادهاي زميني و تلاش براي ايجاد يك علامت فيزيكي براي جهت مسير بادها و بادهاي موسمي در بين و نزديك مدار راس السرطان روي هم گذاري کرده است.

مدلهاي فضايي بعدها بوجود آمدند. به عنوان مثال، Student در ۱۹۰۷ ، توزيع همه ذرات يك مايع  را بررسی کرده است. به جاي تحليل در مورد موقعيت فضايي آنها، او تراكم داده ها را بصورت تعداد ذرات در هر واحد مساحت حساب كرد. يک hemocytometer ( وسيله اندازه گيري تعداد گلبول هاي خون) که ۱mm2 را به ۴۰۰ مربع تقسيم می کند، براي شمارش گلبول ها مورد استفاده قرار گرفت.Student متوجه شد که توزيع تعداد گلبول ها در هر مربع از توزيع پواسن پيروي مي کند.

فيشر از وابستگي فضايي در آزمايش هاي ميداني در کشاورزي کاملاً آگاه بود، چون او از مدت ها قبل بدنبال اصلاح آن بود. او در دهه ۱۹۲۰ و ۱۹۳۰ در ايستگاه آزمايشي Rothamsted در انگلستان، اصولي از تصادف،‌ بلوکي و تکرار را ايجاد کرد. به هر حال بايد قبول کرد که تصادفي کردن، همبستگي فضايي را در مقياس هاي بزرگتر يا کوچکتر از بعد نمودارها از بين نمي برد.

Fairfield Smith در ارتباط با انتخاب بعد نمودارها  بود که هر افزايشي در بعد نمودارها بايد حاصل اندک کاهش در واريانس باشد. اگرچه تحليل او تجربي بود، اما خيلي از فرمول هاي مسائل حضور همبستگي فضايي در آزمايش هاي ميداني را تصديق مي کردند.

روشهاي نزديکترين همسايگي براي تحليل آزمايش هاي ميداني در کشاورزي تلاش هايي را براي گرفتن وابستگي فضايي بطور غيرمستقيم در تخمين ها دنبال مي کند، که بوسيله استفاده از باقيمانده ها براي نمودارهاي همسايگي به عنوان متغير کمکي، يا بوسيله اختلافشان انجام مي گيرد.

مدل فضايي کلي:

آمار در همه زمينه هايش برای تحليل داده هاي اکتشافي در کنار توزيع مجانبی  قضيه برآوردگرهای پارامتر روي چندين مدل تصادفي تکيه مي کند. بايد مدلي براي داده هاي فضايي ارائه کنيم که ساختار ساده آن به اندازه کافي تغييرپذيري را براي بکار بردن يک گروه بسيار بزرگ از مسائل  داشته باشد.  داده ها بايد گسسته يا پيوسته باشند.

آنها بايد تراکم هاي فضايي يا مشاهدات نقاطي در فضا باشند،  مکان هاي فضايي آنها بايد منظم يا غير منظم باشند، و آن مکان ها بايد بر يک مجموعه گسسته يا زنجيره فضايي باشند. در موارد نادر مدل هاي تصادفي براي خلاصه اي از داده هاي موجود يا پيش بيني داده هاي مشاهده نشده استفاده مي شوند. مدل بايد  بيان کند که چرا يک حادثه خاص اتفاق افتاده است، و همچنين بايد براي بيشتر پذيره هاي معمول استفاده از کلمه "مدل" را تشخيص دهيم.


منبع: وبلاگ statblue1


 

نوشته شده توسط امين روشني در جمعه بیست و هفتم اسفند 1389 ساعت 9:14 موضوع | لینک ثابت


روشهای پارامتری و ناپارامتری

 

یادآوری آمار در علوم اجتماعی

متغیر ها را بر پایه تعداد و نوع تفاوت بین مقادیری که به خود می گیرند می توان طبقه بندی کرد. در پایه ای دیگر از متغیرها که معمولا مقادیر بیشتری نسبت به متغیرهای اسمی به خود می گیرند.

دسته ای دیگر ازمتغیرها معمولا مقادیر زیادی به خود گرفته و به علاوه فاصله بین آنها بر پایه ی صفر حقیقی قابل اندازه گیری است، به عنوان مثال طول عمر، درآمد و یا اینکه سن که مقادیری متفاوتی از صفر تا K به خود می گیرد و نیز فواصل بین آنها به واسطه صفر حقیقی قابل اندازه گیری است. بدین ترتیب می توان گفت یه فرد 50 ساله دو برابر فرد 25 ساله سن دارد. این نوع متغیرها دارای سطح سنجش فاصله ای یا نسبی هستند.

آزمونها و آماره هایی که برای بررسی توزیع و یا رابطۀ این نوع متغیرها به کار می رود، آزمونهای پارامتری خوانده می شوند که در کتاب روشهای آماری توضیح داده شده است. آزمونهایی چون Z، t و F نمونه های از آزمونهای پارامتری هستند. متغیرهای جنس، دین، نژاد و ... در هر صورت تنها به شیوۀ اسمی یا ترتیبی قابل اندازه گیری هستند.

برای بررسی شکل توزیع و یا رابطه ی بین این نوع متغیرها در تحقیقات از آزمونهایی موسوم به نا پارامتری استفاده می شود که به برخی از آنها اشاره خواهیم کرد.

در آزمون تحلیل واریانس (F)، وقتی فرضیۀ  مورد قبول واقع شد، جامعه های مورد مطالعه را با استفاده از .L.S.D (کوچکترین تفاوت معنی دار بودن) به چند گروه که از نظر متوسط صفت مورد مطالعه یکسان بودند تقسیم کردیم و گفتیم که هدف از گروه بندی جامعه های مورد مطالعه تعیین حدود اعتماد و اطمینان میانگین هر گروه است که بتوان آنها را آنچنان تقسیم بندی کرد که اختلاف گروه های هر دسته به حداقل برسد، حال آنکه این کار را می توان با استفاده از آزمونهای شفه[1] ، توکی[2] و دانکن[3] نیز انجام داد

  آزمون شفه (Scheffe Test)

آزمون شفه تا حدوده زیادی مشابه گروه بندی L.S.D. در آزمون F صورت گرفته و فرشیۀ 1H مورد قبول باشد، یعنی اثر متقابل بین دو متغیر معنی دار باشد، این آزمون تمام حالتهای مختلف مقایسۀ یک به یک میانگینها و همچنین ترکیبهای چندتایی مقایسۀ آنها را انجام دهد، به سخن دیگر، از روش شفه جهت مقایسۀ یک به یک میانگینها یا مقایسۀ ترکیبهای چندتایی میانگین استفاده می شود

اگر اثر متقابل دو متقیر معنی دار نباشد، این مقایسه اختصاص به متغیرهایی پیدا می کند که معنی دار هستند، همان گونه که اشاره شد این آزمون تا حد زیادی کار گروه بندی ( یعنی L.S.D.) را که در آزمون F را انجام می دهد. در این آزمون، می توان برای تصمیم گیری در مورد وجود تفاوت بین دو میانگین یا ترکیبی از میانگینها ار توزیع t استفاده نمود.


منبع:منصوری فر،کریم(۱۳۸۰)،روشهای آماری،تهران:دانشگاه تهران

 


 

نوشته شده توسط امين روشني در دوشنبه بیست و چهارم آبان 1389 ساعت 15:39 موضوع | لینک ثابت


روشهای چندمتغیره پیوسته

 

روش تحقیق تاکسونومی و تکنیک به کارگیری آن

بطور كلي آناليز تاكسونومي عددي يك روش عالي درجه بندي ، طبقه بندي و مقايسه فعاليت هاي مختلف با توجه به درجه بهره مندي و برخورداري آن فعاليت ها از شاخص هاي مورد بررسي مي باشد.

توانایی های این روش

از توانايي هاي عمده اين روش آن است كه قادر است تا اينكه دو عمل را در كنار هم انجام دهد : يكي اينكه مجموعه مورد بررسي را بر اساس شاخص هاي ارائه شده به زير مجموعه هاي همگن تقسيم كند و ديگر آنكه عناصر و اعضاء هر زير مجموعه همگن را درجه بندي كند.

 اين روش همچنين به عنوان مدلي شناخته شده در برنامه ريزي هاي منطقه اي مطرح بوده كه داراي كاربردهاي گسترده و متنوع مي باشد.

محدودیت های این روش

 از جمله محدوديت هاي روش آناليز تاكسونومي عددي اين است كه در اين روش نوع اطلاعاتي كه بايستي تعيين گردند وابستگي بسيار زيادي به هدف انجام مطالعه دارند و ضمن اينكه تعداد اين اطلاعات نيز تاثير بسزايي بر كيفيت درجه بندي مي گذارد، به گونه اي كه هر چه تعداد اين اطلاعات بيشتر باشد و يا اينكه هر چند موضوع اين اطلاعات بيشتر توجيه كننده هدف باشد ، درجه بندي دقيق تر و عادلانه تر خواهد بود.از طرفي ديگر روش تحليل تاكسونومي عددي به تمامي شاخص ها با اهميت يكسان مي نگرد و فاقد وزن دهي به شاخص ها در درون مدل است كه چنانچه تمايل داشته باشيم تا به برخي از شاخص ها وزن و اهميت بيشتري داده شود درآن صورت داده هاي مربوط به آن شاخص را بايد با وزن بيشتر و از ابتداي كار وارد مدل كنيم.

 تاريخچه  

آناليزتاكسونومي عددي براي نخستين بار توسط آدانسون[1] در سال 1763 ميلادي پيشنهاد گرديد ، اما مدت ها به طول انجاميد تا در اوايل دهه 1950 ميلادي عده‌اي از رياضي دانان لهستاني اهميت اين روش را دريافته و به بسط و گسترش اين نظريه پرداختند.سپس در سال 1968 ميلادي اين روش توسط پروفسور زيگنانت هلويك از مدرسه عالي اقتصاد روكلا[2] به عنوان وسيله اي براي طبقه بندي و تعيين درجه توسعه يافتگي بين ملل مختلف در يونسكو (سازمان علمي و فرهنگي ملل متحد) مطرح گرديد كه تاكنون به عنوان مدل شناخته شده اي مورد استفاده قرار گرفته است و اخيرا نيز آن را جهت تعيين اولويت ها و رتبه بندي ساير فعاليت هاي گسترده اقتصادي و در بخش هاي گوناگون نظير صنعت و كشاورزي به كار مي برند.

 تكنيك اجرايي آناليز تاكسونومي عددي

تكنيك مورد بحث داراي چندين مرحله عملياتي است و ازآن جائيكه در عمل كمتر با فضاي يك بعدي سر و كار داريم يعني كمتر اتفاق مي افتد كه طبقه بندي را بر اساس يك شاخص و يا خصوصيت واحد انجام دهيم، به ارائه فضاي تاكسونوميك چند بعدي مي پردازيم.

در ابتداي كار فرض مي كنيم قرار است كه تعداد  n فعاليت مختلف را  بر اساس m شاخص مورد نظر و معرفي شده، طبقه بندي و درجه بندي كنيم:

مثلاً چهار شهر(مهاباد،خوی،پلدشت،اشنویه)را از نظر میزان برخورداری یا محرومیت از شاخص های آموزشی، بهداشتی، اقتصادی،... رتبه بندی می کنیم که کدام یک برخوردارتر و کدام یک محروم ترند؟

 مرحله اول: تشكيل ماتريس داده ها

 در اين مرحله ماتريسي را براي هر كدام از فعاليت ها با توجه به شاخص هاي مورد بررسي طراحي نموده به گونه اي كه ابعاد ماتريس n.m بوده يعني اين ماتريس به تعداد فعاليت هاي مورد بررسي سطر و به تعداد شاخص ها(m) ، ستون داشته باشد. به عنوان نمونه عنصر Xn.m  در اين ماتريس بيانگر شاخص m ام از فعاليت n ام مي باشد. بنابراين مشاهده مي گردد كه هر سطر اين ماتريس مربوط به يك فعاليت مجزا و هر ستون نيز مربوط به يك شاخص خاص مي باشد. از آن جا كه هر كدام از اين شاخص ها مي توانند داراي واحدها و مقياس هاي متفاوت از يكديگر باشند ، لذا در راستاي حذف دخالت مقياس هاي متفاوت بر نتايج كار از داخل مدل ، وارد مرحله دوم روش تحليل آناليز تاكسونومي عددي مي شويم. 

مرحله دوم: تشكيل ماتريس استاندارد

با توجه به آن كه شاخص ها با واحد هاي مختلف سنجيده مي شوند، لذا جهت حذف اثر اين واحد ها و جايگزيني مقياس واحد و همين طور حذف اثر مبداء ، ابتدا ميانگين و انحراف معيار ستون ها (شاخص ها) را به دست آورده و سپس كميت استاندارد  Zij را محاسبه مي كنيم: در گام اول ميانگين ستون ها را بدست مي‌آوريم .

در گام بعدي انحراف معيار براي هر ستون از ماتريس Xij را بدست مي آوريم .گام سوم آن است كه عضو هاي استاندارد شده ماتريس Xij جهت همسان سازي اطلاعات ساخته شده ، در قالب ماتريس جديدي  به نام ماتريس استاندارد را تشكيل دهيم كه از طريق فرمول زير قابل محاسبه مي باشد : ماتريس Z نيز داراي ابعاد n . m مي باشد . و يك ماتريس استاندارد است .چون با تغيير متغير، مقياس هاي مختلف شاخص ها به مقياس واحد تبديل شده است.روشن است كه از لحاظ آماري ميانگين هر ستون ماتريس استاندارد شده Z   برابر صفر و انحراف معيار آن مساوي يك است.

با داشتن ماتريس استاندارد Z  ، قدم بعدي بدست آوردن ميزان اختلاف و يا فاصله دو نقطه از نقطه ديگر ( 1 و 2 و 3 و ... و n ) براي هر كدام از m متغيير يا شاخص مي باشد كه حاصل آن تشكيل ماتريس فواصل مي باشد . ( منظور از نقطه همان فعاليت مورد بررسي ، در مطالعه مورد نظر مي باشد ) .

مرحله سوم: تشكيل ماتريس فواصل

در اين مرحله با توجه به اعداد استاندارد شده در ماتريس استانداردZ ، فواصل مركب را بين فعاليت هاي مختلف n گانه ، براي شاخص هاي m گانه به صورت زير به دست مي آوريم.

در صورتي كه فاصله فعاليت ها را دو به دو به دست آوريم ،در آن صورت ماتريس فواصل مركب به دست مي آيد.

چون ماتريس فواصل يك ماتريس قرينه مي باشد ، مي توان نتيجه گرفت اين ماتريس متقارن بوده و قطر آن مساوي صفر است.ضمن اينكه ماتريسي مربع و با ابعاد n.n مي باشد.عضوهاي اين ماتريس فاصله تركيبي هر فعاليت را از فعاليت ديگر نشان مي دهند و در هر سطر اين ماتريس كمترين مقدار نشان دهنده كوتاه ترين فاصله بين آن فعاليت ، با ساير فعاليت ها و يا بيشترين نزديكي مي باشد.

مرحله چهارم: تعيين كوتاه ترين فواصل

هر عنصر ماتريس C نشان دهنده فاصله بين هر دو فعاليت در شاخص مورد نظر است.در اين ماتريس در هر سطر كوتاه ترين فاصله بين دو فعاليت را مشخص كرده و در ستون جداگانه اي (مثلا ستون d) مي نويسيم.سپس ، ميانگين و انحراف معيار كوچكترين فواصل هر سطر يعني همان ستون dرا محاسبه مي كنيم.  حال براي آنكه فعاليت هاي همگن را مشخص نمائيم، فواصل حد بالا (d+) و حد پائين (d-) را طبق رابطه، محاسبه مي كنيم:

d(+) = d + 2Sd                       d(+) = d + 2Sd

   در اين مرحله فعاليت هايي كه حداقل فواصل آن ها مابين دو حد بالا و پائين باشد ، همگن بوده و در يك گروه قرار مي گيرند. چنانچه حداقل اختلاف بين دو فعاليت بيشتر از حد بالا و يا كمتر از حد پائين باشد، در اين صورت فعاليت هاي فوق به دليل غير همگني بايد حذف گردند.

مرحله پنجم: رتبه بندي فعاليت هاي همگن از لحاظ معيارهاي مورد بررسي

اگر در اين مرحله تمام فعاليت ها در يك گروه همگن قرار نگيرند، در اين صورت ماتريس داده ها را براي فعاليت هاي همگن تشكيل مي دهيم ، سپس استاندارد نموده و در ماتريس شاخص هاي استاندارد شده، براي تك تك شاخص ها، مورد ايده آل را در نظر گرفته و پس ازيافتن مقادير ايده آل براي تك تك فعاليت ها ، “برخورداري مطلوب” براي هر فعاليت را محاسبه مي كنيم.انتخاب مقدار ايده آل بستگي به نوع شاخص هاي مورد بررسي دارد به نحوي كه چنانچه جهت شاخص هاي انتخاب شده مثبت باشد يعني اگر مقدار شاخص هر چه بيشتر باشد ، برخورداري بيشتر را نشان دهد ، بزرگترين عدد هر ستون را به عنوان ايده آل در نظر مي گيريم و چنانچه جهت شاخص منفي باشد ، عدد بزرگتر نشانه عدم برخورداري است ، لذا كوچكترين مقدار را به عنوان مقدار ايده آل انتخاب مي كنيم.

مرحله ششم: محاسبه درجه برخورداري فعاليت هاي همگن

در اين مرحله شاخص تلفيقي به نام “درجه برخورداري” معرفي مي گردد كه دامنه محدودي داشته باشد و بين مقادير صفر و يك قرار مي گيرد. هرچقدر fi به صفر نزديكتر باشد ، فعاليت مورد نظر برخوردارتر و هر قدربه يك نزديكتر باشد، نشان دهنده عدم برخورداري فعاليت مربوطه مي باشد.كه با توجه به اين درجه برخورداري مي توان فعاليت ها را با توجه به شاخص هاي مورد بررسي رتبه بندي و اولويت بندي نمود.

 

منابع و مآخذ و منابع پيشنهادي جهت مطالعه بيشتر:

1-آسايش،حسين(1375)؛اصول و روشهاي برنامه ريزي ناحيه اي؛تهران:انتشارات پيام نور.

2-بهشتي،محمد باقر و همكاران(1362)؛معرفي تاكسونومي عددي،روشي براي گروه بندي ،درجه بندي و تعيين درجه و اهداف توسعه؛تبريز:انتشارات سازمان برنامه و بودجه آذربايجان.

3-بيدآباد، بيژن(1362)؛ آناليز تاكسونومي و كاربرد آن؛تهران:انتشارات سازمان برنامه و بودجه.

4-زياري،كرامت اله(1378)؛اصول و روشهاي برنامه ريزي منطقه اي؛يزد:انتشارات دانشگاه يزد.

 

معرفي چند مطالعه كاربردي انجام شده با روش آناليز تاكسونومي عددي:

1- آذري، لطفعلي(1383)؛ تحليلي از ساختار صنعت و تعيين اولويت هاي توسعه صنعتي استان كرمان، پايان نامه كارشناسي ارشد، به راهنمايي دكتر محمود هوشمند، دانشگاه فردوسي مشهد.

2-برنامه اقتصاد بدون اتكاء به درآمدهاي حاصل از نفت خام،رتبه بندي صنايع كشور بر اساس روش تحليل تاكسونومي عددي،دفتر اقتصاد كلان، سازمان برنامه و بودجه(1376).

3-حكمتي فريد،صمد(1382)؛رتبه بندي شهرستان هاي استان آذربايجان شرقي از نظر توسعه؛سازمان مديريت و برنامه ريزي آذربايجان شرقي.

4-سازمان برنامه و بودجه،طبقه بندي استان هاي كشور،مدلي در جهت تعيين اولويت ها در كاهش تفاوت منطقه اي،تهران (1365).

5-مشرفي،مهدي؛كوششي براي سنجش توسعه استان هاي كشور طي بيست ساله اخير،سازمان برنامه و بودجه آذربايجان غربي(1375)

با تشکر از آقای اسدالله شریف پور


 

نوشته شده توسط امين روشني در دوشنبه بیست و چهارم آبان 1389 ساعت 15:29 موضوع | لینک ثابت