• توجه: در صورتی که از کاربران قدیمی ایران انجمن هستید و امکان ورود به سایت را ندارید، میتوانید با آیدی altin_admin@ در تلگرام تماس حاصل نمایید.

گام به گام تا تحقق بومی سازی تاثیرات شاخصهای دورپیوندی تاثیر گذار بر اقلیم ایران

Amir Mohsen

متخصص بخش هواشناسی
Dr.ben
user-online.png

karbar-vijhe.gif

neshan2.gif
neshan2.gif
neshan1.gif
neshan1.gif
neshan1.gif

تاریخ عضویت Dec 2012
عنوان کاربر کاربر ويژه
میانگین پست در روز 4.12
نوشته ها 1,639
سپاس 12,882
سپاس شده 10,229 بار در 1,632 پست
میزان امتیاز 8278803
reputation_pos.png
reputation_pos.png
reputation_pos.png
reputation_pos.png
reputation_pos.png
reputation_highpos.png
reputation_highpos.png
reputation_highpos.png
reputation_highpos.png
reputation_highpos.png
reputation_highpos.png


[h=2]
icon1.png
خوب امشب می خوام برای دوستان عزیزم روش بدست آوردن ضریب همبستگی بین دو مجموع از داده ها رو به کمک نرم افزار اکسل توضیح بدم. فرض رو بر این گذاشتم که هیچ آشنایی قبلی ای با این نرم افزار نداریم به همین دلیل تمام موارد رو به صورت گام به گام و ساده توضیح میدم.

کمی در مورد نرم افزار اکسل
محیط نرم افزار اکسل شامل خانه هایی هست که به هر کدوم یک سلول می گیم. هر سلول آدرس مخصوص به خودش رو داره که همیشه با همون آدرس شناسایی میشه.
در تصویر پایین من گوشه بالایی سمت چپ بخش سلول های نرم افزار رو اوردم. مشاهده می کنین که در قسمت بالا به ترتیب حروف الفبای انگلیسی اومده و در قسمت سمت چپ اعداد به ترتیب از 1 شروع شدن.


Click here to view the original image of 598x432px.
c7biuif1xe9812bfoth.jpg


حالا تصویر پایین رو ببینین. سلولی که کادر سیاه داره آدرسش چیه؟ B6. چرا؟ چون در ستون B و در سطر 6 قرار گرفته. دقت کنید که این آدرس اون گوشه سمت چپ بالای نرم افزار هم نوشته شده.


Click here to view the original image of 734x456px.
yjihh5t4uz6jn7egwqa.jpg


بدست آوردن ضریب همبستگی بین دو متغیر به کمک نرم افزار اکسل

اول بیاید برای مثال داده های زیر رو در محیط اکسل وارد کنیم. اصلا فرقی نمی کنه داده ها رو کجا وارد کنید.


Click here to view the original image of 585x374px.
rdl3a3jgkpc8kjrtcgb.jpg


اکسل دارای توابع از پیش تعریف شده ی فراوانی هست. اصلی ترین موضوعی که باید بدونیم اینه که تمام توابع باید با علامت = شروع بشن. تابع محاسبه ضریب همبستگی (Correlation) در اکسل با نماد CORREL نشون داده می شه. برای فراخوانی این تابع یکی از سلول ها رو انتخاب کنید ابتدا علامت = رو تایپ کنید بعد حرف انگلیسی C رو تایپ کنید. همین که اینکار رو کردید اکسل به طور خودکار مجموعه ایی از توابعی رو که با حرف C آغاز میشن رو نمایش میده (البته برای فراخوانی یک تابع روش های مختلی وجود داره که من یکی از اون ها رو توضیح میدم):

ofyn4y0osz80xvs8322k.jpg


هدف ما استفاده از تابع CORREL بود. یا می تونیم در این مجموع توابع نمایش داده شده تابع مورد نظرمون رو پیدا کنیم یا اینکه به تایپ کردن ادامه بدیم. فرض کنید به تایپ کردن نام تابع ادامه بدیم. یعنی =cor دیگه تا همین جا بسه! چون دامنه جستجو محدودتر شده تابع عزیز ما هم کاملا نمایان شده:

wii0f50a8oc9wh3jn79.jpg


دیگه فقط کافیه روی اسم تابع دوبار کلیک کنیم:

7rh813fm1bf78t6ube1l.jpg


نگاه کنید اسم تابع در سلول به صورت =CORREL( نمایان شده. اگه مایل هستین در مورد این تابع و شیوه عملکرش اطلاعاتی کسب کنید می تونید بر روی اسم تابع در اون کادر آبی زیر سلول کلیک کنید. ما قصد انجام این کار رو نداریم چون به اندازه کافی با این تابع آشنا هستیم. فعلا توجه شما رو به عبارت راهنمایی که در کادر آبی هست جلب می کنم:
CORREL(array1,array2)
این عبارت بیانگر چیه؟ این عبارت نشون میده که این تابع دو تا آرگومان داره و آرگومان های تابع باید با نماد ویرگول , از هم جدا بشن. دقت کنید که ممکن هست در کامپیوتر شما آرگومان های تابع با نماد سیمیکالون ; از هم جدا بشن. بنابراین باید حتما به عبارت داخل کادر آبی توجه داشته باشین.
حالا کار ما چیه؟ ما باید برای آرگومان اول یعنی array1 داده های زیر متغیر X و برای آرگومان دوم یعنی array2 داده های زیر متغیر Y رو وارد کنیم. چون از قبل داده ها رو تایپ کردیم فقط کافی آدرس مربوط به خونه های این مقادیر رو وارد کنیم. در اینجاست که می رسیم به بحث شیرین و ساده آدرس دهی.

آدرس دهی
آدرس دهی در اکسل به روش های مختلفی قابل انجام هست. یکبار دیگه به مجموع داده های ما در محیط اکسل نگاه کنید. ببینید اولین داده ی زیر متغیر X طبق چیزی که قبلا گفتم توی چه آدرسی قرار داره؟ همون طور که مشاهده می کنید در خونه F14 هست (ممکنه شما توی سلول های دیگه ای این مقادیر رو نوشته باشین. فرقی نمی کنه آدرس رو از کامپیوتر خودتون نگاه کنید). آخرین داده ی مربوط به متغیر X در چه سلولی قرار داره؟ توی شکل ما در سلول F19 . در مورد داده های مربوط به متغیر Y چی؟ اولین مقدار در سلول G14 و آخرین مقدار در سلول G19 قرار داره.


Click here to view the original image of 585x374px.
rdl3a3jgkpc8kjrtcgb.jpg


بر گردیم به ادامه کار تابع. گفتم که ما باید برای آرگومان اول یعنی array1 داده های زیر متغیر X رو وارد کنیم. این داده ها بین سلول های F14 تا F19 قرار دارند. وقتی می خواهیم به تمامی سلول های این ناحیه اشاره کنیم (تا تمامی مقادیر زیر متغیر X در نظر گرفته بشن) کافیه تایپ کنیم F14:F19. نماد : همون مفهوم "تا" رو میده. یعنی برداشت اکسل اینه که از سلول F14 تا سلول F19.
شاید بگین حتما باید این طوری اول آدرس یه سلول رو پیدا کنیم بعد هم اون رو تایپ کنیم؟ نه اکسل کار رو ساده تر کرده. ببینید همین که با ماوس روی سلول مورد نظرتون کلیک کنید آدرس سلول اون پایین میاد. نگاه کنید من F14 رو تایپ نکردم خود اکسل اون رو در فرمول درج کرده من فقط رو خونه ی مربوط به عدد 5 کلیک کردم:

sree11qr97z7sg8tjszm.jpg


در ادامه نماد : رو بعد از F14 تایپ می کنیم. بعدش رو سلول آخری که عدد 30 رو توش نوشتیم یدونه کلیک می کنیم. آدرس این سلول که F19 بود خود به خود اون پایین درج میشه. شکل پایین رو ببینید. توجه کنید که منطقه مورد نظر ما هم به وسیله یک مستطیل نقطه چین مشکی مشخص میشه

3efdg81u9b996asotw.jpg


هنوز هم کار سخته؟! خوب یه روش ساده تر هم داریم. فقط کافیه با ماوس کل منطقه مورد نظرتون رو انتخاب کنید. چه جوری؟ ما به کل سلول های زیر X نیاز داشتیم دیگه. خوب از سلولی که عدد 5 رو تایپ کردید شروع کنید یدونه کلیک کنید ولی دیگه دستتون رو از روی دکمه ماوس بر ندارید همین طوری بیاین تا پایین که عدد 30 تایپ شده. درست مثل کاری که هر جای دیگه ای برای انتخاب بخش هایی از یه متن انجام میدیم. با این کار اکسل کل عبارت F14:F19 رو به عنوان اولین آرگومان تابع نمایش میده. به همین راحتی!
پس تا اینجا آرگومان اول رو برای تابع مشخص کردیم. بعدش باید علامت , رو بذاریم و بریم سراغ آرگومان بعدی (قبلا هم گفتم ممکنه در کامپیوتر شما جدا کننده آرگومان های توابع علامت ; باشه). برای تعیین آرگومان بعدی همون کاری رو که تا حالا گفتم رو انجام میدیم. کل مقادیر زیر متغیر Y رو با ماوس انتخاب می کنیم. چی میشه؟ میشه همچین چیزی که توی شکل زیر می بینید:

iie0nkv5m3d004efpxvq.jpg


ناحیه G14:G19 هم به راحتی مشخص شد. تا اینجای کار هر دو آرگومان تابع رو مشخص کردیم. همون طور که توی اون مربع آبی رنگ راهنما در شکل بالا هم می بینید، بعد از تعیین آرگومان ها باید پرانتز رو ببندیم. خوب بستیمش!

dgl6opdh3smk4zqkpi94.jpg


دیگه کار ما با این تابع تموم شده. حالا میخوایم نتیجه رو که همون ضریب رگرسیون این دو متغیر بود مشاهده کنیم. کافیه یه enter کنید. نتیجه واسه این داده ها چی میشه؟ عدد 0.95519 . این همون مقدار ضریب همبستگی بین این دو مجموعه از داده هاست.

0sid3ort900j61g5fsc.jpg



می بینید که کار ساده ای هست. همون طور که در ابتدا گفتم من فقط تمام جزییات رو به صورت گام به گام تشریح کردم. با چند مجموعه از داده های دلخواه امتحان کنید حتما روش انجام این کار رو راحت یاد می گیرید.
به امید خدا در ادامه دیگه در مورد بقیه توابعی که باهاشون کار می کنیم جزییات رو نمیارم. ادامه کارمون بحث در مورد توابع رگرسیون و پیش بینی از روی این چنین توابعی خواهد بود.
امیدوارم بحث مفیدی باشه.​


[MENTION=24881]arashz[/MENTION]
 

Dr.ben

کاربر ويژه
چند تا مفهوم مهم آماری رو می خوام به شکل ساده برای دوستان عزیزم بیان کنم. امیداوارم مفید باشه. این مفاهیم در نقشه ها زیاد دیده می شن.

1- کواریانس Covariance

کواریانس، معیاری هست که وجود یا عدم وجود و نیز نوع هبستگی خطی بین دو متغیر تصادفی رو مشخص می کنه. کواریانس دو متغییر تصادفی X و Y با نماد Cov(X,Y) نشون داده می شه.
تفسیر:
Cov(X,Y)>0 به این معنی هست که بین دو متغیر همبستگی خطی مثبت وجود داره.
Cov(X,Y)<0 به این معنی هست که بین دو متغیر همبستگی خطی منفی وجود داره.
Cov(X,Y)=0 به این معنی هست که بین دو متغیر همبستگی خطی منفی وجود نداره.


2- ضریب هبستگی Correlation

کواریانس وجود یا عدم وجود و نوع هبستگی خطی بین دو متغیر رو مشخص می کنه ولی شدت همبستگی رو معلوم نمی کنه. برای تعیین شدت همبستگی بین دو متغیر از معیار دیگه ای استفاده میشه به اسم ضریب همبستگی که با نماد r نشون داده میشه.

ضریب هبستگی مثبت بیانگر این است که دو متغیر در یک جهت و پا به پای همدیگه تغییر می کنن. یعنی افزایش یکی با افزایش دیگری و بر عکس کاهش یکی با کاهش دیگری همراه هست. وقتی ضریب همبستگی مثبت باشه خط رگرسیون شیب مثبت داره.
همبستگی منفی بیانگر این هست که دو متغیر در جهت عکس همدیگه تغییر می کنن. وقتی یکی افزایش پیدا میکنه متغیر دیگه کاهش پیدا میکنه و بر عکس.
ضریب هبستگی صفر بیانگر این هست که تغییرات دو متغیر با روش قابل پیش بینی به هم مرتبط نیستند.

مهم:
رابطه همبستگی در برابر رابطه علیت

یک ضریب همبستگی بالا بین دو متغیر الزاما به این معنی نیست که یکی از دو متغیر علت متغیر دیگه هست. چون احتمال داره که متغیر سومی دلیل تغییرات هر دوی اون متغیرها بوده باشه.
مثلا فرض کنید بررسی ما نشون داده باشه که بین مقدار برگ یک درخت و تعداد پرنده هایی که روی اون درخت میشینن، ضریب همبستگی مثبت وجود داره. اما وجود این همبستگی مثبت اصلا به این معنی نیست که مثلا بگیم "ریختن برگ درخت باعث میشه که پرنده ها از اون درخت دور بشن" یا مثلا "پراوز پرنده ها و بال و پر زدشون باعث میشه که برگ درخت بریزه". در واقع تغییر تعداد برگ های درخت علت تغییر تعداد پرنده ها یا تغییر تعداد پرنده های روی درخت علت تغییر برگ های درخت نیست و در عمل متغیر سومی که تغییر فصل هست علت تغییر هر دو تای اون هاست. یعنی اومدن فصل پاییز هم باعث ریختن برگ درخت و هم کم شدن تعداد پرنده ها بوده.
بنابراین ضریب همبستگی رو فقط بر اساس ارتباط همبستگی و برای پیش بینی میشه تفسیر کرد نه به عنوان یک رابطه علت و معلولی.

ارتباط قوی بین دو متغیر اما ضریب همبستگی پایین یا کوچک

در دو حالت زیر ضریب همبستگی کوچک بین دو متغیر X و Y به این معنی نیست که این دو متغیر ارتباط قوی با همدیگه ندارند:
الف: غیر خطی بودن ارتباط بین دو متغیر (Nonlinearity). برای حل این مشکل از تکنیک های همبستگی غیر خطی استفاده میشه.
ب: ناقص بودن دامنه ی نمونه. یعنی داد های ما اندک بوده یا تمام دامنه تغییرات دو متغیر رو شامل نشده.

3. رگرسیون Regression
تحلیل رگرسیون وقتی پیش میاد که فقط تبعیت یک متغیر از متغیر یا متغیرهای دیگر مورد بررسی هست.
دو موضوع رو در رگرسیون خطی مورد بررسی قرار می دیم:
1- رسم خطی که به بهترین شکل داده ها را برازش (پوشش) می کنه و خط رگرسیون نامیده میشه.
2- به دست آوردن معادله خط رگرسیون و پیش بینی اندازه یک متغیر با در اختیار داشتن اندازه ی متغیر دیگه ای که همبسته اون (متغیر اول) هست.

باید توجه داشت که در خیلی از بررسی های آماری به جای یک متغیر با دو متغیر سر و کار داریم و مطالعه ی رفتار مشترک این دو متغیر مورد نظر ما هست. مثلا فرض کنید می خواهیم بررسی کنیم که بین ساعات مطالعه ی دانشجوها و نمره ای که در امتحان میگیرن چه رابطه ای وجود داره، بین اندازه قد پدر و قد فرزندان پسر چی؟ یا مثلا بین آبیاری یک باغ و رشد درختان. در هواشناسی مثلا می خواهیم بررسی کنیم که بین شاخص NAO و مقادیر بارش چه رابطه ای وجود داره. و از این جور.

با پیدا کردن و شناختن این رابطه ی احتمالی، میشه یکی از دو متغیر رو کنترل یا پیش بینی کرد.

اگه بین دو متغیر X و Y همبستگی معنی داری وجود داشته باشه، مقدار هر کدوم از این دو متغیر رو میشه بر حسب متغیر دیگه پیش بینی کرد. تکنیکی که به کار گرفته میشه تحلیل رگرسیون نامیده میشه. اغلب پیش بینی بر این فرض استوار هستند که ارتباط بین دو متغیر از نوع خطی هستند. که این سادترین نوع رگرسیون هست و به اون می گن رگرسیون خطی دو متغیره.

مثالی از رگرسیون دو متغیره خطی

برای توضیح این مفهوم، فرض کنید داده های زیر از تعداد ساعات مطالعه 10 دانشجو برای گذراندن یک آزمون جمع آوری شده باشه (نمره آزمون از 100 هست):

q0u76d35ymjcx7t43jbo.jpg


حالا این داده ها رو به صورت نقاطی در محورهای مختصات مشخص می‌ کنیم. به همچین نموداری می گن نمودار پراکنش:


Click here to view the original image of 689x549px.
xdigjdl0m6gxmud0ldhm.jpg


هدف ما این هست که معادله خطی رو پیدا کنیم که از بیشتر این نقاط گذشته و حداقل فاصله رو از نقاطی که از اون ها نمی گذره داشته باشه. در واقع می خواهیم خطی رسم کنیم که در مقایسه با هر خطی دیگه ای در مجموع کمترین فاصله رو از تمامی نقاط پراکنش داشته باشه. به این خط می گن خط بهترین برازش یا خط رگرسیون.
فرض کنید واسه این نمودار پراکنش، خط نقطه چین قرمز، خط رگرسیون باشه:


Click here to view the original image of 641x533px.
9owg6bfplvgijip2k7op.jpg


حالا فایده ی این خط رگرسیون چیه؟
خط رگرسیون ما رو قادر به پیش بینی ویژگی های تمام اون چیزهایی که در نمونه ما وجود نداره، میکنه.
توی مثال ما توضیح این مطلب به این صورت میشه: جدول قبلی 10 نمونه از اطلاعات مربوط به ساعات مطالعه و نمره امتحانی رو داشت. خوب حالا که ما خط رگرسیون رو داریم، فرض کنید از ما سوال بشه که پیش بینی ما از نمره امتحانی دانشجویانی که 15 ساعت و یا حدود 24 ساعت مطالعه داشتن چیه؟ همون طور که می بینید از روی جدول بالایی نمی شه نمره احتمالی این دانشجوها رو اعلام کرد. اما با توجه به اینکه ما خط رگرسیون رو داریم کافیه روی محور X ها مقادیر 24 و 15 رو پیدا کنیم و بعدش از اونجا به خط رگرسیون وصل کنیم و بعد هم یه عمود رسم کنیم روی محور Y ها تا ببینیم نمره دانشجو بر اساس این تحلیل چه عددی پیش بینی میشه. بر این اساس همون طور که توی شکل زیر مشاهده می کنین، پیش بینی ما این هست که دانشجویی که 15 ساعت مطالعه کرده نمره 70 بگیره (دایره سبز) و دانشجویی که 24 ساعت مطالعه داشت نمره کامل یعنی 100 بگیره (دایره آبی).


Click here to view the original image of 654x533px.
wuozeoacmz8p4xqmeiwu.jpg

خوب حالا فرض کنید بعد از امتحان می خواهیم به صورت دستی دقت پیش بینی مون رو بررسی کنیم. فرض کنید داده های واقعی نشون میدن که شش تا از دانشجویانی که حدود 24 ساعت مطالعه داشتن نمره ای در حدود 100 در امتحان گرفتن. خوب تا اینجا ما خیلی به خودمون امیدوار میشیم اما ناگهان یه دانشجو پیدا میشه که 24 ساعت و حتی بیشتر مطالعه کرده ولی نمره اش شده مثلا 10 (امتحان از 100 نمره بود)، در حالیکه بر طبق پییش بینی ما، این دانشجو باید نمره ی در حدود 100 می گرفت! در این مورد پیش بینی ما خطای زیادی داشته. اینجاست که متوجه میشیم شاید ما عامل تاثیر گذاری مثل عدم یادگیری برخی از دانشجوها رو در نظر نگرفته بودیم! پس یکی از دلایل این خطای بسیار زیاد می تونه این باشه که بین نمونه های ما در جدول بالا، چنین دانشجویانی آمار برداری نشده بودند و همین باعث شده در این مورد خط رگرسیون ما چندان دقت نداشته باشه.
هدفم از طرح این موضوع این بود که کار پیش بینی با کمترین خطا از روی همچین خط رگرسیونی به این سادگی ها هم نیست. دقت پیش بینی هم دارای تعریف آماری خودش هست و به این معنی نیست که در تمامی موارد کاملا با واقعیت های عینی مطابقت وجود داره.

اما در هر حال، همون طور که متوجه شدید پیدا کردن معادله خط رگرسیون اهمیت زیادی داره. البته باید اشاره کنم توضیحاتی که دادم در مورد رگرسیون دو متغیره خطی بود. رگرسیون های چند متغیره (بیشتر از دو متغیر) و غیر خطی هم داریم که در اون ها پیدا کردن معادله منحنی برازش داده ها خیلی پیچیده تر هست.


در مورد هر کدوم از مفاهیمی که گفتم رابطه های ریاضی زیادی واسه بدست آوردن مقادیرشون وجود داره اما من برای ساده تر شدن بحث، هیچ کدوم از اونها رو اینجا نیاوردم. اگه مطلب طولانی شد ببخشید.
 

Dr.ben

کاربر ويژه
ایجاد یک سیستم پیش بینی ساده با توجه به مقادیر داده های جمع آوری شده از گذشته

مطالبی که این بار توضیح میدم در ادامه مطالب مطرح شده طی دو پست قبلی هست.
در پست قبلی توضیح دادم که اگه دو مجموعه داده داشته باشیم و اون ها رو به صورت نقاطی در صفحه مختصات مشخص کنیم (نمودار پراکنش) و بتونیم معادله ی خطی رو پیدا کنیم که در مقایسه با هر خطی دیگه ای در مجموع کمترین فاصله رو از تمامی نقاط پراکنش داشته باشه، به این خط می گن خط بهترین برازش یا خط رگرسیون. خط رگرسیون ما رو قادر به پیش بینی ویژگی های تمام اون چیزهایی که در نمونه ما وجود نداره، میکنه.

ادامه توضیحات:

توی توضیحات مثال قبل دیدیم خط رگرسیون به صورت زیر رسم شد. امروز هدف ما پیدا کردن معادله این خط هست. تصویر پایین رو ببینید:

fi2lseqh0n2hdvxne4q.jpg


برای پیدا کردن معادله خط رگرسیون باید مقادیر مجهول a و b را بدست آوریم.
فرض می‌شه که:

X متغیر مستقل یا متغیر پیش بینی کننده.
Y متغیر وابسته یا متغیر پیش بینی شونده.

معمولا b رو از رابطه زیر محاسبه می کنیم:

17zm1rsp9w63zkgf01.jpg


از همین رابطه، ارتباط بین ضریب همبستگی و معادله خط رگرسیون مشخص میشه. توجه کنید که در تعیین شیب خط رگرسیون از ضریب همبستگی بین دو متغیر استفاده میشه. بعد از بدست آوردن شیب خط رگرسیون یعنی مقدار b از رابطه ی بالا، مقدار a یعنی عرض از مبدا رو به صورت زیر محاسبه می کنیم:

koyqi3h3n5aks91993zr.jpg


در عمل هر چه قدر مطلق ضریب همبستگی یعنی r به عدد 1 نزدیک تر باشه نشان دهنده همبستگی قوی تر بین متغیرها هست و در نتیجه متغیر پیش بینی کننده یعنی X، پیش بینی قوی تری برای متغیر پیش بینی شونده یعنی Y ارائه می ده.

به این ترتیب معادله خط رگرسیون رو بدست آوردیم. حالا در معادله خط رگرسیون Y=a+bX هر مقداری که برای متغیر پیش بینی کننده یعنی X، قرار بدیم به راحتی مقدار متغیر پیش بینی شونده یعنی Y حاصل میشه.

خوب الان برسیم به محاسبه داده ها به کمک نرم افزار اکسل و ایجاد سیستم پیش بینی مورد نظرمون.

روش اول استفاده از توابع اکسل

گفتم برای تعین معادله خط رگرسیون دو مجموعه از داده ها، باید شیب خط b و عرض از مبدا a رو تعیین کنیم این کار به کمک اکسل به سادگی انجام میشه.
فرض کنید داده های مربوط به X یعنی متغیر مستقل یا متغیر پیش بینی کننده و Y یعنی متغیر وابسته یا متغیر پیش بینی شونده رو به صورت زیر در محیط اکسل وارد کنیم.

sl3aeizrxa1tr09frto2.jpg


خوب سوالی که مطرح می کنم این هست:

با توجه به این مقادیر اگر مقدار متغیر X برابر 40 باشد پیش بینی شما از مقدار متغیر Y چیست؟

اگه بخواهیم برای پاسخ به این سوال از رگرسیون دو متغیره خطی استفاده کنیم، باید معادله خط رگرسیون رو پیدا کنیم و همون طور که توضیح دادم برای تعیین معادله خط رگرسیون لازم هست شیب خط b و عرض از مبدا a رو تعیین کنیم.
برای تعیین شیب خط رگرسیون از تابع SLOPE استفاده می کنیم. همون طور که قبلا توضیح دادم در یکی از سلول ها علامت = بعدش به ترتیب S بعدش L و O رو تایپ می کنیم تابع پایین سلول نمایان میشه روش دو مرتبه کلیک کنید. تصویر زیر رو ببینید

i6l2ijzo6g68f2f9cdi.jpg


خوب قبلا گفتم کادر پایین به عنوان راهنما استفاده میشه. مشاهده می کنید این تابع دو تا آرگومان داره. ابتدا باید آدرس مقادیر مربوط به متغیر پیش بینی شونده Y رو به تابع بدیم. به سادگی با حرکت ماوس مقادیر زیر Y رو انتخاب می کنیم. بعدش برای رفتن به آرگومان بعدی از علامت ویرگول , استفاده می کنیم:

x6h7o20d5n8gqd2cofs.jpg


حالا باید آدرس مربوط به داده های پیش بینی کننده یعنی X رو وارد کنیم. دقیقا مثل حالت قبل عمل می کنیم. در نهایت پرانتز رو می بندیم:

ijq5wihqv1atost5cpks.jpg


تابع تکمیل شد. کافیه enter کنیم تا نتیجه رو که همون شیب خط رگرسیون هست مشاهده کنیم. می بینید که نتیجه مقدار 1.32 هست. بنابراین مقدار b شد 1.32.

6ctlrv5k1kb6htk4a8bp.jpg


حالا برسیم به تعیین عرض از مبدا خط رگرسیون یعنی مقدار a. تابع بدست آوردن عرض از مبدا در اکسل تابع INTERCEPT هست. به شیوه ای که گفتم این تابع رو فراخوانی کنید:

vf46objyntsv9hokihq.jpg


مشاهده می کنید این تابع هم دو تا آرگومان داره. ابتدا باید آدرس مقادیر مربوط به متغیر پیش بینی شونده Y رو به تابع بدیم. بعدش هم علامت ویرگول , رو میذاریم. در ادامه باید آدرس مربوط به داده های پیش بینی کننده یعنی X رو وارد کنیم. دقیقا مثل حالت قبل عمل می کنیم. در نهایت پرانتز رو می بندیم:

t3aq7qlvappf71yvm3kt.jpg


تابع تکمیل شد. کافیه enter کنیم تا نتیجه رو که همون عرض از مبدا خط رگرسیون هست مشاهده کنیم. می بینید که نتیجه مقدار 0.4 هست. بنابراین مقدار a شد 0.4 .

hv0zqh310p0t65gutp9t.jpg


حالا که هم مقدار a و هم مقدار b رو داریم کافیه این مقادیر رو در معادله Y=a+bX قرار بدیم نتیجه چی میشه؟
Y=0.4+1.32X

به این ترتیب معادله خط رگرسیون رو بدست آوردیم. حالا در معادله خط رگرسیون هر مقداری که برای متغیر پیش بینی کننده یعنی X، قرار بدیم به راحتی مقدار متغیر متغیر پیش بینی شونده یعنی Y حاصل میشه.

بر گردیم به سوال مطرح شده. سوال این بود که اگه مقدار متغیر پیش بینی کننده X برابر 40 باشه، پیش بینی ما از مقدار متغیر Y چی هست؟ کافیه به جای X در رابطه بالا مقدار 40 رو قرار بدیم:

Y=0.4+(1.32*40)=53.2

پس اگه مقدار متغیر پیش بینی کننده X برابر 40 باشه، پیش بینی ما از مقدار متغیر Y عدد 53.2 خواهد بود.

روش ساده تری هم برای انجام همین عملیات وجود داره که در روزهای آینده در موردش توضیح می دم. فکر می کنم بحث آینده در مورد پیش بینی جذاب، بشه.
 
بالا