一、變量間的相關關系
1.常見的兩變量之間的關系有兩類:一類是函數關系,另一類是相關關系;與函數關系不同,相關關系是一種非確定性關系.
2.從散點圖上看,點分布在從左下角到右上角的區(qū)域內,兩個變量的這種相關關系稱為正相關,點分布在左上角到右下角的區(qū)域內,兩個變量的相關關系為負相關.
二、兩個變量的線性相關
1.從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0時,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
三、解題方法
1.相關關系的判斷方法一是利用散點圖直觀判斷,二是利用相關系數作出判斷.
2.對于由散點圖作出相關性判斷時,若散點圖呈帶狀且區(qū)域較窄,說明兩個變量有一定的線性相關性,若呈曲線型也是有相關性.
3.由相關系數r判斷時|r|越趨近于1相關性越強.
【同步練習題】
1.(2014•銀川模擬)為了解兒子身高與其父親身高的關系,隨機抽取5對父子的身高數據如下:
父親身高x(cm)174176176176178;兒子身高y(cm)175175176177177,則y對x的線性回歸方程為()
A.y^=x-1B.y^=x+1C.y^=88+12xD.y^=176
解析:因為x=174+176+176+176+1785=176,
y=175+175+176+177+1775=176,
又y對x的線性回歸方程表示的直線恒過點(x,y),所以將(176,176)代入A、B、C、D中檢驗知選C.
答案:C
2.(2014•衡陽聯(lián)考)已知x與y之間的一組數據:
x0123
ym35.57
已求得關于y與x的線性回歸方程y^=2.1x+0.85,則m的值為()
A.1B.0.85C.0.7D.0.5
解析:回歸直線*樣本中心點(1.5,y),故y=4,m+3+5.5+7=16,得m=0.5.
答案:D
3.有甲、乙兩個班級進行數學考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計成績,得到如下所示的列聯(lián)表:
優(yōu)秀非優(yōu)秀總計
甲班10b
乙班c30
總計105
已知在全部105人中隨機抽取1人,成績優(yōu)秀的概率為27,則下列說法正確的是
()
A.列聯(lián)表中c的值為30,b的值為35
B.列聯(lián)表中c的值為15,b的值為50
C.根據列聯(lián)表中的數據,若按95%的可靠性要求,能認為“成績與班級有關系”
D.根據列聯(lián)表中的數據,若按95%的可靠性要求,不能認為“成績與班級有關系”
解析:由題意知,成績優(yōu)秀的學生數是30,成績非優(yōu)秀的學生數是75,所以c=20,b=45,選項A、B錯誤.根據列聯(lián)表中的數據,得到K2=105×10×30-20×45255×50×30×75≈6.109>3.841,因此有95%的把握認為“成績與班級有關系”.
答案:C
4.在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()
、偃鬕2的觀測值滿足K2≥6.635,我們有99%的把握認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99人患有肺病;②從獨立性檢驗可知有99%的把握認為吸煙與患肺病有關系時,我們說某人吸煙,那么他有99%的可能患有肺病;③從統(tǒng)計量中得知有95%的把握認為吸煙與患肺病有關系,是指有5%的可能性使得推斷出現錯誤.
A.①B.①③C.③D.②
解析:①推斷在100人吸煙的人中必有99人患有肺病,說法錯誤,排除A,B;③正確.
答案:C
5.調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到y(tǒng)對x的回歸直線方程:y^=0.254x+0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加________萬元.
解析:解法一:特殊值法.
令x1=1得y^1=0.254+0.321.
令x2=1+1=2得y^2=2×0.254+0.321.
y^2-y^1=0.254.
解法二:由y^1=0.254x1+0.321,
y^2=0.254(x1+1)+0.321,則y^2-y^1=0.254.
答案:0.254