【變量間的相關關系】
一、變量間的相關關系
1.常見的兩變量之間的關系有兩類:一類是函數(shù)關系,另一類是相關關系;與函數(shù)關系不同,相關關系是一種非確定性關系.
2.從散點圖上看,點分布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關關系稱為正相關,點分布在左上角到右下角的區(qū)域內(nèi),兩個變量的相關關系為負相關.
二、兩個變量的線性相關
1.從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0時,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
三、解題方法
1.相關關系的判斷方法一是利用散點圖直觀判斷,二是利用相關系數(shù)作出判斷.
2.對于由散點圖作出相關性判斷時,若散點圖呈帶狀且區(qū)域較窄,說明兩個變量有一定的線性相關性,若呈曲線型也是有相關性.
3.由相關系數(shù)r判斷時|r|越趨近于1相關性越強.
【用樣本估計總體】
1、數(shù)據(jù)的兩個特征:集中趨勢和波動性。集中趨勢指的是數(shù)據(jù)的“一般水平”或曰“平均水平”,波動性指的是數(shù)據(jù)圍繞“平均值”的變化情況。
2、反映數(shù)據(jù)“大多數(shù)水平”(集中趨勢)的量——眾數(shù)
眾數(shù):即樣本數(shù)據(jù)中頻數(shù)(或頻率)的數(shù)據(jù)。
特點:①可以不存在或不止一個;
、诓皇軜O端數(shù)據(jù)的影響,求法簡單;
、劭煽啃圆,如0,0,2,3,5這組數(shù)據(jù)中,眾數(shù)是0,它很難真實反映這組數(shù)據(jù)的“平均水平”(集中趨勢);
④眾數(shù)在難以定義“平均數(shù)”或“中位數(shù)”時常用,故一般可用于統(tǒng)計非數(shù)字型數(shù)據(jù),如“牛,羊,馬,魚,牛”這組數(shù)據(jù)中,眾數(shù)是“!;
、荼姅(shù)在銷售統(tǒng)計中常用
3、反映數(shù)據(jù)“中間水平”(集中趨勢)的量——中位數(shù)
中位數(shù):把一組數(shù)據(jù)按從小到大的數(shù)序排列,在中間的一個數(shù)字(或兩個數(shù)字的平均值)叫做這組數(shù)據(jù)的中位數(shù)。
特點:①中位數(shù)把樣本數(shù)據(jù)分為兩部分,一部分大于中位數(shù),另一部分小于中位數(shù);
②中位數(shù)不受少數(shù)幾個極端值的影響;
、塾捎诋敇颖緮(shù)據(jù)為偶數(shù)個時,中位數(shù)等于中間兩個數(shù)據(jù)的平均值,因此有時中位數(shù)未必在樣本數(shù)據(jù)中.
【隨機抽樣】
一、簡單隨機抽樣
1.簡單隨機抽樣的概念:
設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.
2.最常用的簡單隨機抽樣方法有兩種——抽簽法和隨機數(shù)法.
二、系統(tǒng)抽樣的步驟
假設要從容量為N的總體中抽取容量為n的樣本:
(1)先將總體的N個個體編號;
(2)確定分段間隔k,對編號進行分段,當是整數(shù)時,取k=;
(3)在第1段用簡單隨機抽樣確定第一個個體編號l(l≤k);
(4)按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個個體編號l+k,再加k得到第3個個體編號l+2k,依次進行下去,直到獲取整個樣本.
三、分層抽樣
1.分層抽樣的概念:
在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是分層抽樣.
2.當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣的方法.
3.分層抽樣時,每個個體被抽到的機會是均等的.