【#美國大學(xué)預(yù)修課程# #歷年AP統(tǒng)計學(xué)真題解析及答案#】AP統(tǒng)計學(xué)考試有選擇題和簡答題兩種類型,相對于選擇題來說,簡答題的難點在于根據(jù)實驗?zāi)康,明確實驗步驟,注重實驗細節(jié),并用英文表述出來。因為可以使用計算器,因此計算的部分一般不是難點,但解答過程又不能直接寫出使用計算器得出的數(shù)字結(jié)果,還要分步驟寫出計算過程。

考點:1.用box plot展示兩組數(shù)據(jù)的分布;
2.計算數(shù)據(jù)的特征值,從而做出統(tǒng)計決策。
分析:a.兩個箱線圖的分布中,集中程度的指標(biāo)(采用中位數(shù))是近似一樣的,離散程度的指標(biāo)(極差和四分位差)是有區(qū)別的。注意對異常值的描述。在這個問題中,不用描述數(shù)據(jù)分布的信息(即判斷分布是對稱、左偏或有偏),因為箱線圖并不能直觀展示這一特征。
b.A比B好在值比較大,B比A好在最小值比較大。(答題過程中要注意上下文的背景信息。)
參考答案:

往年考題中也有很多對比描述的問題,如 2011-B-1、2012-3、2013-6(對用histogram、line graph展示的兩組數(shù)據(jù)進行比較)。

考點:1.用置信區(qū)間進行總體比例的假設(shè)檢驗;
2.在做總體比例的區(qū)間估計時,樣本量和邊際誤差之間的關(guān)系。
分析:a.通過一個樣本值,估計出總體比例的置信區(qū)間為(0.09,0.21),包含給定的總體值0.2,故不能拒絕這一總體值;
b.樣本量變大4倍時,抽樣分布的標(biāo)準(zhǔn)差變小為原來的1/√(4),邊際誤差也變?yōu)樵瓉淼囊话。寫出邊際誤差的計算公式即可看出數(shù)量關(guān)系。
c.邊際誤差變小后,置信區(qū)間變小,不再包含給定的總體值,只能拒絕這一總體值。
參考答案:


考點:1.離散型隨機變量的概率分布;
2.離散型隨機變量概率分布的期望值;
3.條件概率;
4.給定變量值下的期望值。
分析:a.給定離散型隨機變量的概率分布,事件的并,用加法;
b.給定離散型隨機變量的概率分布,計算期望值;
c.條件概率的計算;
d.樣本空間變化后,得到新的離散型隨機變量的概率分布,計算期望值。
參考答案:


考點:兩個總體比例差的假設(shè)檢驗
分析:實驗?zāi)康模簷z驗服用低劑量的阿司匹林是否能減低患大腸癌的幾率;
實驗思路:1000個人隨機分成兩組,分別進行兩個處理(服用低劑量的阿司匹林、服用安慰劑),測試患病的比例,比較兩個比例的差值,從而驗證低劑量的阿司匹林能夠降低患病的幾率。用兩個總體比例差的假設(shè)檢驗即可。
注意:1.兩個總體比例差的假設(shè)檢驗的4個步驟;
2.左尾檢驗
3.聯(lián)合比例的計算
計算器操作:STAT-TEST-2 proportion Z test
參考答案:




此類題目在往年的考試真題中并不鮮見,比如2007-A-5、2007-B-6均考察的是總體比例差的假設(shè)檢驗問題。



考點:1.散點圖的描述;
2.獲取和解釋散點圖的線性回歸直線;
3.利用回歸方程預(yù)測函數(shù)值。
分析:a.散點圖的描述步驟:shape、direction、strength,注意結(jié)合背景內(nèi)容;
b.區(qū)分y=x、y>x、y<x在平面內(nèi)對應(yīng)的區(qū)域(數(shù)學(xué)中的線性規(guī)劃問題)
c.最小二乘法確定的直線是對散點圖進行線性回歸的方法,用來預(yù)測給定x值下的函數(shù)值。
參考答案:






考點:1.描述不同抽樣方法下樣本的數(shù)據(jù);
2.描述兩種不同抽樣方法下的抽樣分布;
3.選擇能夠更好估計總體均值的抽樣方法。
分析:第一種抽樣方法是從兩個生產(chǎn)線的一共200,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布;
第二種抽樣方法是從兩個生產(chǎn)線中任意抽取一個生產(chǎn)線生產(chǎn)的100,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布。
a.第二種方法抽取的樣本的直徑并不能代表當(dāng)天所有玉米餅的總體直徑的情況,因為它只能代表一個生產(chǎn)線的產(chǎn)品直徑信息;
b.題設(shè)中的直方圖的分布是雙峰的,意味著樣本的信息來源于兩個均值不同的總體,所以最有可能是用第一種的抽樣方法獲取的。假如用第二種的抽樣方法,樣本信息很有可能是均值為5.9inches或者6.1inches的單峰分布;
c.某一天中,用第二種方法抽取的樣本的波動性小,因為它是從兩個生產(chǎn)線中的一個中隨機抽取的。假如采用第一種抽樣方法,則會包含兩個分布不同的總體的信息,波動性較大;
d.因為n=200>30,根據(jù)中心極限定理,樣本均值的抽樣分布的期望值等于總體均值,標(biāo)準(zhǔn)差等于總體標(biāo)準(zhǔn)差/√(n);
e.一年365天中均采用同一種抽樣方法的話,第一種方法計算的樣本均值的標(biāo)準(zhǔn)差(即波動性)小,均值和標(biāo)準(zhǔn)差的數(shù)值參見答案;
d.如若采用第二種方法,則大概有一半的樣本均值約等于5.9inches,另一半的樣本均值約等于6.1inches;
f.第一種方法更容易得到均值為6inches的樣本。因為當(dāng)兩種抽樣的結(jié)果是無偏的情況下,樣本均值的抽樣分布的標(biāo)準(zhǔn)差越小,越能得到穩(wěn)定的結(jié)果。根據(jù)e問,得出此問的答案。
難點:考察一個樣本量為200的樣本的分布,和用所有樣本量為200的樣本計算抽樣分布是不同的。
參考答案:


考點:1.用box plot展示兩組數(shù)據(jù)的分布;
2.計算數(shù)據(jù)的特征值,從而做出統(tǒng)計決策。
分析:a.兩個箱線圖的分布中,集中程度的指標(biāo)(采用中位數(shù))是近似一樣的,離散程度的指標(biāo)(極差和四分位差)是有區(qū)別的。注意對異常值的描述。在這個問題中,不用描述數(shù)據(jù)分布的信息(即判斷分布是對稱、左偏或有偏),因為箱線圖并不能直觀展示這一特征。
b.A比B好在值比較大,B比A好在最小值比較大。(答題過程中要注意上下文的背景信息。)
參考答案:

往年考題中也有很多對比描述的問題,如 2011-B-1、2012-3、2013-6(對用histogram、line graph展示的兩組數(shù)據(jù)進行比較)。

考點:1.用置信區(qū)間進行總體比例的假設(shè)檢驗;
2.在做總體比例的區(qū)間估計時,樣本量和邊際誤差之間的關(guān)系。
分析:a.通過一個樣本值,估計出總體比例的置信區(qū)間為(0.09,0.21),包含給定的總體值0.2,故不能拒絕這一總體值;
b.樣本量變大4倍時,抽樣分布的標(biāo)準(zhǔn)差變小為原來的1/√(4),邊際誤差也變?yōu)樵瓉淼囊话。寫出邊際誤差的計算公式即可看出數(shù)量關(guān)系。
c.邊際誤差變小后,置信區(qū)間變小,不再包含給定的總體值,只能拒絕這一總體值。
參考答案:


考點:1.離散型隨機變量的概率分布;
2.離散型隨機變量概率分布的期望值;
3.條件概率;
4.給定變量值下的期望值。
分析:a.給定離散型隨機變量的概率分布,事件的并,用加法;
b.給定離散型隨機變量的概率分布,計算期望值;
c.條件概率的計算;
d.樣本空間變化后,得到新的離散型隨機變量的概率分布,計算期望值。
參考答案:


考點:兩個總體比例差的假設(shè)檢驗
分析:實驗?zāi)康模簷z驗服用低劑量的阿司匹林是否能減低患大腸癌的幾率;
實驗思路:1000個人隨機分成兩組,分別進行兩個處理(服用低劑量的阿司匹林、服用安慰劑),測試患病的比例,比較兩個比例的差值,從而驗證低劑量的阿司匹林能夠降低患病的幾率。用兩個總體比例差的假設(shè)檢驗即可。
注意:1.兩個總體比例差的假設(shè)檢驗的4個步驟;
2.左尾檢驗
3.聯(lián)合比例的計算
計算器操作:STAT-TEST-2 proportion Z test
參考答案:




此類題目在往年的考試真題中并不鮮見,比如2007-A-5、2007-B-6均考察的是總體比例差的假設(shè)檢驗問題。



考點:1.散點圖的描述;
2.獲取和解釋散點圖的線性回歸直線;
3.利用回歸方程預(yù)測函數(shù)值。
分析:a.散點圖的描述步驟:shape、direction、strength,注意結(jié)合背景內(nèi)容;
b.區(qū)分y=x、y>x、y<x在平面內(nèi)對應(yīng)的區(qū)域(數(shù)學(xué)中的線性規(guī)劃問題)
c.最小二乘法確定的直線是對散點圖進行線性回歸的方法,用來預(yù)測給定x值下的函數(shù)值。
參考答案:






考點:1.描述不同抽樣方法下樣本的數(shù)據(jù);
2.描述兩種不同抽樣方法下的抽樣分布;
3.選擇能夠更好估計總體均值的抽樣方法。
分析:第一種抽樣方法是從兩個生產(chǎn)線的一共200,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布;
第二種抽樣方法是從兩個生產(chǎn)線中任意抽取一個生產(chǎn)線生產(chǎn)的100,000個玉米餅中隨機抽取200個玉米餅作為樣本,計算該樣本直徑均值的抽樣分布。
a.第二種方法抽取的樣本的直徑并不能代表當(dāng)天所有玉米餅的總體直徑的情況,因為它只能代表一個生產(chǎn)線的產(chǎn)品直徑信息;
b.題設(shè)中的直方圖的分布是雙峰的,意味著樣本的信息來源于兩個均值不同的總體,所以最有可能是用第一種的抽樣方法獲取的。假如用第二種的抽樣方法,樣本信息很有可能是均值為5.9inches或者6.1inches的單峰分布;
c.某一天中,用第二種方法抽取的樣本的波動性小,因為它是從兩個生產(chǎn)線中的一個中隨機抽取的。假如采用第一種抽樣方法,則會包含兩個分布不同的總體的信息,波動性較大;
d.因為n=200>30,根據(jù)中心極限定理,樣本均值的抽樣分布的期望值等于總體均值,標(biāo)準(zhǔn)差等于總體標(biāo)準(zhǔn)差/√(n);
e.一年365天中均采用同一種抽樣方法的話,第一種方法計算的樣本均值的標(biāo)準(zhǔn)差(即波動性)小,均值和標(biāo)準(zhǔn)差的數(shù)值參見答案;
d.如若采用第二種方法,則大概有一半的樣本均值約等于5.9inches,另一半的樣本均值約等于6.1inches;
f.第一種方法更容易得到均值為6inches的樣本。因為當(dāng)兩種抽樣的結(jié)果是無偏的情況下,樣本均值的抽樣分布的標(biāo)準(zhǔn)差越小,越能得到穩(wěn)定的結(jié)果。根據(jù)e問,得出此問的答案。
難點:考察一個樣本量為200的樣本的分布,和用所有樣本量為200的樣本計算抽樣分布是不同的。
參考答案:

