A. 統計學試題求解 急!急!急!
北京信息科技大學 《統計學》課程期末考試試卷(A卷)
2007 ~2008學年第一學期
課程所在學院:經濟管理學院
一、單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.下列哪個不屬於一元回歸中的基本假定( D )。
A.對於所有的X,誤差項的方差都相同
B.誤差項 服從正態分布
C.誤差項 相互獨立
D.
2.某組數據分布的偏度系數為負時,該數據的眾數、中位數、均值的大小關系是( A )。
A.眾數>中位數>均值
B.均值>中位數>眾數
C.中位數>眾數>均值
D.中位數>均值>眾數
3.一元回歸方程為y=11.64一0.25x,則下列說法中正確的是( C )。
A.自變數平均增長一個單位,因變數減少0.25個單位
B.自變數和因變數之間成正相關關系
C.
D.
4.有甲乙兩組數列,則( A )數列平均數的代表性高。
A. 1< 2 1> 2,則乙數列平均數的代表性高
B. 1< 2 1> 2,則乙數列平均數的代表性低
C. 1= 2 1> 2,則甲數列平均數的代表性高
D. 1= 2 1< 2,則甲數列平均數的代表性低
5.某連續變數數列,其末組為開口組,下限為500,相鄰組的組中值為480,則末組的組中值為( A )。
A.520 B.510 C.500 D.540
6.不受極端變數值影響的平均數是( D )。
A.算術平均數 B.調和平均數
C.幾何平均數 D.眾數
7.有20個工人看管機器台數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上資料編制頻數分布數列應採用( A )。
A.單項式分組 B.等距分組 C.不等距分組 D.以上幾種分組均可以
8.若無季節變動,則季節比率應為( B )。
A.0 B. 1 C. 大於1 D. 小於1
9.如果一個定性的變數有m類,則要引進( C )個虛擬變數。
A.m B.m+1
C.m-1 D.無法判斷
10.第一組工人的平均工齡為5年,第二組為7年,第三組為10年,第一組工人數占總數的20%,第二組佔60%,則三組工人的平均工齡為( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企業2007年各種產品的產量比2006年增長了8%,總生產費用增長了12%,則該廠2007年單位成本( D )
A.減少了0.62% B.增加了0.62%
C.減少了3.7% D.增加了3.7%
12.相關系數r與斜率b2的符號( A )。
A.相同 B.不同
C.無法判斷
13.已知小姜買的兩種股票的綜合價格指數上漲了24點,本日股票的平均收盤價格為14元,前日股票的平均收盤價格為( C )
A.10.64 B.10.5
C.11.29 D.無法計算
14.若今年比去年的環比發展速度為112%,去年比前年的環比增長率為3%,那麼今年比前年的平均增長率為( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增長1%的絕對值為0.54,去年比前年增長的絕對值為5,則去年比前年的增長率為( C )。
A.9.3% B.8.7%
C.10.2% D.無法計算
二、多項選擇題(每小題2分,共16分)
在每小題列出的若干選項中有多個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.下列變數,屬於離散變數的有( A D E F )。
A.庫存產品數量 B.流動資產對流動負債的比率
C.貨物總重量 D.按個計量的貨物數量
E.一條收費公路上的交通量 F.公司年會的出席人數
2.指出下列數據收集屬於通過實驗的方法收集數據的有(A B E )
A.培訓航空機票代理人的新方法與傳統方法的比較結果
B.通過讓兩組可以比較的孩子分別使用兩種不同的組裝說明組裝玩具來比較這兩種組裝說明
C.一份產品評價雜志給它的訂閱者郵寄調查問卷,請他們為近期購買的產品排名
D.采訪一個購物中心的顧客,詢問他們為什麼在那裡購物
E.通過在兩個可比較地區分別採用不同的方法,比較兩種不同的養老金促銷方法
3.下列組限的表示方法哪些是對的( A B D )。
A.按職工人數分組,相鄰組的組限可以重疊,也可以間斷
B.職工按工資分組,其組限必須重疊
C.學生按成績分組,其組限必須間斷
D.人按身高分組,其組限必須重疊
4.下列屬於質量指標指數的有( A B D E )。
A.價格指數 B.單位成本指數
C.銷售量指數 D.工資水平指數
E.勞動生產率指數
5.具體地說,如果出現下列( A B C )情況,暗示多元回歸模型有可能存在多重共線性。
A.模型中各對自變數之間顯著相關
B.線形關系顯著,回歸系數 的t檢驗卻不顯著
C.回歸系數的正負號與預期相反
D.
6.算術平均數具有下列哪些性質( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在頻數分布數列中( C D E )。
A.總次數一定,頻數和頻率成反比 B.各組的頻數之和等於100
C.各組頻率大於0,頻率之和等於1 D.頻率越小,則該組數值所起作用越小
E.頻率表明各組變數值對總體的相對作用程度
8.標准差( C E )。
A.表明總體單位標志值的一般水平 B.反映總體單位的一般水平
C.反映總體單位標志值的離散程度 D.反映總體分布的集中趨勢
E.反映總體分布的離中趨勢
三、簡答題(本大題共2題,每題5分,共10分)
1.什麼是年度化增長率?它有何用途?
2.數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。( 錯 )
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。( 錯 )
3.連續型變數和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。( 對 )
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。( 對 )
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。( 錯 )
四、計算分析題(共54分)
1.將某郵局中外發郵包樣本的重量近似到盎司為:21,18,30,12,14,17,28,10,16,25。計算這組數據的均值,中位數,眾數,極差,四分位間距,從偏斜度的角度描述數據的分布形狀(10分)。
2.表1中列出了在一個為期三周的商務統計課程中學生課外學習的小時數和他們在課程結束時的測試分數的樣本數據如下:
表1 學生課外學習時間及考試分數統計表
學生樣本 1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
考試分數,Y 64 61 84 70 88 92 72 77
利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
標准誤差 6.157605
觀測值 8
方差分析
df SS MS F Significance F
回歸分析 1 658.5034 658.5034 17.36738233 0.005895457
殘差 6 227.4966 37.9161
總計 7 886
Coefficients 標准誤差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的? 86.21% 74.32%
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(3) 檢驗線性關系的顯著性 。
(4) 根據標准化殘差圖判斷關於隨機誤差項正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立
3.隨機抽取了15家大型商場銷售的同類產品的有關數據(單位:元),利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
標准誤差 69.75121
觀測值 15
方差分析
df SS MS F Significance F
回歸分析 2 31778.15 15889.08 3.265842 0.073722186
殘差 12 58382.78 4865.232
總計 14 90160.93
Coefficients 標准誤差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
註:X Variable 1為購進價格/元
X Variable 2為銷售費用/元
因變數Y為銷售價格/元
(1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系? 0.3089 0.0012 沒有,因為相關系數較小
(2)根據上訴結果,你認為用購進價格與銷售費用來預測是否有用?沒用
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。不顯著
(4)解釋判定系數R2,所得結論與問題(2)中是否一致? R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?高度相關
(6)模型中是否存在多重共線性?你對模型有何特長建議?可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4.一公司生產的三種產品的有關如下數據如下表所示 (共14分):
商品 計量單位 銷售量 單價(萬元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 噸 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)計算三種產品的銷售額指數;
(2)計算三種產品的銷售量指數;
(3)計算三種產品的單位價格指數;
(4)計算分析產量和單位價格的變動對銷售額影響的相對數和絕對數。
北京信息科技大學
2007 ~2008學年第一學期
《統計學》課程期末考試試卷標准答案(A卷)
一、 單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多項選擇題(每小題2分,共16分)
在每小題列出的五個選項中有二至五個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 簡答題(本大題共2題,每題5分,共10分)
1. 什麼是年度化增長率?它有何用途?
(1)增長率以年來表示時,稱為年度化增長率或年率,(+2)
其計算公式為:
m 為一年中的時期個數;n 為所跨的時期總數
季度增長率被年度化時,m =4
月增長率被年度化時,m =12
當m = n 時,上述公式就是年增長率 (+2)
(2)可將月度增長率或季度增長率轉換為年度增長率,實現增長率之間的可比性。(+1)
2. 數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。(×)
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。(×)
3.連續型變和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。(√)
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。(√)
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。(×)
五、計算分析題(共55分)
中位數的位置:(10+1)/2=5.5
中位數
從偏斜度的角度描述數據的分布形狀:均值>中位數,正向(右)偏
(+2)
2.(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的?
r=0.862109, (+1)
R2=0.743232, 考試分數的變差中有74.3232%是由於學習時間的變動引起的。(+2)
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(+3)
回歸系數的含義表明學習時間每增加一個小時, 考試分數平均增加1.497分。(+2)
(3) 檢驗線形關系的顯著性
Significance F=0.005895457〈 =5%
線性關系顯著。(+3)
(4) 根據標准化殘差圖判斷關於隨機誤差項服從正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立。(+4)
3. (1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系
(1)ryxi =0.308952067 ryx2=0.001214062,
沒有證據。(+2)
(2)根據上述結果,你認為用購進價格與銷售費用來預測是否有用?
沒有用。(+2)
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。
Significance F=0.073722> =5%
線性關系不顯著。(+3)
(4)解釋判定系數R2,所得結論與問題(2)中是否一致
R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?
rx1x2=-0.8529,高度相關(+2)
(6)模型中是否存在多重共線性?你對模型有何特長建議?
可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4. (1)三種產品的銷售額指數; (+3)
三種產品的銷售額指數=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8萬元
(2)三種產品的銷售量指數; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2萬元
(3)三種產品的價格指數; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4) 分析產量和單位價格的變動對銷售額影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元萬元=85.2萬元+11.6萬元 (+2)
B. 《統計學》期末考試試題
北京信息科技大學 《統計學》課程期末考試試卷(A卷)
2007 ~2008學年第一學期
課程所在學院:經濟管理學院
一、單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.下列哪個不屬於一元回歸中的基本假定( D )。
A.對於所有的X,誤差項的方差都相同
B.誤差項 服從正態分布
C.誤差項 相互獨立
D.
2.某組數據分布的偏度系數為負時,該數據的眾數、中位數、均值的大小關系是( A )。
A.眾數>中位數>均值
B.均值>中位數>眾數
C.中位數>眾數>均值
D.中位數>均值>眾數
3.一元回歸方程為y=11.64一0.25x,則下列說法中正確的是( C )。
A.自變數平均增長一個單位,因變數減少0.25個單位
B.自變數和因變數之間成正相關關系
C.
D.
4.有甲乙兩組數列,則( A )數列平均數的代表性高。
A. 1< 2 1> 2,則乙數列平均數的代表性高
B. 1< 2 1> 2,則乙數列平均數的代表性低
C. 1= 2 1> 2,則甲數列平均數的代表性高
D. 1= 2 1< 2,則甲數列平均數的代表性低
5.某連續變數數列,其末組為開口組,下限為500,相鄰組的組中值為480,則末組的組中值為( A )。
A.520 B.510 C.500 D.540
6.不受極端變數值影響的平均數是( D )。
A.算術平均數 B.調和平均數
C.幾何平均數 D.眾數
7.有20個工人看管機器台數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上資料編制頻數分布數列應採用( A )。
A.單項式分組 B.等距分組 C.不等距分組 D.以上幾種分組均可以
8.若無季節變動,則季節比率應為( B )。
A.0 B. 1 C. 大於1 D. 小於1
9.如果一個定性的變數有m類,則要引進( C )個虛擬變數。
A.m B.m+1
C.m-1 D.無法判斷
10.第一組工人的平均工齡為5年,第二組為7年,第三組為10年,第一組工人數占總數的20%,第二組佔60%,則三組工人的平均工齡為( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企業2007年各種產品的產量比2006年增長了8%,總生產費用增長了12%,則該廠2007年單位成本( D )
A.減少了0.62% B.增加了0.62%
C.減少了3.7% D.增加了3.7%
12.相關系數r與斜率b2的符號( A )。
A.相同 B.不同
C.無法判斷
13.已知小姜買的兩種股票的綜合價格指數上漲了24點,本日股票的平均收盤價格為14元,前日股票的平均收盤價格為( C )
A.10.64 B.10.5
C.11.29 D.無法計算
14.若今年比去年的環比發展速度為112%,去年比前年的環比增長率為3%,那麼今年比前年的平均增長率為( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增長1%的絕對值為0.54,去年比前年增長的絕對值為5,則去年比前年的增長率為( C )。
A.9.3% B.8.7%
C.10.2% D.無法計算
二、多項選擇題(每小題2分,共16分)
在每小題列出的若干選項中有多個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.下列變數,屬於離散變數的有( A D E F )。
A.庫存產品數量 B.流動資產對流動負債的比率
C.貨物總重量 D.按個計量的貨物數量
E.一條收費公路上的交通量 F.公司年會的出席人數
2.指出下列數據收集屬於通過實驗的方法收集數據的有(A B E )
A.培訓航空機票代理人的新方法與傳統方法的比較結果
B.通過讓兩組可以比較的孩子分別使用兩種不同的組裝說明組裝玩具來比較這兩種組裝說明
C.一份產品評價雜志給它的訂閱者郵寄調查問卷,請他們為近期購買的產品排名
D.采訪一個購物中心的顧客,詢問他們為什麼在那裡購物
E.通過在兩個可比較地區分別採用不同的方法,比較兩種不同的養老金促銷方法
3.下列組限的表示方法哪些是對的( A B D )。
A.按職工人數分組,相鄰組的組限可以重疊,也可以間斷
B.職工按工資分組,其組限必須重疊
C.學生按成績分組,其組限必須間斷
D.人按身高分組,其組限必須重疊
4.下列屬於質量指標指數的有( A B D E )。
A.價格指數 B.單位成本指數
C.銷售量指數 D.工資水平指數
E.勞動生產率指數
5.具體地說,如果出現下列( A B C )情況,暗示多元回歸模型有可能存在多重共線性。
A.模型中各對自變數之間顯著相關
B.線形關系顯著,回歸系數 的t檢驗卻不顯著
C.回歸系數的正負號與預期相反
D.
6.算術平均數具有下列哪些性質( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在頻數分布數列中( C D E )。
A.總次數一定,頻數和頻率成反比 B.各組的頻數之和等於100
C.各組頻率大於0,頻率之和等於1 D.頻率越小,則該組數值所起作用越小
E.頻率表明各組變數值對總體的相對作用程度
8.標准差( C E )。
A.表明總體單位標志值的一般水平 B.反映總體單位的一般水平
C.反映總體單位標志值的離散程度 D.反映總體分布的集中趨勢
E.反映總體分布的離中趨勢
三、簡答題(本大題共2題,每題5分,共10分)
1.什麼是年度化增長率?它有何用途?
2.數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。( 錯 )
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。( 錯 )
3.連續型變數和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。( 對 )
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。( 對 )
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。( 錯 )
四、計算分析題(共54分)
1.將某郵局中外發郵包樣本的重量近似到盎司為:21,18,30,12,14,17,28,10,16,25。計算這組數據的均值,中位數,眾數,極差,四分位間距,從偏斜度的角度描述數據的分布形狀(10分)。
2.表1中列出了在一個為期三周的商務統計課程中學生課外學習的小時數和他們在課程結束時的測試分數的樣本數據如下:
表1 學生課外學習時間及考試分數統計表
學生樣本 1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
考試分數,Y 64 61 84 70 88 92 72 77
利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
標准誤差 6.157605
觀測值 8
方差分析
df SS MS F Significance F
回歸分析 1 658.5034 658.5034 17.36738233 0.005895457
殘差 6 227.4966 37.9161
總計 7 886
Coefficients 標准誤差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的? 86.21% 74.32%
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(3) 檢驗線性關系的顯著性 。
(4) 根據標准化殘差圖判斷關於隨機誤差項正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立
3.隨機抽取了15家大型商場銷售的同類產品的有關數據(單位:元),利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
標准誤差 69.75121
觀測值 15
方差分析
df SS MS F Significance F
回歸分析 2 31778.15 15889.08 3.265842 0.073722186
殘差 12 58382.78 4865.232
總計 14 90160.93
Coefficients 標准誤差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
註:X Variable 1為購進價格/元
X Variable 2為銷售費用/元
因變數Y為銷售價格/元
(1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系? 0.3089 0.0012 沒有,因為相關系數較小
(2)根據上訴結果,你認為用購進價格與銷售費用來預測是否有用?沒用
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。不顯著
(4)解釋判定系數R2,所得結論與問題(2)中是否一致? R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?高度相關
(6)模型中是否存在多重共線性?你對模型有何特長建議?可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4.一公司生產的三種產品的有關如下數據如下表所示 (共14分):
商品 計量單位 銷售量 單價(萬元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 噸 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)計算三種產品的銷售額指數;
(2)計算三種產品的銷售量指數;
(3)計算三種產品的單位價格指數;
(4)計算分析產量和單位價格的變動對銷售額影響的相對數和絕對數。
北京信息科技大學
2007 ~2008學年第一學期
《統計學》課程期末考試試卷標准答案(A卷)
一、 單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多項選擇題(每小題2分,共16分)
在每小題列出的五個選項中有二至五個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 簡答題(本大題共2題,每題5分,共10分)
1. 什麼是年度化增長率?它有何用途?
(1)增長率以年來表示時,稱為年度化增長率或年率,(+2)
其計算公式為:
m 為一年中的時期個數;n 為所跨的時期總數
季度增長率被年度化時,m =4
月增長率被年度化時,m =12
當m = n 時,上述公式就是年增長率 (+2)
(2)可將月度增長率或季度增長率轉換為年度增長率,實現增長率之間的可比性。(+1)
2. 數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。(×)
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。(×)
3.連續型變和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。(√)
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。(√)
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。(×)
五、計算分析題(共55分)
中位數的位置:(10+1)/2=5.5
中位數
從偏斜度的角度描述數據的分布形狀:均值>中位數,正向(右)偏
(+2)
2.(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的?
r=0.862109, (+1)
R2=0.743232, 考試分數的變差中有74.3232%是由於學習時間的變動引起的。(+2)
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(+3)
回歸系數的含義表明學習時間每增加一個小時, 考試分數平均增加1.497分。(+2)
(3) 檢驗線形關系的顯著性
Significance F=0.005895457〈 =5%
線性關系顯著。(+3)
(4) 根據標准化殘差圖判斷關於隨機誤差項服從正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立。(+4)
3. (1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系
(1)ryxi =0.308952067 ryx2=0.001214062,
沒有證據。(+2)
(2)根據上述結果,你認為用購進價格與銷售費用來預測是否有用?
沒有用。(+2)
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。
Significance F=0.073722> =5%
線性關系不顯著。(+3)
(4)解釋判定系數R2,所得結論與問題(2)中是否一致
R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?
rx1x2=-0.8529,高度相關(+2)
(6)模型中是否存在多重共線性?你對模型有何特長建議?
可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4. (1)三種產品的銷售額指數; (+3)
三種產品的銷售額指數=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8萬元
(2)三種產品的銷售量指數; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2萬元
(3)三種產品的價格指數; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4) 分析產量和單位價格的變動對銷售額影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元萬元=85.2萬元+11.6萬元 (+2)
C. 富時中國a50指數實時開盤時間
新華富時A50期指交易時間上午為9:15-15:05,它還有:40-19:00的額外交易時段。
早市晚收盤以及增加額外交易時段,目的都在於增加新華富時A50期指對滬深300期指的引導和影響。在市場發生重大事件的時候(中國國內經常在閉市後發布重大消息),如果中國國內市場閉市而新加坡市場仍在交易,那麼資金就會被吸引到新加坡市場。
新華富時A50期指實行的是分段漲跌幅限制,而如果市場持續上漲則事實上沒有漲跌幅限制,因此更加寬松的漲跌幅機制有利於市場價格發現,特別是在市場發生重大事件的時候。
(3)組距股票擴展閱讀:
富時指數採用派氏加權綜合價格指數公式計算,以樣本股的調整股本數為權數。調整股本數採用分級靠檔的方法對成份股股本進行調整,界於20%至50%的組距,則運用十個百分點的緩沖區;界於50%至100%的組距,則運用二十五個百分點的緩沖區。比如,某股票流通比例為60%,落在區間(50,75)內,對應的加權比例為75%,則將總股本的75%作為權數。
新華富時中國A股指數系列會對定期審核公眾流通量的變更。新華富時中國A股指數系列的股票流動性每年審核一次。在新華富時指數委員會七月舉行的年度審核會前十二個月內若非成份股公司的每月流動量有十個月無法達到可投資股數的1%,該股將不符合資格。
D. 中國人民大學出版社的《統計學》第四版,賈俊平、金勇進、何曉群編的,求課後習題答案
3.3 某百貨公司連續40天的商品銷售額如下:
單位:萬元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根據上面的數據進行適當的分組,編制頻數分布表,並繪制直方圖。
1、確定組數:
,取k=6
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(49-25)÷6=4,取5
3、分組頻數表
銷售收入(萬元) 頻數 頻率% 累計頻數 累計頻率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
總和 40 100.0
3.6一種袋裝食品用生產線自動裝填,每袋重量大約為50g,但由於某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數據如下:
單位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)構建這些數據的頻數分布表。
(2)繪制頻數分布的直方圖。
(3)說明數據分布的特徵。
解:(1)根據上面的數據進行適當的分組,編制頻數分布表,並計算出累積頻數和累積頻率。
1、確定組數:
,取k=6或7
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷6=3.5,取3或者4、5
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷7=3,
3、分組頻數表
組距3,上限為小於
頻數 百分比 累計頻數 累積百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合計 100 100.0
直方圖:
組距4,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合計 100 100.0
直方圖:
組距5,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合計 100 100.0
直方圖:
分布特徵:左偏鍾型。
4.2 隨機抽取25個網路用戶,得到他們的年齡數據如下:
單位:周歲
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)計算眾數、中位數:
1、排序形成單變數分值的頻數分布和累計頻數分布:
網路用戶的年齡
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
從頻數看出,眾數Mo有兩個:19、23;從累計頻數看,中位數Me=23。
(2)根據定義公式計算四分位數。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由於25和27都只有一個,因此Q3也可等於25+0.75×2=26.5。
(3)計算平均數和標准差;
Mean=24.00;Std. Deviation=6.652
(4)計算偏態系數和峰態系數:
Skewness=1.080;Kurtosis=0.773
(5)對網民年齡的分布特徵進行綜合分析:
分布,均值=24、標准差=6.652、呈右偏分布。如需看清楚分布形態,需要進行分組。
為分組情況下的直方圖:
為分組情況下的概率密度曲線:
分組:
1、確定組數:
,取k=6
2、確定組距:組距=( 最大值 - 最小值)÷ 組數=(41-15)÷6=4.3,取5
3、分組頻數表
網路用戶的年齡 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分組後的均值與方差:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分組後的直方圖:
4.6 在某地區抽取120家企業,按利潤額進行分組,結果如下:
按利潤額分組(萬元) 企業數(個)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 計 120
要求:
(1)計算120家企業利潤額的平均數和標准差。
(2)計算120家企業利潤額的中位數,眾數,四方位數
解:
Statistics
企業利潤組中值Mi(萬元)
N Valid 120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
7.11 某企業生產的袋裝食品採用自動打包機包裝,每袋標准重量為l00g。現從某天生產的一批產品中按重復抽樣隨機抽取50包進行檢查,測得每包重量(單位:g)如下:
每包重量(g) 包數
96~98
98~100
100~102
102~104
104~106 2
3
34
7
4
合計 50
已知食品包重量服從正態分布,要求:
(1)確定該種食品平均重量的95%的置信區間。
解:大樣本,總體方差未知,用z統計量
樣本均值=101.4,樣本標准差s=1.829
置信區間:
=0.95, = =1.96
= =(100.89,101.91)
(2)如果規定食品重量低於l00g屬於不合格,確定該批食品合格率的95%的置信區間。
解:總體比率的估計
大樣本,總體方差未知,用z統計量
樣本比率=(50-5)/50=0.9
置信區間:
=0.95, = =1.96
= =(0.8168,0.9832)
11.6 下面是7個地區2000年的人均國內生產總值(GDP)和人均消費水平的統計數據:
地區 人均GDP(元) 人均消費水平(元)
北京
遼寧
上海
江西
河南
貴州
陝西 22 460
11 226
34 547
4 851
5 444
2 662
4 549 7 326
4 490
11 546
2 396
2 208
1 608
2 035
要求:
(1)人均GDP作自變數,人均消費水平作因變數,繪制散點圖,並說明二者之間的關系形態。
(2)計算兩個變數之間的線性相關系數,說明兩個變數之間的關系強度。
(3)利用最小二乘法求出估計的回歸方程,並解釋回歸系數的實際意義。
(4)計算判定系數,並解釋其意義。
(5)檢驗回歸方程線性關系的顯著性(a=0.05)。
(6)如果某地區的人均GDP為5 000元,預測其人均消費水平。
(7)求人均GDP為5 000元時,人均消費水平95%的置信區間和預測區間。
解:(1)
__
可能存在線性關系。
(2)相關系數:
相關性
人均GDP(元) 人均消費水平(元)
人均GDP(元) Pearson 相關性 1 .998(**)
顯著性(雙側) 0.000
N 7 7
人均消費水平(元) Pearson 相關性 .998(**) 1
顯著性(雙側) 0.000
N 7 7
**. 在 .01 水平(雙側)上顯著相關。
有很強的線性關系。
(3)回歸方程:
系數(a)
模型 非標准化系數 標准化系數 t 顯著性
B 標准誤 Beta
1 (常量) 734.693 139.540 5.265 0.003
人均GDP(元) 0.309 0.008 0.998 36.492 0.000
a. 因變數: 人均消費水平(元)
回歸系數的含義:人均GDP沒增加1元,人均消費增加0.309元。
(4)
模型摘要
模型 R R 方 調整的 R 方 估計的標准差
1 .998(a) 0.996 0.996 247.303
a. 預測變數:(常量), 人均GDP(元)。
人均GDP對人均消費的影響達到99.6%。
(5)F檢驗:
ANOVA(b)
模型 平方和 df 均方 F 顯著性
1 回歸 81,444,968.680 1 81,444,968.680 1,331.692 .000(a)
殘差 305,795.034 5 61,159.007
合計 81,750,763.714 6
a. 預測變數:(常量), 人均GDP(元)。
b. 因變數: 人均消費水平(元)
回歸系數的檢驗:t檢驗
系數(a)
模型 非標准化系數 標准化系數 t 顯著性
B 標准誤 Beta
1 (常量) 734.693 139.540 5.265 0.003
人均GDP(元) 0.309 0.008 0.998 36.492 0.000
a. 因變數: 人均消費水平(元)
(6)
某地區的人均GDP為5 000元,預測其人均消費水平為2278.10657元。
(7)
人均GDP為5 000元時,人均消費水平95%的置信區間為[1990.74915,2565.46399],預測區間為[1580.46315,2975.74999]。
13.4 下表是1981年—2000年我國財政用於文教、科技、衛生事業費指出額數據
年份 支出(萬元) 年份 支出(萬元)
1981 171.36 1991 708.00
1982 196.96 1992 792.96
1983 223.54 1993 957.77
1984 263.17 1994 1278.18
1985 316.70 1995 1467.06
1986 379.93 1996 1704.25
1987 402.75 1997 1903.59
1988 486.10 1998 2154.38
1989 553.33 1999 2408.06
1990 617.29 2000 2736.88
(1)繪制時間序列圖描述其趨勢。
(2)選擇一條適合的趨勢線擬合數據,並根據趨勢線預測2001年的支出額。
詳細答案:
(1)趨勢圖如下:
(2)從趨勢圖可以看出,我國財政用於文教、科技、衛生事業費指出額呈現指數增長趨勢,因此,選擇指數曲線。經線性變換後,利用Excel輸出的回歸結果如下:
回歸統計
Multiple R 0.998423
R Square 0.996849
Adjusted R Square 0.996674
標准誤差 0.022125
觀測值 20
方差分析
df SS MS F Significance F
回歸分析 1 2.787616 2.787616 5694.885 5.68E-24
殘差 18 0.008811 0.000489
總計 19 2.796427
Coefficients 標准誤差 t Stat P-value Lower 95% Upper 95%
Intercept 2.163699 0.010278 210.5269 5.55E-32 2.142106 2.185291
X Variable 1 0.064745 0.000858 75.46446 5.68E-24 0.062942 0.066547
, ; , 。所以,指數曲線方程為: 。
2001年的預測值為: 。13.10 1995年~2000年北京市月平均氣溫數據如下(單位: ):
月/年 1995 1996 1997 1998 1999 2000
1 -0.7 -2.2 -3.8 -3.9 -1.6 -6.4
2 2.1 -0.4 1.3 2.4 2.2 -1.5
3 7.7 6.2 8.7 7.6 4.8 8.1
4 14.7 14.3 14.5 15.0 14.4 14.6
5 19.8 21.6 20.0 19.9 19.5 20.4
6 24.3 25.4 24.6 23.6 25.4 26.7
7 25.9 25.5 28.2 26.5 28.1 29.6
8 25.4 23.9 26.6 25.1 25.6 25.7
9 19.0 20.7 18.6 22.2 20.9 21.8
10 14.5 12.8 14.0 14.8 13.0 12.6
11 7.7 4.2 5.4 4.0 5.9 3.0
12 -0.4 0.9 -1.5 0.1 -0.6 -0.6
(1)繪制年度折疊時間序列圖,判斷時間序列的類型。
(2)用季節性多元回歸模型預測2001年各月份的平均氣溫。
詳細答案:
(1)年度折疊時間序列圖如下:
從年度折疊時間序列圖可以看出,北京市月平均氣溫具有明顯的季節變動。由於折線圖中有交叉,表明該序列不存在趨勢。
(2)季節性多元回歸模型為:
設月份為 。則季節性多元回歸模型為:
虛擬變數為:
, ,……, 。
由Excel輸出的回歸結果如下:
系數
b0 -0.2233
b1 -0.0030
M1 -2.7832
M2 1.3365
M3 7.5062
M4 14.9092
M5 20.5289
M6 25.3319
M7 27.6349
M8 25.7213
M9 20.8743
M10 13.9606
M11 5.3803
季節性多元回歸方程為:
2001年各月份平均氣溫的預測值如下:
年/月 時間 虛擬變數 預測
M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11
1 73 1 0 0 0 0 0 0 0 0 0 0 -3.2
2 74 0 1 0 0 0 0 0 0 0 0 0 0.9
3 75 0 0 1 0 0 0 0 0 0 0 0 7.1
4 76 0 0 0 1 0 0 0 0 0 0 0 14.5
5 77 0 0 0 0 1 0 0 0 0 0 0 20.1
6 78 0 0 0 0 0 1 0 0 0 0 0 24.9
7 79 0 0 0 0 0 0 1 0 0 0 0 27.2
8 80 0 0 0 0 0 0 0 1 0 0 0 25.3
9 81 0 0 0 0 0 0 0 0 1 0 0 20.4
10 82 0 0 0 0 0 0 0 0 0 1 0 13.5
11 83 0 0 0 0 0 0 0 0 0 0 1 4.9
12 84 0 0 0 0 0 0 0 0 0 0 0 -0.5
E. 各種統計圖的概念和特點
一、條形統計圖用一個單位長度(如1厘米)表示一定的數量,根據數量的多少,畫成長短相應成比例的直條,並按一定順序排列起來,這樣的統計圖,稱為條形統計圖。條形統計圖可以清楚地表明各種數量的多少。條形圖是統計圖資料分析中最常用的圖形。按照排列方式的不同,可分為縱式條形圖和橫式條形圖;按照分析作用的不同,可分為條形比較圖和條形結構圖。?
條形統計圖的特點:?
(1)能夠使人們一眼看出各個數據的大小。?
(2)易於比較數據之間的差別。
(3)能清楚的表示出數量的多少.?二、扇形統計圖以一個圓的面積表示事物的總體,以扇形面積表示占總體的百分數的統計圖,叫作扇形統計圖。也叫作百分數比較圖。扇形統計圖可以比較清楚地反映出部分與部分、部分與整體之間的數量關系。?
扇形統計圖的特點:?
(1)用扇形的面積表示部分在總體中所佔的百分比。?
(2)易於顯示每組數據相對於總數的大小。三、直方圖
(1)頻數分布表
將一些數據按照統一的標准分成若干組,將這組數據的分組、統計每個小組的個數及各組相應的頻數所列成的表格叫做頻數分布表.
(2)頻數分布直方圖
橫軸表示相關數據對應量的大小,並標出每一組數據的兩個端點,縱軸表示頻數,每個矩形的高代表對應組的頻數(等距分組時),我們稱這樣的統計圖為頻數分布直方圖.
2、畫圖注意:
(1)直方圖中各個矩形之間為什麼沒有空隙?
因為在分組時,各組之間范圍的端點數是連續的,而矩形的寬表示的就是組距,所以直方圖各矩形之間沒有空隙.
直方圖實際上是用矩形面積表示頻數的.
當矩形的寬相等時,可以用矩形的高表示頻數.
又因為寬表示組距,那麼根據矩形面積公式,面積:高×寬,所以高則表示面積與寬的比值,即頻數與組距的比值.
有關這些知識我們將在以後的統計學中逐步學到。
(2)直方圖和條形圖的聯系與區別:
聯系:它們都是用矩形來表示數據分布情況的;當矩形的寬度相等時,都是用矩形的高來表示數據分布情況的;
區別:由於分組數據具有連續性,直方圖中各矩形之間通常是連續排列,中間沒有空隙,而條形圖中各矩形是分開排列,中間有一定的間隔;直方圖是用面積表示各組頻數的多少,而條形圖是用矩形的高表示頻數.
3、特點:
①能夠顯示各組頻數分布的情況;
②易於顯示各組之間頻數的差別.
F. 已知樣本,最小值,極差,組距,怎麼分組
《統計學原理》期末考試模擬試題
謝穎2004-05-10 09:55
《統計學原理》期末考試模擬試題
一、 填空題(每小題2分,共10分)
1. 表示單位屬性方面特徵的標志是_______,而表示單位數量方面特徵的標志是________。
2. 任何一個統計分布都必須滿足___________和_____________兩個條件。
3. 抽樣估計就是利用實際調查計算的_____________來估計相應的______________數值。
4. 回歸分析中因變數是_________變數,而自變數是作為可控制的___________變數。
5. 統計總指數的計算形式有_____________和________________。
二、 判斷題(每小題2分,共10分)
1. 普查一般用來調查屬於一定時點上社會經濟現象的數量,它並不排斥對屬於時期現象的項目的調查。( )
2. 同一個總體,時期指標值的大小與時期長短成正比,時點指標值的大小與時點間隔成反比。( )
3. 在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指標值是一個隨機變數。( )
4. 抽樣成數的特點是:樣本成數越大,則抽樣平均誤差越大。( )
5. 在各種動態數列中,指標值的大小都受到指標所反映的時期長短的制約。( )
三、 單選題(每小題2分,共12分)
1.構成統計總體的個別事物稱為( )
A.調查單位 B. 標志值 C. 品質單位 D. 總體單位
2. 復合分組是 ( )
A.用同一標志對兩個或兩個以上的總體層疊起來進行分組
B.對某一總體選擇一個復雜的標志進行分組
C.對同一總體選擇兩個或兩個以上的標志層疊起來進行分組
D.對同一總體選擇兩個或兩個以上的標志並列起來進行分組
3. 總量指標按反映時間狀況的不同,分為 ( )
A.數量指標和質量指標 B.時間指標和時點指標
C.總體單位總量和總體標志總量 D.實物指標和價值指標
4. 計算平均指標最常用的方法和最基本的形式是 ( )
A.中衛數 B.眾數 C.算術平均數 D.調和平均數
5.統計指數按指數化指標的性質不同,可分為 ( )
A.總指數和個體指數 B.數量指標指數和質量指標指數
C.平均指數和平均指標指數 D.綜合指數和平均數指數
6.計算序時平均數時,」首末折半法」適用於 ( )
A.時期數列計算序時平均數 B.間隔相等的時點數列計算序時平均數
C.間隔不等的時點數列計算序時平均數 D.由兩個時點數列構成的相對數列動態數列計算序時平均數
四、 多選題 (每小題2分,共8分)
1.次數分配數列( )
A. 由總體按某標志所分的組和各組單位數兩個因素構成
B. 由組距和組數、組限和組中值構成的
C. 包括品質分配數列和變數數列兩種
D. 可以用圖表形式表現
E. 可以證明總體結構和分布特徵
2.調查單位是( )
A. 需要調查的總體
B. 需要調查的總體單位負責人
C. 調查項目的承擔者
D. 負責報告調查結果的單位
E. 調查對象所包含的具體單位
3.抽樣估計中的抽樣誤差( )
A. 是不可避免要產生的
B. 是可以通過改進調查方式來消除的
C. 是可以事先計算出來的
D. 只能在調查結束後在能計算的
E. 其大小是可能控制的
4.設產品的單位成本(元)對產量(百件)的直線回歸方程為yc=76-1.85x,這表示( )
A. 產量每增加100件,單位成本平均下降1.85元
B. 產量每減少100件,單位成本平均下降1.85元
C. 產量與單位成本按相反方向變動
D. 產量與單位成本按相同方向變動
E. 當產量為200件時,單位成本為72.3元
五、 問答題(每小題5分,共10分)
1. 簡述變異指標的概念和作用。
2. 平均指數的基本含義和計算機形式是什麼?
六、 計算題(每小題10分,共50分)
1. 某班40名學生統計學考試成績(分)分別為:
57 89 49 84 86 87 75 73 72 68 75 82 97 81
67 81 54 79 87 95 76 71 60 90 65 76 72 70
86 85 89 89 64 57 83 81 78 87 72 61
學校規定:60分以下為不及格,60-70分為及格,70-80分為中,80-90分為良,90-100分
為優。要求:
(1) 將該班學生分為不及格、及格、中、良、優五組,編制一張次數分配表。
(2) 指出分組標志及類型;分析該班學生考試情況。
2. 某廠三個車間一季度生產情況如下:
車間 計劃完成百分比 實際產量(件) 單位產品成本(元\件)
第一車間 90% 198 15
第二車間 105% 315 10
第三車間 110% 220 8
根據以上資料計算:
(1)一季度三個車間產量平均計劃完成百分比.
(2)一季度三個車間平均單位產品成本.
3.某地農科所經回歸分析,得到某作物的畝產量(y表示,單位為「擔\畝」)與澆水量(用X表示,單位為「寸」)的直線回歸方程為:yc=2.82+1.56x。又知變數x的方差為99.75,變數y的方差為312.82
要求:(1)計算澆水量為0時的畝產量;
(2)計算澆水量每增加一寸時平均增加的畝產量;
(3)計算澆水量與畝產量之間的相互關系數,並分析相關的密切程度和方向。
(要求寫出公式和計算過程,結果保留兩位小數)
4.某企業產品的單位成本1988您比1987年降低2%,1989年比1988年降低5%,1990年比1989年降低3%,1991年比1990年降低1.5%,試以1987年為基期,計算1988年至1991年該企業單位成本總的降低速度和平均降低速度。(要求寫出公式和計算過程,結果保留四位小數。)
5 從一批零件中抽取200件進行測驗,其中合格品188件。
要求:(1)計算該批零件合格率的抽樣平均誤差;
(2)按95.45%的可靠程度(t=2)對該批零件的合格率作出區間估計。
6. 某企業產品的單位成本1988您比1987年降低2%,1989年比1988年降低5%,1990年比1989年降低3%,1991年比1990年降低1.5%,試以1987年為基期,計算1988年至1991年該企業單位成本總的降低速度和平均降低速度。(要求寫出公式和計算過程,結果保留四位小數。)
7. 從一批零件中抽取200件進行測驗,其中合格品188件。
要求:(1)計算該批零件合格率的抽樣平均誤差;
(2)按95.45%的可靠程度(t=2)對該批零件的合格率作出區間估計。
北京信息科技大學 《統計學》課程期末考試試卷(A卷)
北京信息科技大學
2007 ~2008學年第一學期
課程所在學院:經濟管理學院 適用專業班級:注會0501 0502
考試形式:( 閉卷)
一、單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.下列哪個不屬於一元回歸中的基本假定( D )。
A.對於所有的X,誤差項的方差都相同
B.誤差項 服從正態分布
C.誤差項 相互獨立
D.
2.某組數據分布的偏度系數為負時,該數據的眾數、中位數、均值的大小關系是( A )。
A.眾數>中位數>均值
B.均值>中位數>眾數
C.中位數>眾數>均值
D.中位數>均值>眾數
3.一元回歸方程為y=11.64一0.25x,則下列說法中正確的是( C )。
A.自變數平均增長一個單位,因變數減少0.25個單位
B.自變數和因變數之間成正相關關系
C.
D.
4.有甲乙兩組數列,則( A )數列平均數的代表性高。
A. 1< 2 1> 2,則乙數列平均數的代表性高
B. 1< 2 1> 2,則乙數列平均數的代表性低
C. 1= 2 1> 2,則甲數列平均數的代表性高
D. 1= 2 1< 2,則甲數列平均數的代表性低
5.某連續變數數列,其末組為開口組,下限為500,相鄰組的組中值為480,則末組的組中值為( A )。
A.520 B.510 C.500 D.540
6.不受極端變數值影響的平均數是( D )。
A.算術平均數 B.調和平均數
C.幾何平均數 D.眾數
7.有20個工人看管機器台數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上資料編制頻數分布數列應採用( A )。
A.單項式分組 B.等距分組 C.不等距分組 D.以上幾種分組均可以
8.若無季節變動,則季節比率應為( B )。
A.0 B. 1 C. 大於1 D. 小於1
9.如果一個定性的變數有m類,則要引進( C )個虛擬變數。
A.m B.m+1
C.m-1 D.無法判斷
10.第一組工人的平均工齡為5年,第二組為7年,第三組為10年,第一組工人數占總數的20%,第二組佔60%,則三組工人的平均工齡為( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企業2007年各種產品的產量比2006年增長了8%,總生產費用增長了12%,則該廠2007年單位成本( D )
A.減少了0.62% B.增加了0.62%
C.減少了3.7% D.增加了3.7%
12.相關系數r與斜率b2的符號( A )。
A.相同 B.不同
C.無法判斷
13.已知小姜買的兩種股票的綜合價格指數上漲了24點,本日股票的平均收盤價格為14元,前日股票的平均收盤價格為( C )
A.10.64 B.10.5
C.11.29 D.無法計算
14.若今年比去年的環比發展速度為112%,去年比前年的環比增長率為3%,那麼今年比前年的平均增長率為( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增長1%的絕對值為0.54,去年比前年增長的絕對值為5,則去年比前年的增長率為( C )。
A.9.3% B.8.7%
C.10.2% D.無法計算
二、多項選擇題(每小題2分,共16分)
在每小題列出的若干選項中有多個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.下列變數,屬於離散變數的有( A D E F )。
A.庫存產品數量 B.流動資產對流動負債的比率
C.貨物總重量 D.按個計量的貨物數量
E.一條收費公路上的交通量 F.公司年會的出席人數
2.指出下列數據收集屬於通過實驗的方法收集數據的有(A B E )
A.培訓航空機票代理人的新方法與傳統方法的比較結果
B.通過讓兩組可以比較的孩子分別使用兩種不同的組裝說明組裝玩具來比較這兩種組裝說明
C.一份產品評價雜志給它的訂閱者郵寄調查問卷,請他們為近期購買的產品排名
D.采訪一個購物中心的顧客,詢問他們為什麼在那裡購物
E.通過在兩個可比較地區分別採用不同的方法,比較兩種不同的養老金促銷方法
3.下列組限的表示方法哪些是對的( A B D )。
A.按職工人數分組,相鄰組的組限可以重疊,也可以間斷
B.職工按工資分組,其組限必須重疊
C.學生按成績分組,其組限必須間斷
D.人按身高分組,其組限必須重疊
4.下列屬於質量指標指數的有( A B D E )。
A.價格指數 B.單位成本指數
C.銷售量指數 D.工資水平指數
E.勞動生產率指數
5.具體地說,如果出現下列( A B C )情況,暗示多元回歸模型有可能存在多重共線性。
A.模型中各對自變數之間顯著相關
B.線形關系顯著,回歸系數 的t檢驗卻不顯著
C.回歸系數的正負號與預期相反
D.
6.算術平均數具有下列哪些性質( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在頻數分布數列中( C D E )。
A.總次數一定,頻數和頻率成反比 B.各組的頻數之和等於100
C.各組頻率大於0,頻率之和等於1 D.頻率越小,則該組數值所起作用越小
E.頻率表明各組變數值對總體的相對作用程度
8.標准差( C E )。
A.表明總體單位標志值的一般水平 B.反映總體單位的一般水平
C.反映總體單位標志值的離散程度 D.反映總體分布的集中趨勢
E.反映總體分布的離中趨勢
三、簡答題(本大題共2題,每題5分,共10分)
1.什麼是年度化增長率?它有何用途?
2.數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。( 錯 )
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。( 錯 )
3.連續型變數和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。( 對 )
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。( 對 )
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。( 錯 )
四、計算分析題(共54分)
1.將某郵局中外發郵包樣本的重量近似到盎司為:21,18,30,12,14,17,28,10,16,25。計算這組數據的均值,中位數,眾數,極差,四分位間距,從偏斜度的角度描述數據的分布形狀(10分)。
2.表1中列出了在一個為期三周的商務統計課程中學生課外學習的小時數和他們在課程結束時的測試分數的樣本數據如下:
表1 學生課外學習時間及考試分數統計表
學生樣本 1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
考試分數,Y 64 61 84 70 88 92 72 77
利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
標准誤差 6.157605
觀測值 8
方差分析
df SS MS F Significance F
回歸分析 1 658.5034 658.5034 17.36738233 0.005895457
殘差 6 227.4966 37.9161
總計 7 886
Coefficients 標准誤差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的? 86.21% 74.32%
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(3) 檢驗線性關系的顯著性 。
(4) 根據標准化殘差圖判斷關於隨機誤差項正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立
3.隨機抽取了15家大型商場銷售的同類產品的有關數據(單位:元),利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
標准誤差 69.75121
觀測值 15
方差分析
df SS MS F Significance F
回歸分析 2 31778.15 15889.08 3.265842 0.073722186
殘差 12 58382.78 4865.232
總計 14 90160.93
Coefficients 標准誤差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
註:X Variable 1為購進價格/元
X Variable 2為銷售費用/元
因變數Y為銷售價格/元
(1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系? 0.3089 0.0012 沒有,因為相關系數較小
(2)根據上訴結果,你認為用購進價格與銷售費用來預測是否有用?沒用
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。不顯著
(4)解釋判定系數R2,所得結論與問題(2)中是否一致? R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?高度相關
(6)模型中是否存在多重共線性?你對模型有何特長建議?可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4.一公司生產的三種產品的有關如下數據如下表所示 (共14分):
商品 計量單位 銷售量 單價(萬元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 噸 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)計算三種產品的銷售額指數;
(2)計算三種產品的銷售量指數;
(3)計算三種產品的單位價格指數;
(4)計算分析產量和單位價格的變動對銷售額影響的相對數和絕對數。
北京信息科技大學
2007 ~2008學年第一學期
《統計學》課程期末考試試卷標准答案(A卷)
一、 單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多項選擇題(每小題2分,共16分)
在每小題列出的五個選項中有二至五個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 簡答題(本大題共2題,每題5分,共10分)
1. 什麼是年度化增長率?它有何用途?
(1)增長率以年來表示時,稱為年度化增長率或年率,(+2)
其計算公式為:
m 為一年中的時期個數;n 為所跨的時期總數
季度增長率被年度化時,m =4
月增長率被年度化時,m =12
當m = n 時,上述公式就是年增長率 (+2)
(2)可將月度增長率或季度增長率轉換為年度增長率,實現增長率之間的可比性。(+1)
2. 數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。(×)
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。(×)
3.連續型變和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。(√)
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。(√)
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。(×)
五、計算分析題(共55分)
中位數的位置:(10+1)/2=5.5
中位數
從偏斜度的角度描述數據的分布形狀:均值>中位數,正向(右)偏
(+2)
2.(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的?
r=0.862109, (+1)
R2=0.743232, 考試分數的變差中有74.3232%是由於學習時間的變動引起的。(+2)
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(+3)
回歸系數的含義表明學習時間每增加一個小時, 考試分數平均增加1.497分。(+2)
(3) 檢驗線形關系的顯著性
Significance F=0.005895457〈 =5%
線性關系顯著。(+3)
(4) 根據標准化殘差圖判斷關於隨機誤差項服從正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立。(+4)
3. (1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系
(1)ryxi =0.308952067 ryx2=0.001214062,
沒有證據。(+2)
(2)根據上述結果,你認為用購進價格與銷售費用來預測是否有用?
沒有用。(+2)
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。
Significance F=0.073722> =5%
線性關系不顯著。(+3)
(4)解釋判定系數R2,所得結論與問題(2)中是否一致
R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?
rx1x2=-0.8529,高度相關(+2)
(6)模型中是否存在多重共線性?你對模型有何特長建議?
可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4. (1)三種產品的銷售額指數; (+3)
三種產品的銷售額指數=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8萬元
(2)三種產品的銷售量指數; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2萬元
(3)三種產品的價格指數; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4) 分析產量和單位價格的變動對銷售額影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元萬元=85.2萬元+11.6萬元 (+2)
G. 海水淡化的股票有哪些
一 海水淡化應用
000598 興蓉投資(反滲透膜)
600229青島鹼業
600409三友化工
000598藍星清洗
二 海水淡化設備
000039中集集團
600268國電南自
600481 雙良節能
601106 中國一重
601727上海電氣
601989 中國重工
三 海水淡化反滲透膜
000598 興蓉投資
000920南方匯通
002168深圳惠程
300070 碧水源
四 海水淡化配件
002203海亮股份
002318 久立特材
300145 南方泵業
600019寶鋼股份
600456寶鈦股份
002540 亞太科技
H. 海水淡化概念股有哪些
一 海水淡化應用
000598 興蓉投資(反滲透膜) 600229青島鹼業 600409三友化工 000598藍星清洗
二 海水淡化設備
000039中集集團 600268國電南自 600481 雙良節能 601106 中國一重 601727上海電氣 601989 中國重工
三 海水淡化反滲透膜
000598 興蓉投資 000920南方匯通 002168深圳惠程 300070 碧水源
四 海水淡化配件
002203海亮股份 002318 久立特材 300145 南方泵業 600019寶鋼股份 600456寶鈦股份 002540 亞太科技
I. 在變數分組時,將一個變數值作為一組則稱為( )分組;把某一區間的變數值作為一組則稱為( )分組
《統計學原理》期末考試模擬試題
謝穎2004-05-10 09:55
《統計學原理》期末考試模擬試題
一、 填空題(每小題2分,共10分)
1. 表示單位屬性方面特徵的標志是_______,而表示單位數量方面特徵的標志是________。
2. 任何一個統計分布都必須滿足___________和_____________兩個條件。
3. 抽樣估計就是利用實際調查計算的_____________來估計相應的______________數值。
4. 回歸分析中因變數是_________變數,而自變數是作為可控制的___________變數。
5. 統計總指數的計算形式有_____________和________________。
二、 判斷題(每小題2分,共10分)
1. 普查一般用來調查屬於一定時點上社會經濟現象的數量,它並不排斥對屬於時期現象的項目的調查。( )
2. 同一個總體,時期指標值的大小與時期長短成正比,時點指標值的大小與時點間隔成反比。( )
3. 在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指標值是一個隨機變數。( )
4. 抽樣成數的特點是:樣本成數越大,則抽樣平均誤差越大。( )
5. 在各種動態數列中,指標值的大小都受到指標所反映的時期長短的制約。( )
三、 單選題(每小題2分,共12分)
1.構成統計總體的個別事物稱為( )
A.調查單位 B. 標志值 C. 品質單位 D. 總體單位
2. 復合分組是 ( )
A.用同一標志對兩個或兩個以上的總體層疊起來進行分組
B.對某一總體選擇一個復雜的標志進行分組
C.對同一總體選擇兩個或兩個以上的標志層疊起來進行分組
D.對同一總體選擇兩個或兩個以上的標志並列起來進行分組
3. 總量指標按反映時間狀況的不同,分為 ( )
A.數量指標和質量指標 B.時間指標和時點指標
C.總體單位總量和總體標志總量 D.實物指標和價值指標
4. 計算平均指標最常用的方法和最基本的形式是 ( )
A.中衛數 B.眾數 C.算術平均數 D.調和平均數
5.統計指數按指數化指標的性質不同,可分為 ( )
A.總指數和個體指數 B.數量指標指數和質量指標指數
C.平均指數和平均指標指數 D.綜合指數和平均數指數
6.計算序時平均數時,」首末折半法」適用於 ( )
A.時期數列計算序時平均數 B.間隔相等的時點數列計算序時平均數
C.間隔不等的時點數列計算序時平均數 D.由兩個時點數列構成的相對數列動態數列計算序時平均數
四、 多選題 (每小題2分,共8分)
1.次數分配數列( )
A. 由總體按某標志所分的組和各組單位數兩個因素構成
B. 由組距和組數、組限和組中值構成的
C. 包括品質分配數列和變數數列兩種
D. 可以用圖表形式表現
E. 可以證明總體結構和分布特徵
2.調查單位是( )
A. 需要調查的總體
B. 需要調查的總體單位負責人
C. 調查項目的承擔者
D. 負責報告調查結果的單位
E. 調查對象所包含的具體單位
3.抽樣估計中的抽樣誤差( )
A. 是不可避免要產生的
B. 是可以通過改進調查方式來消除的
C. 是可以事先計算出來的
D. 只能在調查結束後在能計算的
E. 其大小是可能控制的
4.設產品的單位成本(元)對產量(百件)的直線回歸方程為yc=76-1.85x,這表示( )
A. 產量每增加100件,單位成本平均下降1.85元
B. 產量每減少100件,單位成本平均下降1.85元
C. 產量與單位成本按相反方向變動
D. 產量與單位成本按相同方向變動
E. 當產量為200件時,單位成本為72.3元
五、 問答題(每小題5分,共10分)
1. 簡述變異指標的概念和作用。
2. 平均指數的基本含義和計算機形式是什麼?
六、 計算題(每小題10分,共50分)
1. 某班40名學生統計學考試成績(分)分別為:
57 89 49 84 86 87 75 73 72 68 75 82 97 81
67 81 54 79 87 95 76 71 60 90 65 76 72 70
86 85 89 89 64 57 83 81 78 87 72 61
學校規定:60分以下為不及格,60-70分為及格,70-80分為中,80-90分為良,90-100分
為優。要求:
(1) 將該班學生分為不及格、及格、中、良、優五組,編制一張次數分配表。
(2) 指出分組標志及類型;分析該班學生考試情況。
2. 某廠三個車間一季度生產情況如下:
車間 計劃完成百分比 實際產量(件) 單位產品成本(元\件)
第一車間 90% 198 15
第二車間 105% 315 10
第三車間 110% 220 8
根據以上資料計算:
(1)一季度三個車間產量平均計劃完成百分比.
(2)一季度三個車間平均單位產品成本.
3.某地農科所經回歸分析,得到某作物的畝產量(y表示,單位為「擔\畝」)與澆水量(用X表示,單位為「寸」)的直線回歸方程為:yc=2.82+1.56x。又知變數x的方差為99.75,變數y的方差為312.82
要求:(1)計算澆水量為0時的畝產量;
(2)計算澆水量每增加一寸時平均增加的畝產量;
(3)計算澆水量與畝產量之間的相互關系數,並分析相關的密切程度和方向。
(要求寫出公式和計算過程,結果保留兩位小數)
4.某企業產品的單位成本1988您比1987年降低2%,1989年比1988年降低5%,1990年比1989年降低3%,1991年比1990年降低1.5%,試以1987年為基期,計算1988年至1991年該企業單位成本總的降低速度和平均降低速度。(要求寫出公式和計算過程,結果保留四位小數。)
5 從一批零件中抽取200件進行測驗,其中合格品188件。
要求:(1)計算該批零件合格率的抽樣平均誤差;
(2)按95.45%的可靠程度(t=2)對該批零件的合格率作出區間估計。
6. 某企業產品的單位成本1988您比1987年降低2%,1989年比1988年降低5%,1990年比1989年降低3%,1991年比1990年降低1.5%,試以1987年為基期,計算1988年至1991年該企業單位成本總的降低速度和平均降低速度。(要求寫出公式和計算過程,結果保留四位小數。)
7. 從一批零件中抽取200件進行測驗,其中合格品188件。
要求:(1)計算該批零件合格率的抽樣平均誤差;
(2)按95.45%的可靠程度(t=2)對該批零件的合格率作出區間估計。
北京信息科技大學 《統計學》課程期末考試試卷(A卷)
北京信息科技大學
2007 ~2008學年第一學期
課程所在學院:經濟管理學院 適用專業班級:注會0501 0502
考試形式:( 閉卷)
一、單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.下列哪個不屬於一元回歸中的基本假定( D )。
A.對於所有的X,誤差項的方差都相同
B.誤差項 服從正態分布
C.誤差項 相互獨立
D.
2.某組數據分布的偏度系數為負時,該數據的眾數、中位數、均值的大小關系是( A )。
A.眾數>中位數>均值
B.均值>中位數>眾數
C.中位數>眾數>均值
D.中位數>均值>眾數
3.一元回歸方程為y=11.64一0.25x,則下列說法中正確的是( C )。
A.自變數平均增長一個單位,因變數減少0.25個單位
B.自變數和因變數之間成正相關關系
C.
D.
4.有甲乙兩組數列,則( A )數列平均數的代表性高。
A. 1< 2 1> 2,則乙數列平均數的代表性高
B. 1< 2 1> 2,則乙數列平均數的代表性低
C. 1= 2 1> 2,則甲數列平均數的代表性高
D. 1= 2 1< 2,則甲數列平均數的代表性低
5.某連續變數數列,其末組為開口組,下限為500,相鄰組的組中值為480,則末組的組中值為( A )。
A.520 B.510 C.500 D.540
6.不受極端變數值影響的平均數是( D )。
A.算術平均數 B.調和平均數
C.幾何平均數 D.眾數
7.有20個工人看管機器台數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上資料編制頻數分布數列應採用( A )。
A.單項式分組 B.等距分組 C.不等距分組 D.以上幾種分組均可以
8.若無季節變動,則季節比率應為( B )。
A.0 B. 1 C. 大於1 D. 小於1
9.如果一個定性的變數有m類,則要引進( C )個虛擬變數。
A.m B.m+1
C.m-1 D.無法判斷
10.第一組工人的平均工齡為5年,第二組為7年,第三組為10年,第一組工人數占總數的20%,第二組佔60%,則三組工人的平均工齡為( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企業2007年各種產品的產量比2006年增長了8%,總生產費用增長了12%,則該廠2007年單位成本( D )
A.減少了0.62% B.增加了0.62%
C.減少了3.7% D.增加了3.7%
12.相關系數r與斜率b2的符號( A )。
A.相同 B.不同
C.無法判斷
13.已知小姜買的兩種股票的綜合價格指數上漲了24點,本日股票的平均收盤價格為14元,前日股票的平均收盤價格為( C )
A.10.64 B.10.5
C.11.29 D.無法計算
14.若今年比去年的環比發展速度為112%,去年比前年的環比增長率為3%,那麼今年比前年的平均增長率為( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增長1%的絕對值為0.54,去年比前年增長的絕對值為5,則去年比前年的增長率為( C )。
A.9.3% B.8.7%
C.10.2% D.無法計算
二、多項選擇題(每小題2分,共16分)
在每小題列出的若干選項中有多個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.下列變數,屬於離散變數的有( A D E F )。
A.庫存產品數量 B.流動資產對流動負債的比率
C.貨物總重量 D.按個計量的貨物數量
E.一條收費公路上的交通量 F.公司年會的出席人數
2.指出下列數據收集屬於通過實驗的方法收集數據的有(A B E )
A.培訓航空機票代理人的新方法與傳統方法的比較結果
B.通過讓兩組可以比較的孩子分別使用兩種不同的組裝說明組裝玩具來比較這兩種組裝說明
C.一份產品評價雜志給它的訂閱者郵寄調查問卷,請他們為近期購買的產品排名
D.采訪一個購物中心的顧客,詢問他們為什麼在那裡購物
E.通過在兩個可比較地區分別採用不同的方法,比較兩種不同的養老金促銷方法
3.下列組限的表示方法哪些是對的( A B D )。
A.按職工人數分組,相鄰組的組限可以重疊,也可以間斷
B.職工按工資分組,其組限必須重疊
C.學生按成績分組,其組限必須間斷
D.人按身高分組,其組限必須重疊
4.下列屬於質量指標指數的有( A B D E )。
A.價格指數 B.單位成本指數
C.銷售量指數 D.工資水平指數
E.勞動生產率指數
5.具體地說,如果出現下列( A B C )情況,暗示多元回歸模型有可能存在多重共線性。
A.模型中各對自變數之間顯著相關
B.線形關系顯著,回歸系數 的t檢驗卻不顯著
C.回歸系數的正負號與預期相反
D.
6.算術平均數具有下列哪些性質( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在頻數分布數列中( C D E )。
A.總次數一定,頻數和頻率成反比 B.各組的頻數之和等於100
C.各組頻率大於0,頻率之和等於1 D.頻率越小,則該組數值所起作用越小
E.頻率表明各組變數值對總體的相對作用程度
8.標准差( C E )。
A.表明總體單位標志值的一般水平 B.反映總體單位的一般水平
C.反映總體單位標志值的離散程度 D.反映總體分布的集中趨勢
E.反映總體分布的離中趨勢
三、簡答題(本大題共2題,每題5分,共10分)
1.什麼是年度化增長率?它有何用途?
2.數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。( 錯 )
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。( 錯 )
3.連續型變數和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。( 對 )
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。( 對 )
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。( 錯 )
四、計算分析題(共54分)
1.將某郵局中外發郵包樣本的重量近似到盎司為:21,18,30,12,14,17,28,10,16,25。計算這組數據的均值,中位數,眾數,極差,四分位間距,從偏斜度的角度描述數據的分布形狀(10分)。
2.表1中列出了在一個為期三周的商務統計課程中學生課外學習的小時數和他們在課程結束時的測試分數的樣本數據如下:
表1 學生課外學習時間及考試分數統計表
學生樣本 1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
考試分數,Y 64 61 84 70 88 92 72 77
利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
標准誤差 6.157605
觀測值 8
方差分析
df SS MS F Significance F
回歸分析 1 658.5034 658.5034 17.36738233 0.005895457
殘差 6 227.4966 37.9161
總計 7 886
Coefficients 標准誤差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的? 86.21% 74.32%
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(3) 檢驗線性關系的顯著性 。
(4) 根據標准化殘差圖判斷關於隨機誤差項正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立
3.隨機抽取了15家大型商場銷售的同類產品的有關數據(單位:元),利用EXCEL進行回歸,結果如下表:(共15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
標准誤差 69.75121
觀測值 15
方差分析
df SS MS F Significance F
回歸分析 2 31778.15 15889.08 3.265842 0.073722186
殘差 12 58382.78 4865.232
總計 14 90160.93
Coefficients 標准誤差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
註:X Variable 1為購進價格/元
X Variable 2為銷售費用/元
因變數Y為銷售價格/元
(1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系? 0.3089 0.0012 沒有,因為相關系數較小
(2)根據上訴結果,你認為用購進價格與銷售費用來預測是否有用?沒用
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。不顯著
(4)解釋判定系數R2,所得結論與問題(2)中是否一致? R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?高度相關
(6)模型中是否存在多重共線性?你對模型有何特長建議?可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4.一公司生產的三種產品的有關如下數據如下表所示 (共14分):
商品 計量單位 銷售量 單價(萬元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 噸 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)計算三種產品的銷售額指數;
(2)計算三種產品的銷售量指數;
(3)計算三種產品的單位價格指數;
(4)計算分析產量和單位價格的變動對銷售額影響的相對數和絕對數。
北京信息科技大學
2007 ~2008學年第一學期
《統計學》課程期末考試試卷標准答案(A卷)
一、 單項選擇題(本大題共15小題,每小題1分,共15分)
在每小題列出的四個備選項中只有一個是符合題目要求的,請將其代碼填寫在題後的括弧內。錯選、多選或未選均無分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多項選擇題(每小題2分,共16分)
在每小題列出的五個選項中有二至五個選項是符合題目要求的,請將正確選項前的字母填在題後的括弧內。多選、少選、錯選均無分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 簡答題(本大題共2題,每題5分,共10分)
1. 什麼是年度化增長率?它有何用途?
(1)增長率以年來表示時,稱為年度化增長率或年率,(+2)
其計算公式為:
m 為一年中的時期個數;n 為所跨的時期總數
季度增長率被年度化時,m =4
月增長率被年度化時,m =12
當m = n 時,上述公式就是年增長率 (+2)
(2)可將月度增長率或季度增長率轉換為年度增長率,實現增長率之間的可比性。(+1)
2. 數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變數值分組和組距分組兩種分組方法。
單變數值分組:將一個變數值作為一組;適合於離散變數;適合於變數值較少的情況(+1)
組距分組:將變數值的一個區間作為一組;適合於連續變數;適合於變數值較多的情況;需要遵循「不重不漏」的原則;可採用等距分組,也可採用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題共5小題,每小題1分,共5分)
1.相關系數為+1時,說明兩變數完全相關,相關系數為-1時,說明兩個變數不相關。(×)
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。(×)
3.連續型變和離散型變數在進行組距式分組時,均可採用相鄰組組距重疊的方法確定組限。(√)
4.根據建立的直線回歸方程,不能判斷出兩個變數之間相關的密切程度。(√)
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。(×)
五、計算分析題(共55分)
中位數的位置:(10+1)/2=5.5
中位數
從偏斜度的角度描述數據的分布形狀:均值>中位數,正向(右)偏
(+2)
2.(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的?
r=0.862109, (+1)
R2=0.743232, 考試分數的變差中有74.3232%是由於學習時間的變動引起的。(+2)
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(+3)
回歸系數的含義表明學習時間每增加一個小時, 考試分數平均增加1.497分。(+2)
(3) 檢驗線形關系的顯著性
Significance F=0.005895457〈 =5%
線性關系顯著。(+3)
(4) 根據標准化殘差圖判斷關於隨機誤差項服從正態分布的假定是否成立。
標准化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立。(+4)
3. (1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系
(1)ryxi =0.308952067 ryx2=0.001214062,
沒有證據。(+2)
(2)根據上述結果,你認為用購進價格與銷售費用來預測是否有用?
沒有用。(+2)
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。
Significance F=0.073722> =5%
線性關系不顯著。(+3)
(4)解釋判定系數R2,所得結論與問題(2)中是否一致
R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,一致。(+3)
(5)X1與X2之間的相關系數是什麼?意味著什麼?
rx1x2=-0.8529,高度相關(+2)
(6)模型中是否存在多重共線性?你對模型有何特長建議?
可能存在多重共線性;進一步檢驗是否存在多重共線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重共線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變數。(+1)
4. (1)三種產品的銷售額指數; (+3)
三種產品的銷售額指數=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8萬元
(2)三種產品的銷售量指數; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2萬元
(3)三種產品的價格指數; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4) 分析產量和單位價格的變動對銷售額影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元萬元=85.2萬元+11.6萬元 (+2)