統(tǒng)計(jì)學(xué)第六版賈俊平第2章_第1頁(yè)
已閱讀1頁(yè),還剩48頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 2 章 數(shù)據(jù)的搜集,第 2 章 數(shù)據(jù)的搜集,2.1 數(shù)據(jù)的來(lái)源2.2 調(diào)查數(shù)據(jù)2.3 實(shí)驗(yàn)數(shù)據(jù)2.4 數(shù)據(jù)的誤差2.5 數(shù)據(jù)文件,學(xué)習(xí)目標(biāo),數(shù)據(jù)的來(lái)源搜集數(shù)據(jù)的調(diào)查方法問(wèn)卷設(shè)計(jì)搜集數(shù)據(jù)的實(shí)驗(yàn)方法數(shù)據(jù)的誤差數(shù)據(jù)的質(zhì)量要求,2.1 數(shù)據(jù)的來(lái)源,一. 數(shù)據(jù)的間接來(lái)源二. 數(shù)據(jù)的直接來(lái)源,數(shù)據(jù)的間接來(lái)源,系統(tǒng)外部的數(shù)據(jù),統(tǒng)計(jì)部門(mén)和政府部門(mén)公布的有關(guān)資料,如各類(lèi)統(tǒng)計(jì)年鑒各類(lèi)經(jīng)濟(jì)信息中心

2、、信息咨詢機(jī)構(gòu)、專(zhuān)業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類(lèi)專(zhuān)業(yè)期刊、報(bào)紙、書(shū)籍所提供的資料各種會(huì)議,如博覽會(huì)、展銷(xiāo)會(huì)、交易會(huì)及專(zhuān)業(yè)性、學(xué)術(shù)性研討會(huì)上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書(shū)館查閱到的相關(guān)資料,系統(tǒng)內(nèi)部的數(shù)據(jù),業(yè)務(wù)資料,如與業(yè)務(wù)經(jīng)營(yíng)活動(dòng)有關(guān)的各種單據(jù),記錄經(jīng)營(yíng)活動(dòng)過(guò)程中的各種統(tǒng)計(jì)報(bào)表各種財(cái)務(wù),會(huì)計(jì)核算和分析資料等,二手?jǐn)?shù)據(jù)的特點(diǎn),搜集容易,采集成本低作用廣泛分析所要研究的問(wèn)題提供研究問(wèn)題的背景幫助研究者更好地定義問(wèn)題檢驗(yàn)和回答某

3、些疑問(wèn)和假設(shè)尋找研究問(wèn)題的思路和途徑搜集二手資料在研究中應(yīng)優(yōu)先考慮,二手?jǐn)?shù)據(jù)的評(píng)估,數(shù)據(jù)是誰(shuí)搜集的?可信度評(píng)估為什么目的而搜集的?數(shù)據(jù)是怎樣搜集的? 什么時(shí)候搜集的?,數(shù)據(jù)的直接來(lái)源(原始數(shù)據(jù)),調(diào)查數(shù)據(jù)通過(guò)調(diào)查方法獲得的數(shù)據(jù)通常是對(duì)社會(huì)現(xiàn)象而言通常取自有限總體 實(shí)驗(yàn)數(shù)據(jù)通過(guò)實(shí)驗(yàn)方法得到的數(shù)據(jù)通常是對(duì)自然現(xiàn)象而言 也被廣泛運(yùn)用到社會(huì)科學(xué)中如心理學(xué)、教育學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)等,2.2 調(diào)查數(shù)據(jù),概率

4、抽樣與非概率抽樣搜集數(shù)據(jù)的基本方法,概率抽樣和非概率抽樣,抽樣方法,概率抽樣(probability sampling),也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率,簡(jiǎn)單隨機(jī)抽樣(simple random sampling),從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為

5、樣本,每個(gè)單位入抽樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其它輔助信息以提高估計(jì)的效率,分層抽樣(stratified sampling),將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)

6、構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì),整群抽樣(cluster sampling),將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差,系統(tǒng)抽樣(systematic sampling),將總體中的所有單

7、位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難,多階段抽樣(multi-stage sampling),先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位

8、,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開(kāi)在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法,非概率抽樣(non-probability sampling),相對(duì)于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位

9、對(duì)其實(shí)施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式,方便抽樣,調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場(chǎng)所進(jìn)行攔截調(diào)查廠家在出售產(chǎn)品柜臺(tái)前對(duì)路過(guò)顧客進(jìn)行的調(diào)查優(yōu)點(diǎn):容易實(shí)施,調(diào)查的成本低缺點(diǎn):樣本單位的確定帶有隨意性,樣本無(wú)法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體,判斷抽樣,研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的選擇一些單位作為樣本有重點(diǎn)抽樣,典

10、型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專(zhuān)業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒(méi)有依據(jù)隨機(jī)的原則,調(diào)查結(jié)果不能用于對(duì)推斷總體,自愿樣本,被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問(wèn)卷活動(dòng),向某類(lèi)節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機(jī)性無(wú)關(guān)樣本是有偏的不能依據(jù)樣本的信息推斷總體,滾血球抽樣,先選擇

11、一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)適合于對(duì)稀少群體和特定群體研究?jī)?yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低,配額抽樣,先將體中的所有單位按一定的標(biāo)志(變量)分為若干類(lèi),然后在每個(gè)類(lèi)中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡(jiǎn)單,可以保證總體中不同類(lèi)別的單位都能包括在所抽的樣本之中,使得樣本的

12、結(jié)構(gòu)和總體的結(jié)構(gòu)類(lèi)似抽取具體樣本單位時(shí),不是依據(jù)隨機(jī)原則,屬于非概率抽樣,概率抽樣與非概率抽樣的比較,概率抽樣依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的分布是不確定的無(wú)法使用樣本的結(jié)果推斷總體,課堂練習(xí),1.為了調(diào)查某校學(xué)生的購(gòu)書(shū)費(fèi)用支出,從男生中抽取60名學(xué)生調(diào)查,從女生中抽取40名學(xué)生調(diào)查,這種調(diào)查方法是()A 簡(jiǎn)單隨機(jī)抽樣 B 整群抽樣

13、C 分層抽樣 D 系統(tǒng)抽樣2.為了調(diào)查某校學(xué)生的購(gòu)書(shū)費(fèi)用支出,從全校抽取4個(gè)班級(jí)的學(xué)生進(jìn)行調(diào)查,這種調(diào)查方法是()A 簡(jiǎn)單隨機(jī)抽樣 B 整群抽樣 C 分層抽樣 D 系統(tǒng)抽樣3.為了調(diào)查某校學(xué)生的購(gòu)書(shū)費(fèi)用支出,將全校學(xué)生的名單按拼音順序排列后,每隔50名學(xué)生抽取一名學(xué)生進(jìn)行調(diào)查,這種調(diào)查方法是()A 簡(jiǎn)單隨機(jī)抽樣 B 整群抽樣 C 分層抽樣 D 系統(tǒng)抽樣4.下面的哪種抽樣調(diào)查結(jié)果不能用于對(duì)總體有關(guān)參數(shù)進(jìn)行估計(jì)()

14、A 判斷抽樣 B 整群抽樣 C 分層抽樣 D 系統(tǒng)抽樣,課堂練習(xí),5.為了解女性對(duì)某種品牌化妝品的購(gòu)買(mǎi)意愿,調(diào)查者在街頭隨意攔截部分女性進(jìn)行調(diào)查。這種調(diào)查方式是()A 簡(jiǎn)單隨機(jī)抽樣 B 分層抽樣 C 方便抽樣 D 自愿抽樣6.下面的哪種抽樣方式不屬于概率抽樣()A 系統(tǒng)抽樣 B 整群抽樣 C 分層抽樣 D 滾雪球抽樣7.與概率抽樣相比,非概率抽樣的缺點(diǎn)是()A 樣本統(tǒng)計(jì)量的分布是確定的B 無(wú)法使用樣本的結(jié)果

15、對(duì)總體相應(yīng)的參數(shù)進(jìn)行推斷C 調(diào)查的成本比較高D 不適合探索性的研究,搜集數(shù)據(jù)的基本方法,搜集數(shù)據(jù)的基本方法,自填式問(wèn)卷調(diào)查,沒(méi)有調(diào)查員協(xié)助的情況下由被調(diào)查者自己完成調(diào)查問(wèn)卷問(wèn)卷遞送方法有:調(diào)查員分發(fā)、郵寄、網(wǎng)絡(luò)、媒體要求調(diào)查問(wèn)卷結(jié)構(gòu)嚴(yán)謹(jǐn),有清楚的說(shuō)明弱點(diǎn)問(wèn)卷的返回率比較低不適合結(jié)構(gòu)復(fù)雜的問(wèn)卷調(diào)查周期比較長(zhǎng) 數(shù)據(jù)搜集過(guò)程中出現(xiàn)的問(wèn)題難于及時(shí)采取調(diào)改措施,面訪式問(wèn)卷調(diào)查,調(diào)查員與被調(diào)查者面對(duì)面提問(wèn)、被調(diào)查者回答的一種調(diào)查方

16、式優(yōu)點(diǎn)可提高調(diào)查的回答率可提高調(diào)查數(shù)據(jù)的質(zhì)量能調(diào)節(jié)數(shù)據(jù)搜集所花費(fèi)的時(shí)間弱點(diǎn)調(diào)查的成本較高調(diào)查過(guò)程的質(zhì)量控制有一定難度,電話式問(wèn)卷調(diào)查,您好!我是××調(diào)查公司的調(diào)查員…,通過(guò)電話向被調(diào)查者實(shí)施調(diào)查特點(diǎn)速度快,能在短時(shí)間內(nèi)完成調(diào)適合于樣本單位十分分散的情況局限如果被調(diào)查者沒(méi)有電話,調(diào)查將無(wú)法實(shí)施訪問(wèn)的時(shí)間不能太長(zhǎng)使用的問(wèn)卷需要簡(jiǎn)單被訪者不愿意接受調(diào)查時(shí),難以說(shuō)服,觀察式調(diào)查,1.就調(diào)查對(duì)

17、象的行動(dòng)和意識(shí),調(diào)查人員邊觀察邊記錄以收集所需信息2.調(diào)查人員不是強(qiáng)行介入能夠在被調(diào)查者不察覺(jué)的情況下獲得資料如交通流量的調(diào)查,各調(diào)查方法的比較,2.3 實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)組和對(duì)照組實(shí)驗(yàn)中的若干問(wèn)題實(shí)驗(yàn)中的統(tǒng)計(jì)實(shí)驗(yàn)法案例,實(shí)驗(yàn)組和對(duì)照組,將研究對(duì)象分為兩組:實(shí)驗(yàn)組和對(duì)照組實(shí)驗(yàn)組和隨機(jī)組的產(chǎn)生應(yīng)遵循隨機(jī)原則,而且應(yīng)該匹配匹配指對(duì)實(shí)驗(yàn)單位的背景材料進(jìn)行分析比較,將情況類(lèi)似的每對(duì)單位分別隨機(jī)地分配到實(shí)驗(yàn)組和對(duì)照組,實(shí)驗(yàn)中的若

18、干問(wèn)題,人的意愿研究的對(duì)象是人的時(shí)候,在劃分實(shí)驗(yàn)組和對(duì)照組時(shí)的隨機(jī)原則將面臨挑戰(zhàn)心理問(wèn)題 人們對(duì)被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個(gè)極端 道德問(wèn)題 當(dāng)某種實(shí)驗(yàn)涉及道德問(wèn)題時(shí),人們會(huì)處于進(jìn)退兩難的尷尬境地,非抽樣誤差(non-sampling error),相對(duì)抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽

19、樣框誤差、回答誤差、無(wú)回答誤差、調(diào)查員誤差、測(cè)量誤差,實(shí)驗(yàn)中的統(tǒng)計(jì),實(shí)驗(yàn)設(shè)計(jì)本身就是一個(gè)統(tǒng)計(jì)問(wèn)題確定進(jìn)行實(shí)驗(yàn)所需要的單位的個(gè)數(shù),以保證實(shí)驗(yàn)可以達(dá)到統(tǒng)計(jì)顯著的結(jié)果將統(tǒng)計(jì)的思想融入到實(shí)驗(yàn)設(shè)計(jì)中,使實(shí)驗(yàn)設(shè)計(jì)符合統(tǒng)計(jì)分析的標(biāo)準(zhǔn)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析時(shí),統(tǒng)計(jì)可以提供最恰當(dāng)?shù)姆治龇椒?2.4 數(shù)據(jù)的誤差,抽樣誤差非抽樣誤差誤差的控制,數(shù)據(jù)的誤差,抽樣誤差(sampling error),由于抽樣的隨機(jī)性所帶來(lái)的誤差 所有樣本可能的結(jié)果

20、與總體真值之間的平均性差異 影響抽樣誤差的大小的因素樣本量的大小總體的變異性,誤差的控制,抽樣誤差可計(jì)算和控制非抽樣誤差的控制調(diào)查員的挑選調(diào)查員的培訓(xùn)督導(dǎo)員的調(diào)查專(zhuān)業(yè)水平調(diào)查過(guò)程控制調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)懲的制度,統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量要求,1. 精 度:最低的抽樣誤差或隨機(jī)誤差2. 準(zhǔn) 確 性:最小的非抽樣誤差或偏差3. 關(guān) 聯(lián) 性:滿足用戶決策、管理和研究的需要4.

21、及 時(shí) 性:在最短的時(shí)間里取得并公布數(shù)據(jù)5. 一 致 性:保持時(shí)間序列的可比性6. 最低成本:以最經(jīng)濟(jì)的方式取得數(shù)據(jù),課堂練習(xí),1.某居民小區(qū)為了解住戶對(duì)物業(yè)服務(wù)的看法,準(zhǔn)備采取抽樣調(diào)查方式搜集數(shù)據(jù)。物業(yè)部分利用最初的居民登記名單進(jìn)行抽樣。但現(xiàn)在的小區(qū)中,原有的一些居民戶已經(jīng)搬走,同時(shí)有些是新入住的居民戶。這種調(diào)查產(chǎn)生的誤差屬于()A 隨機(jī)誤差 B 抽樣框誤差 C 回答誤差 D 無(wú)回答誤差2.某居民小區(qū)為了解住

22、戶對(duì)物業(yè)服務(wù)的看法,準(zhǔn)備采取抽樣調(diào)查方式搜集數(shù)據(jù)。物業(yè)部分利用最初的居民登記名單進(jìn)行抽樣。但現(xiàn)在的小區(qū)中,原有的一些居民戶已經(jīng)搬走而沒(méi)有回答問(wèn)題。這種調(diào)查產(chǎn)生的誤差屬于()A 隨機(jī)誤差 B 抽樣框誤差 C 回答誤差 D 無(wú)回答誤差3.指出下面的陳述哪一個(gè)是錯(cuò)誤的()A 抽樣誤差是可以避免的 B 非抽樣誤差是可以避免的C 抽樣誤差是不可避免的 D 抽樣誤差是可以控制的,課堂練習(xí),4.某居民小區(qū)的物業(yè)管理者懷疑有些居民有偷

23、電行為。為了解住戶的每月用電情況,采取抽樣調(diào)查方式對(duì)部分居民進(jìn)行調(diào)查。發(fā)現(xiàn)有些居民有虛報(bào)或瞞報(bào)情況。這種調(diào)查產(chǎn)生的誤差屬于()A 有意識(shí)誤差 B 抽樣框誤差 C 回答誤差 D 無(wú)回答誤差5.某居民小區(qū)的物業(yè)管理者懷疑有些居民有偷電行為。為了解住戶的每月用電情況,采取抽樣調(diào)查方式對(duì)部分居民進(jìn)行調(diào)查。發(fā)現(xiàn)調(diào)查員在登記電表數(shù)時(shí)有抄錯(cuò)表的數(shù)據(jù)。這種調(diào)查產(chǎn)生的誤差屬于()A 有意識(shí)誤差 B 抽樣框誤差 C 調(diào)查員誤差 D 無(wú)回答

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論