学生比赛顺序用什么随机抽样样本多少合适方法比较合适

几种重要的随机抽样方法
几种重要的随机抽样方法
根据总体的不同特点和不同的调查研究目的,在实际调查研究中常常应用不同方式的随机抽样,最主要的抽样方法有简单随机抽样、分层抽样、等距抽样等。本节介绍最主要的几种,同时,为了比较各种抽样方法的精确度,分别给出每种抽样方法中平均数或比率的标准误公式。
一、简单随机抽样
(一)方法
一般所说的随机抽样,就是指简单随机抽样(simple random
sampling),它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。常用的具体抽取方式有抽签法和随机数字法。抽签法(drawing
是把总体中的每个体都编上号码并做成签,充分混合后从中随机抽取-部分,这部分签所对应的个体就组成一个样本。随机数字表(Radom
number table)
是由一些任意的数字毫无规律地排列而成的数字表。附表19就是由1万个数字无规则排列组成的一个随机数字表。使用随机数字表进行抽样时,先给总体编号,然后从表中任意一个数字开始由依次往下数,并把最后几位数字小于总体编号数字的选出,按研究要求组成一个样本。例如,从50个人中随机抽取10人,先将50人从1至50编上号,假如选定04与05—09交叉处的99896开始,纵向往下数并规定凡是最后两位敢字小于50的均可入样本,则23、41、26、25、18、9、28、1、26、
36十个编号的人可组成一个样本。
(二)标准误
前面说过,在图14-1中,d值是抽样结果精确度的一个指标,而d 值实际上受标准误的影响,标准误越大,则d
值也大,这时意味着抽样结果的精确度越小。因此从各种抽样方法的标准误大小,能够直接评价抽样的精确度。
在讨论标准误的公式之前,应该注意区分有限总体与无限总体这两个概念。如果总体中包含个体的数量是有限的,该总体就叫有限总体,也就是说无论N有多大,只要不是无穷大,就是有限总体。如果总体中所含个体的数量是无限的,即N&∞,则该总体叫做无限总体。例如,某运动员投篮10次,命中8次,命中率为80%。这10次投篮,相当于一个n=
10的样本,而总体N(即总的投篮次数)
从理论上讲是无限的,因此可以说这个样本是从无限总体抽取的(有时N虽然有限,但样本容量n与N相比很小,即n≤N,则也可近似视为无限总体)。在介绍参数估计和假设检验时,都假设是无限总体的情况,介绍的各个公式也都是在“无限总体中抽样”这一前提之下给出的。在实际研究中,如果总体是有限的,而且不宜假设为无限总体时,则应该注意其区别。
1.平均数的标准误
在简单随机抽样中,平均数的标准误公式如下(由于在实际中总体标准差一般很少事先知道,因此本章的公式均以样本标准差代替总体标准差):
当样本所属单体是无限总体时:
2 比率的标准误
简单随机抽样中当样本容量n较大时比率的标准误为:
从理论上说,简单随机抽样是最符合随机原则的,而且分析抽样误差比较简明。但是这种方法在实践中受到一些限制,存在一些不足。例如,简单随机抽样需要把总体中每一个体编上号码,如果总体很大,这种编号几乎是不可能的。再者,这种抽样方法常常忽略总体已有的信息,降低了样本的代表性。例如,对某一地区的学生进行抽样,测试该地区学生的智力水平,重点学校与一般学校的学生是有差异的,如果不考虑这个因子,则所抽取的样本很可能抽到重点学校的学生多些,或根本没有重点学校的学生。这样,样本的代表性是不理想的,若充分考虑并利用重点与一般存在差异这一已有信息,可以设计出更好的抽样方法(见后面的分层随机抽样)。另外,在大规模的抽样研究时,用抽签法是不可能的,而用随机数字表一个一个地抽,又太费时费力。这时就得采用和简单随机抽样相似,但实施简便的等距抽样方法。
二、等距抽样
等距抽样(Interval sampling) 也叫机械抽样或系统抽样(
systematic sampling)。在实施时,将己编好号码的个体排成顺序,然后每隔若干个抽取一个,例如调查某大学一个系(
N=200)学生的兴趣爱好,采用等距抽样,n=50,则每隔4个人抽一个,如1号、5号、9号…,或2号、6号、10号…。
一般来说,这种抽样方法比简单随机抽样简便易行,
而且它比较均匀地抽到总体中各个部分的个体,样本的代表性比简单随机抽样好。至于究竟间隔多远抽一个,视总体大小和样本所需容量而定,但是,如果总体具有某一种周期性变化,则等距抽样的代表性远不如简单随机抽样。例如,前面举的从大学抽样调查兴趣爱好的例子中,假如正好男女生的编号分别为奇盘或偶数则隔4个抽一个很可能全抽到男生或全抽到女生,由于兴趣爱好在男、女生之间可能有明显差别,这时只用男生(或女生)的样本不能代理全体,另外,等距抽样同简单随机抽样一样也容易忽略已有信息,例如,从某个区县抽样调查高三学生智力水平,已知该区县有两所重点学校(高三学生分别为150人和100人),根据总体及样本容量的要求,决定每隔200人抽一个,设一所重点学校学生的编号是509
至609. 另一所重点学校学生的编号是1250
至1400,进行等距抽样时若从第10号开始抽,则抽到的学生为10、210、410、610、81
0、、1410...,这样,重点中学的学生一个没抽到,显然是不合适的.
三、分层随机抽样
分层随机抽样简称分层抽样(stratified sampling 或hierarchical
sampling)。具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。它充分利用了总体的已有信息,因而是一种非常实用的抽样方法。
对于一个总体究竟应该如何分层,分几层,要视具体情况而定。总的一个原则是,各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。例如,从某综合大学抽样调查学生逻辑推理能力,根据以往的研究结果,文科与理科学生的逻辑推理能力有显著盖异。因而进行分层抽样时就按文、理科分为两层,或分成文、理、交叉学科三个层次。
有些复杂问题,常常还需要按两个或两个以上的分层标准进行分层。例如,以儿童为对象,进行心理实验研究时,要考虑到遗传、环境、年龄、性别等对儿童有影响的各种因子,在选取样本时,应该按照这些因子进行多个分层标准的分层抽样。美国心理学家韦克斯勒(Wechsler)1966年编制的幼儿智力量表(WPPSI),抽样时曾考虑到6个分层标准:①年龄(4岁-6岁半,每半岁为一组);@性别;③种族(白人与非白人);④地区(东北部、中北部、西部、南部);⑤家长职业(8种职业):⑥城市与农村。这样,先按年龄分成6个年龄组,每组又按性别分为男女各半,然后再考虑种族、地区、家长职业、城乡等继续分层。
日本1967年修订WPPSI时,认为日本国情与美国不同,因此只按年龄、性别、地区三个标准进行分层。可见分层标准并不是一成不变的,即使是同一个研究课题,在不同的条件下,用什么标准进行分层以及对于每一个分层标准应当分为几层均需视具体情况而决定。
既然各个层之间的差异较大,那么各层的人数分配也不应一律等同,设总体为N,所需样本容量为n,则如何合理地将n分配在各层,是分层抽样的一个重要问题。具体施行过程中有两种方式:
1 按每层人数比例分配
这是在各层内的标准差不知道的情况下常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配。设各层的人数分别为N1、N2、N3、...、Nk,则每层应分配的人数为n1、n2、n3、…、nk,则:
N=N1+N2+N3+…+Nk
N=n1+n2+n3+…+nk
如果按人数比例分配,则:
2 最佳分配
这种分配不但根据各层人数比例,还考虑到了各层标准差。如果各层内的标准量已知,就应该考虑到标准差大的层要多分配,标准差小的层要少分配。这样不但根据各层人数比例,还考虑到各层标准差的分配叫最佳分配。这时,任意一层应分配的人数ni为:
(二)标准误
为了简化公式,先引人统计量Wi,令Wi=Ni/N
1、平均数的标准误
某大学为了调查新生推理能力,以分层抽样的方式从1500名新生中抽取200名进行瑞文推理测验。已知新生中文科500名、理科800名、边缘学科200名,根据历年同类调查的资料,新生瑞文推理测验成绩的标准差文科是S1
= 10,理科是S2=7,边缘学科S3 = 12,试问这次调查时这200名被试如何在文、理、边缘学科中分配?样本平均数(n
=200)分布的标准误为多少?
因此.200人的样本应包括77名文科生,86名理科生,37名边缘学科学生,样本平均敛( n =200)分布的标准误为:
2 比率的标准误(样本容量n 较大时)
无限总体:
式中pi为某一层内的比率;qi=l-pi;Wi、Ni、ni的意义同前。
分层抽样由于充分利用了总体已知的信息,其样本的代表性及推论的精确性一般优于简单随机抽样。比较两种抽样方式的标准误,能够说明这种分层的效果。
如前所述,一般总体方差并不易得到,常以样本方差来估计,因而这里S代表总体的差异。在分层抽样中,总体变异实际上来源于层与层之间和各层内部,即层间与层内两部分。
从上可知,分层抽样时平均数的标准误为:
这表明,对于同一个总体,分层抽样与简单随机抽样在样本容量相同时,前者的抽样误差小于后者的抽样误差。
此外,从上述分析中还可以看到,当层间变异增大时,层内变异减小(相对于同一总体),使SE减小。也就是前面曾提到的,分层抽样中层与层之间变异越大,则分层的效果越好。
四、两阶段随机抽样
当总体容量很大时,直接以总体中的所有个体为对象,从中进行抽样,在实际调查或研究中存在很大困难。例如调查全国某一年龄组城市儿童的认知能力,若直接从该年龄组的儿童中简单随机抽样,首先遇到的困难是将全国各城市该年龄的儿童编号过程;其次所抽到的个体在全国范围分布得很散,使研究人员很难进行实际的调查。如果进行分层抽样,它只是把总体按某种特性分成不同的几个部分(层),在每一层中均须抽样,总的来说还是在原总体范围内抽取个体,当总体很大时仍然存在校大的人力、财力方面的困难。
在实际研究中,对于这类大范围的调查研究一般采取阶段抽样方法,像上面那样的调查,若第一阶段先以城市为抽取单位,从全国所有城市中随机抽取一部分城市(这样等于用这部分城市代表所有城市),第二阶段再从所选取的城市中随机抽取调查对象(个体),这就是两阶段随机抽样(
two-stage random sampling)。
一般而言,进行两阶段抽样时,首先将总体分成M个部分,每一部分叫做一“集团”(或“群”),第一步从M个集团中随机抽取m个作为第一阶段样本,第二步是分别从所选取的m个“集团”中抽取个体(ni)构成第二阶段样本,可见第一阶段样本中的单位,相对于第二阶段来说又是总体(分总体)。
设总体容量为N,某一“集团”的容量Ni,所需样本容量为n,从某一“集团”所抽个体数为ni,则:
N =∑Ni , n =∑ni
若各个“集团”的容量Ni均相同,记为,则各个ni应相同(),这时:
N = M&, n = M&
学习者应注意两阶段抽样与分层抽样的根本区别。从形式上看,似乎部分成两步,第一步将总体分成若干部分,第二步再分别从部分中抽取个体。但二者在第一步中有着根本区别。
在分层抽样中,对于每一个部分总体(即“层”)均需从中抽取个体,因而没有第一阶段样本的问题,而在两阶段抽样中,将总体分成若干个“集团”后,并不是对每一个集团都再进行第二阶段抽样,而是从所有的“集团”中先抽取部分“集团”,这里实际上进行了第一阶段的抽样,构成了第一阶段样本,然后再对所选“集团”作第二阶段抽样。
(二)标准误
在进行两阶段抽样时,大部分情况是有限总体,这里给出有限总体情况下的抽样标准误。
1.平均数的标准误
①一般情况下(各不相等):
③如果各“集团”大小(Ni)相同,则进行第二阶段抽样时,ni也应相同。这时各“集团”的大小记作,从中抽取的个体数记为;
(为某一集团的抽样平均数,为整个样本的平均数)
2 比率的标准误(样本较大时)
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些〈即抽样误差大些),这主要是由于存在第一阶段的抽样,使得第二阶段抽样时已经不是从全总体中抽取,而是从全总体的部分代表(第一阶段样本)中抽取。但是,两阶段抽样简便易行,节省经费,因而它是大规模调查研究中常被使用的抽样方法。
抽样方法还有一种分类是根据每次抽取的样本是否在下次抽样前放回总体中,分为有放回抽样和无放回抽样。有放回抽样(sampling with
replacement)
是指每次从总体中抽取一个个体,观测后放回总体中,再抽下一个,对这n个个体总体变量值作观测,所得到的样本(理论值)被称为“简单样本”
(simple sample),或“i.i.d样本”(independent identically
distributed)。与此对应的是无放回抽样(Sampling without
replacement),即每次从总体中抽一个个体,观测后不放回总体中,再抽下一个,或者等价地,从总体中一下子取出n个个体进行观测。在无放回抽样下得到的样本,从理论上讲就不再是简单样本了,但是当总体中个体的数目很多(与样本大小比较)时,从总体中抽掉一些个体没有太大的区别。在这种情况下,即使是无放回抽样也可以近似地看成是有放回抽样,即简单样本。
不管采用什么类型的抽样方法,为保证样本代表性,在抽样时必须遵循随机化原则,即在抽样时,总体中每一个体按照概率原理被抽取的可能性是相等的,否则,样本研究就不会具备代表性。各种随机抽样方法为保证这一环节的成功起着非常重要的作用。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。发布轻博客这是个机器人猖狂的时代,请输一下验证码,证明咱是正常人~下列调查方式中,适宜采用抽样调查的是(  )
A.了解重庆市所有九年级学生每天参加体育锻炼的平均_百度知道
下列调查方式中,适宜采用抽样调查的是(  )
A.了解重庆市所有九年级学生每天参加体育锻炼的平均
下列调查方式中,适宜采用抽样调查的是(  )
A.了解重庆市所有九年级学生每天参加体育锻炼的平均时间
B.审查一篇科学论文的正确性
C.对你所在班级同学的身高的调查
D.对“瓦良格”号航母的零部件性能的检查
提问者采纳
故本选项错误,事关重大、对“瓦良格”号航母的零部件性能的检查,故本选项正确、了解重庆市所有九年级学生每天参加体育锻炼的平均时间,比较容易做到,难度较大
A,适合全面调查、审查一篇科学论文的正确性,要求精确度高,适合全面调查,故本选项错误;D,精确度要求高;C,适合抽样调查、对你所在班级同学的身高的调查;B,必须全面调查
其他类似问题
为您推荐:
抽样调查的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁

我要回帖

更多关于 不考虑顺序重复抽样 的文章

 

随机推荐