自考学历复习资料:社会研究方法第5章
2018-09-10 09:55
作者:baidao321
自考学历复习资料:社会研究方法第5章
自考学历复习资料
科目名称:社会研究方法
科目代码:03350
社会研究方法这门科目是自考学历专科行政管理里面必考科目,学生复习可以借鉴以下复习资料:
第五章 抽样 (重点章 多次曾出应用题)
1、社会研究中的抽样方法,即选择研究对象的方法或程序。
2、抽样是一项有力的技术,除了社会研究外,它在市场调查、民间测验、生物和医疗实验、工业产品检测等领域,都有着广泛的应用。
3、抽样的理论基础是数理统计学。
4、在社会研究中,研究者从一个规模很大的研究对象中,选出一部分作为研究,这个选取过程就是抽样。
5、为什么进行抽样,主要是考虑研究成本和研究的可行性。
6、抽样的方法大体可分为两类:
(1)非概率抽样 (主要是依据研究的主观意愿、判断或是否方便等因素来选取对象)
(2)概率抽样 (主要是按照随机原则来选取对象,完全不带有研究者的主观因素)
7、非概率率抽样和概率抽样两种方法最大的差别是,在概率抽样中,能够比较精确地估算出抽样误差,而非概率抽样中,则无法估算抽样误差。(单选题)
8、如果用专业术语严格定义,则抽样是从总体中按一定方式选取一组元素的过程,由此产生的元素集合体称为样本。
9、在专业化表述中,每一个具体的调查对象被称为元素,全体研究对象被称为总体,样本则代表一组元素,即一部分研究对象。
10、总体还可以进一步划分为研究总体和目标总体。
l 研究总体是在理论上明确界定的元素的集合体。
l 目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中的一些特例后的总体。 样本只能推论目标总体,而非研究总体。
11、样本中元素个数与总体中元素个数的比率(样本规模与总体规模)称为抽样比率。
12、研究者在实际抽样(特别是概率抽样)时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。
13、抽样框中的总体元素又被称为抽样单元,有时抽样单元与分析单位是相同的。但在较大范围的抽样中,可能有多个层次的抽样单元(初级抽样单元、次级抽样单元、终级抽样单元)。在一次抽样中,抽样框的数目与抽样单元的层次是相对应的。
14、总体的情况或特征是未知的,由参数值来描述;而样本的情况或特征则是已知的,
由统计值来描述。
15、参数值与统计值之间的差异就是抽样误差。差异越大,抽样误差就越大;差异越小,抽样误差就越小。
16、抽样误差是衡量样本代表性大小的标准,它主要取决于总体的异质性程度和样本规模。(抽样中因违反抽样规则产生的人为误差如抄写、资料录入和计算中的人为失误,并不是这里所说的抽样误差)
17、抽样的步骤: (多选题或简答题)
(1)设计抽样方案; (2)抽取样本; (3)评估样本。
18、设计抽样方案包括以下4点内容:
(1)首先,要界定总体;
(2)其次,介绍抽样框的具体内容;
(3)再次,要确定样本所含个体数目;
(4)最后,要根据不同的目标总体,选择合适的抽样方法。
19、抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。
20、由于抽样方法不同,实际抽样工作既可以安排在实地调查前,也可以与实地调查同步进行。前者比较适合总体规模较小,事先有比较完整抽样框的情况;而后者则比较适合总体规模较大,抽样采取多阶段方式进行的情况。
21、评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。
22、评估样本的方法是先找出一些能够反映总体特征的资料,通常是一些数据,与同类指标的样本统计值进行比较;评估所依据的总体统计数据越多,评估效果越好。
23、非概率抽样: (多选题)
(1)方便抽样 (2)配额抽样 (3)判断抽样 (4)雪球抽样
24、进行概率抽样的前提条件是有抽样框,但这个条件有时无法满足,如电视台收视情况的调查,就很难编出合适的抽样框。在这种情况下,经常会采用非概率抽样。
25、非概率抽样的成本较低,操作也比较方便,但无法预先估计抽样误差,因此,很难对总体情况做出可靠的判断。
26、方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差,因此,在使用时要特别小心,总体的情况越复杂,方便抽样的效果就越差。
27、两个方便抽样例子:记者“街头拦人”调查、报纸问卷调查。
28、配额抽样首先要根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。
29、配额抽样的逻辑是通过样本配额,使样本结构尽可能与总体结构保持一致;配额矩
阵所依据的总体参数值越多,则样本元素的分类也越细,样本与总体的结构也越接近。
30、配额抽样中经常采用的参数值包括性别、年龄、教育程度、婚姻状况、收入和职业类别等。
31、判断抽样又称立意抽样,是指研究者根据其研究的目的或专家的判断来选取样本。在这种抽样中,样本是否能满足研究目的的要求,是否能正确反映总体情况,很大程度上依赖于研究者的主观判断,(对研究个人的研究素质要求较高)。
32、判断抽样经常被用于以下三种研究场景:
(1)首先,研究者用判断抽样来选择特别能提供信息的独特个案;
(2)其次,研究者用判断抽样来选取很难以接近的特殊人群;(如外来人员)
(3)最后,研究者用判断抽样来选取某种特殊个案类型,以便深入探究。
33、雪球抽样也称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。(旧人介绍新人)
34、雪球抽样是一种多阶段的技术。
35、雪球抽样特别适合用来对成员难以找到的总体进行抽样。(如吸毒者、流浪汉、散工)
第三节 概率抽样 (经常应用题、论述题)
36、抽样能让研究者依据少量元量素,来推断元素众多的总体。而概率抽样则是实现由样本推断总体的最佳方法,概率抽样是按照随机原则进行的抽样,因此又常被称为随机抽样。因为它是以随机原则为前提的,因此不仅能使研究者在选取要素时避免各种形式的系统误差,而且还能估计出抽样误差的大小。
37、概率抽样有若干种具体形式,社会研究中,要根据研究问题、总体性质和经费情况加以选择。
38、概率抽样:(1)简单随机抽样 (2)系统抽样 (3)分层抽样 (4)多段整群抽样
39、简单随机抽样也称纯随机抽样,指研究者严格按照随机原则来抽取样本。
40、“随机原则”是有特定含义的,它意味着在选取的过程中,一方面要使每一个对象被选中的概率都相等,即要满足等概率要求;另一方面每一上对象的抽取都是相互独立的,即要满足独立性要求。
41、概率抽样和等概率抽样在概念上并不相等。所谓概率抽样是指总体中每个元素都有一定的非零概率被抽中,每个元素被抽中的概率可以相等,也可以不相等,相等称为等概率抽样,不相等称为不等概率抽样。
42、随机抽样是一种等概率抽样。
43、进行简单随机抽样先要建立抽样框,然后再从抽样框中选取元素构成样本。
44、简单随机抽样这种抽样方法是最基本的,也是最容易了解的概率抽样方法,。
45、根据被抽中的元素是否放回总体,简单随机抽样又分为可放回和不放回两种。
研究者在实际抽样中大多采用不放回抽样。
46、当总体数目N不大时,可以用抽签法进行简单随机抽样。
47、如果总体数目N很大,可以用随机数法进行简单随机抽样。这种方法的关键是产生随机数。(产生随机数最常用的工具是随机数表)
48、用随机数表产生随机数,需要完成以下几个步骤:
(1)第一,确定选出随机数的位数。
(2)第二,决定从5位数组中选择哪几位数字。(关键是预先约定好规则,一直按此规则)
(3)第三,确定在表中选择数字的顺序。(关键选定一个顺序后,一直按此顺序)
(4)第四,确定开始选择的5位数组起点。
(5)第五,处理大于总体规模或重复的随机数。
49、系统抽样又称机械抽样。
50、系统抽样的样本元素是按某种确定的规则从总体中抽取的,由于等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。
51、由于抽样使用的是抽样间距,而不是随机数,故等距抽样是一种准随机抽样方法。
52、与简单随机抽样相同,等距抽样也需要先建立起抽样框,即给总体的每一个元素按顺序编上号码。但与简单随机抽样不同,等距抽样不用随机数,而是按一个固定的间距抽取人选。
53、等距抽样的步骤:
(1)首先,确定开始抽取人选的位置;(任何随机的起始点都可以)
(2)其次,计算抽样间距。(抽样间距k=N÷n)(样本占总体比例f=n÷N)
(3)最后,确定抽取元素的方法。
54、对于周期内性排列的总体,要么采用简单随机抽样,要么重新随机排列总体元素。
55、分层抽样是指研究者先把总体分为若干个同质的层(次级总体),然后用简单随机或系统抽样方法,从每层中抽取样本元素。
56、与简单随机或系统抽样相比,分层抽样能减少抽样误差,提高样本的代表性。
57、除了提高样本的代表性,采用分层抽样还有另一个理由。当研究者感兴趣的某个类别在总体中比例很小,简单随机或系统抽样很可能会漏掉该类别的元素时,研究者就会使用分层抽样。
58、实际进行分层抽样,需要解决以下几个问题:
(1)第一,怎样进行分层,或者说根据什么原则确定分层变量。(选择分层变量需要依据一定的总体特征、注意总体性质、尽可能选择与研究变量相关的分层变量)
(2)第二,怎样确定样本比例。(分层抽样采用等比例方式进行,即各层抽取元素的数量在样本中的比例,与该层在总体中的比例相等。当某些层的元素太少或太多时,也可采用不等比例方式)
(3)第三,确定实际分层抽取的方法。(两种方法:一是先将总体元素变量分层,并计算各层在总体中的比例。二是分层等距抽样,这种方法适用于等比例分层抽样)
59、前面介绍的三种概率抽样方法,在总体规模或范围很大的情况下,会遇到两个很难解决的问题。首先,在很多情况下,无法获得抽样框元素名单;其次,样本分布很散,实地调查的成本极其昂贵。这种情况下,就需要采用多段整群体抽样。
60、这里“多段”指的是按总体内的层级关系,把抽样分成几个阶段。
61、以群为抽样单元的抽样方法,就是整群体抽样。
62、整群抽样中的群可以是班级、学校、工厂、公司、街道、居委会、城市等,对群的抽样可采用简单随机、系统、或分层抽样方法进行。
63、多段整群虽然提高了抽样效率,省时、省钱的代价,但是也在一定程度上降低了抽样精度。多段整群抽样的误差会显著地高于一段概率抽样。
64、实际进行多段整群抽样,需要解决以下2个问题:
(1)首先,要决定是多抽群,还是多抽群中的元素。(经费允许时,尽可能多抽取一些群)
(2)其次,处理群大小不等的情况。
65、影响样本规模的因素:
如果不考虑经费问题,那么样本规模主要取决于抽样精度和总体标准差。
抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。
首先,抽样精度是指抽样中希望达到的精确度,就是能容忍的抽样误差。
其次,总体标准差是反映总体元素之间异质性程度的指标。
自考学历复习资料
科目名称:社会研究方法
科目代码:03350
社会研究方法这门科目是自考学历专科行政管理里面必考科目,学生复习可以借鉴以下复习资料:
第五章 抽样 (重点章 多次曾出应用题)
1、社会研究中的抽样方法,即选择研究对象的方法或程序。
2、抽样是一项有力的技术,除了社会研究外,它在市场调查、民间测验、生物和医疗实验、工业产品检测等领域,都有着广泛的应用。
3、抽样的理论基础是数理统计学。
4、在社会研究中,研究者从一个规模很大的研究对象中,选出一部分作为研究,这个选取过程就是抽样。
5、为什么进行抽样,主要是考虑研究成本和研究的可行性。
6、抽样的方法大体可分为两类:
(1)非概率抽样 (主要是依据研究的主观意愿、判断或是否方便等因素来选取对象)
(2)概率抽样 (主要是按照随机原则来选取对象,完全不带有研究者的主观因素)
7、非概率率抽样和概率抽样两种方法最大的差别是,在概率抽样中,能够比较精确地估算出抽样误差,而非概率抽样中,则无法估算抽样误差。(单选题)
8、如果用专业术语严格定义,则抽样是从总体中按一定方式选取一组元素的过程,由此产生的元素集合体称为样本。
9、在专业化表述中,每一个具体的调查对象被称为元素,全体研究对象被称为总体,样本则代表一组元素,即一部分研究对象。
10、总体还可以进一步划分为研究总体和目标总体。
l 研究总体是在理论上明确界定的元素的集合体。
l 目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中的一些特例后的总体。 样本只能推论目标总体,而非研究总体。
11、样本中元素个数与总体中元素个数的比率(样本规模与总体规模)称为抽样比率。
12、研究者在实际抽样(特别是概率抽样)时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。
13、抽样框中的总体元素又被称为抽样单元,有时抽样单元与分析单位是相同的。但在较大范围的抽样中,可能有多个层次的抽样单元(初级抽样单元、次级抽样单元、终级抽样单元)。在一次抽样中,抽样框的数目与抽样单元的层次是相对应的。
14、总体的情况或特征是未知的,由参数值来描述;而样本的情况或特征则是已知的,
由统计值来描述。
15、参数值与统计值之间的差异就是抽样误差。差异越大,抽样误差就越大;差异越小,抽样误差就越小。
16、抽样误差是衡量样本代表性大小的标准,它主要取决于总体的异质性程度和样本规模。(抽样中因违反抽样规则产生的人为误差如抄写、资料录入和计算中的人为失误,并不是这里所说的抽样误差)
17、抽样的步骤: (多选题或简答题)
(1)设计抽样方案; (2)抽取样本; (3)评估样本。
18、设计抽样方案包括以下4点内容:
(1)首先,要界定总体;
(2)其次,介绍抽样框的具体内容;
(3)再次,要确定样本所含个体数目;
(4)最后,要根据不同的目标总体,选择合适的抽样方法。
19、抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。
20、由于抽样方法不同,实际抽样工作既可以安排在实地调查前,也可以与实地调查同步进行。前者比较适合总体规模较小,事先有比较完整抽样框的情况;而后者则比较适合总体规模较大,抽样采取多阶段方式进行的情况。
21、评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。
22、评估样本的方法是先找出一些能够反映总体特征的资料,通常是一些数据,与同类指标的样本统计值进行比较;评估所依据的总体统计数据越多,评估效果越好。
23、非概率抽样: (多选题)
(1)方便抽样 (2)配额抽样 (3)判断抽样 (4)雪球抽样
24、进行概率抽样的前提条件是有抽样框,但这个条件有时无法满足,如电视台收视情况的调查,就很难编出合适的抽样框。在这种情况下,经常会采用非概率抽样。
25、非概率抽样的成本较低,操作也比较方便,但无法预先估计抽样误差,因此,很难对总体情况做出可靠的判断。
26、方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差,因此,在使用时要特别小心,总体的情况越复杂,方便抽样的效果就越差。
27、两个方便抽样例子:记者“街头拦人”调查、报纸问卷调查。
28、配额抽样首先要根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。
29、配额抽样的逻辑是通过样本配额,使样本结构尽可能与总体结构保持一致;配额矩
阵所依据的总体参数值越多,则样本元素的分类也越细,样本与总体的结构也越接近。
30、配额抽样中经常采用的参数值包括性别、年龄、教育程度、婚姻状况、收入和职业类别等。
31、判断抽样又称立意抽样,是指研究者根据其研究的目的或专家的判断来选取样本。在这种抽样中,样本是否能满足研究目的的要求,是否能正确反映总体情况,很大程度上依赖于研究者的主观判断,(对研究个人的研究素质要求较高)。
32、判断抽样经常被用于以下三种研究场景:
(1)首先,研究者用判断抽样来选择特别能提供信息的独特个案;
(2)其次,研究者用判断抽样来选取很难以接近的特殊人群;(如外来人员)
(3)最后,研究者用判断抽样来选取某种特殊个案类型,以便深入探究。
33、雪球抽样也称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。(旧人介绍新人)
34、雪球抽样是一种多阶段的技术。
35、雪球抽样特别适合用来对成员难以找到的总体进行抽样。(如吸毒者、流浪汉、散工)
第三节 概率抽样 (经常应用题、论述题)
36、抽样能让研究者依据少量元量素,来推断元素众多的总体。而概率抽样则是实现由样本推断总体的最佳方法,概率抽样是按照随机原则进行的抽样,因此又常被称为随机抽样。因为它是以随机原则为前提的,因此不仅能使研究者在选取要素时避免各种形式的系统误差,而且还能估计出抽样误差的大小。
37、概率抽样有若干种具体形式,社会研究中,要根据研究问题、总体性质和经费情况加以选择。
38、概率抽样:(1)简单随机抽样 (2)系统抽样 (3)分层抽样 (4)多段整群抽样
39、简单随机抽样也称纯随机抽样,指研究者严格按照随机原则来抽取样本。
40、“随机原则”是有特定含义的,它意味着在选取的过程中,一方面要使每一个对象被选中的概率都相等,即要满足等概率要求;另一方面每一上对象的抽取都是相互独立的,即要满足独立性要求。
41、概率抽样和等概率抽样在概念上并不相等。所谓概率抽样是指总体中每个元素都有一定的非零概率被抽中,每个元素被抽中的概率可以相等,也可以不相等,相等称为等概率抽样,不相等称为不等概率抽样。
42、随机抽样是一种等概率抽样。
43、进行简单随机抽样先要建立抽样框,然后再从抽样框中选取元素构成样本。
44、简单随机抽样这种抽样方法是最基本的,也是最容易了解的概率抽样方法,。
45、根据被抽中的元素是否放回总体,简单随机抽样又分为可放回和不放回两种。
研究者在实际抽样中大多采用不放回抽样。
46、当总体数目N不大时,可以用抽签法进行简单随机抽样。
47、如果总体数目N很大,可以用随机数法进行简单随机抽样。这种方法的关键是产生随机数。(产生随机数最常用的工具是随机数表)
48、用随机数表产生随机数,需要完成以下几个步骤:
(1)第一,确定选出随机数的位数。
(2)第二,决定从5位数组中选择哪几位数字。(关键是预先约定好规则,一直按此规则)
(3)第三,确定在表中选择数字的顺序。(关键选定一个顺序后,一直按此顺序)
(4)第四,确定开始选择的5位数组起点。
(5)第五,处理大于总体规模或重复的随机数。
49、系统抽样又称机械抽样。
50、系统抽样的样本元素是按某种确定的规则从总体中抽取的,由于等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。
51、由于抽样使用的是抽样间距,而不是随机数,故等距抽样是一种准随机抽样方法。
52、与简单随机抽样相同,等距抽样也需要先建立起抽样框,即给总体的每一个元素按顺序编上号码。但与简单随机抽样不同,等距抽样不用随机数,而是按一个固定的间距抽取人选。
53、等距抽样的步骤:
(1)首先,确定开始抽取人选的位置;(任何随机的起始点都可以)
(2)其次,计算抽样间距。(抽样间距k=N÷n)(样本占总体比例f=n÷N)
(3)最后,确定抽取元素的方法。
54、对于周期内性排列的总体,要么采用简单随机抽样,要么重新随机排列总体元素。
55、分层抽样是指研究者先把总体分为若干个同质的层(次级总体),然后用简单随机或系统抽样方法,从每层中抽取样本元素。
56、与简单随机或系统抽样相比,分层抽样能减少抽样误差,提高样本的代表性。
57、除了提高样本的代表性,采用分层抽样还有另一个理由。当研究者感兴趣的某个类别在总体中比例很小,简单随机或系统抽样很可能会漏掉该类别的元素时,研究者就会使用分层抽样。
58、实际进行分层抽样,需要解决以下几个问题:
(1)第一,怎样进行分层,或者说根据什么原则确定分层变量。(选择分层变量需要依据一定的总体特征、注意总体性质、尽可能选择与研究变量相关的分层变量)
(2)第二,怎样确定样本比例。(分层抽样采用等比例方式进行,即各层抽取元素的数量在样本中的比例,与该层在总体中的比例相等。当某些层的元素太少或太多时,也可采用不等比例方式)
(3)第三,确定实际分层抽取的方法。(两种方法:一是先将总体元素变量分层,并计算各层在总体中的比例。二是分层等距抽样,这种方法适用于等比例分层抽样)
59、前面介绍的三种概率抽样方法,在总体规模或范围很大的情况下,会遇到两个很难解决的问题。首先,在很多情况下,无法获得抽样框元素名单;其次,样本分布很散,实地调查的成本极其昂贵。这种情况下,就需要采用多段整群体抽样。
60、这里“多段”指的是按总体内的层级关系,把抽样分成几个阶段。
61、以群为抽样单元的抽样方法,就是整群体抽样。
62、整群抽样中的群可以是班级、学校、工厂、公司、街道、居委会、城市等,对群的抽样可采用简单随机、系统、或分层抽样方法进行。
63、多段整群虽然提高了抽样效率,省时、省钱的代价,但是也在一定程度上降低了抽样精度。多段整群抽样的误差会显著地高于一段概率抽样。
64、实际进行多段整群抽样,需要解决以下2个问题:
(1)首先,要决定是多抽群,还是多抽群中的元素。(经费允许时,尽可能多抽取一些群)
(2)其次,处理群大小不等的情况。
65、影响样本规模的因素:
如果不考虑经费问题,那么样本规模主要取决于抽样精度和总体标准差。
抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。
首先,抽样精度是指抽样中希望达到的精确度,就是能容忍的抽样误差。
其次,总体标准差是反映总体元素之间异质性程度的指标。