一、统计调查的意义 统计调查:按统计研究的任务和要 求,运用科学的调查方 法,有组织有计划地向 客观实际收集各种统计 资料的工作过程。 意义:是统计工作的基础环节, 是统计整理分析的必要前提。
※ 统计调查与一般社会调查研究的关系 联系 广义上讲,统计调查是一般社 会调查研究的一种形式 区别 统计调查着重收集数据资料 社会调查更侧重于了解情况 统计调查收集大量数据资料 社会调查通常收集个别资料
重点调查 在统计总体中选择一部分重点 单位进行调查,用以反映总体 基本情况的非全面调查。 重点单位: 单位数量在总体中只占一小 部分,但调查单位的标志值 在标志总量中占绝大部分。 特点: 着眼于标志值 → 能够反映总体基 本情况 只能反映基本情况 → 不能完整反映 总体总量,也 不能推断总体 数量。
建立以周期性普查为基础, 以经常性的抽样调查为主体, 以必要的统计报表、重点调 查、综合分析等为补充,搜 集、整理基本统计资料的统 计调查方法体系。
一、统计整理的意义 统计整理: 根据统计研究目的和任务, 对调查阶段收集到的大量 资料(原始或加工)进行 科学分类汇总,为统计分 析提供能描述现象总体数 量特征资料的工作过程。 意义: 中间环节起承前启后的作用 统计调查的继续 统计分析的前提
五、统计调查方法(组织方式) 统计报表 以基层企事业单位原始记录 为基础,按国家统一规定表 式要求、指标解释、报送时 间、报送程序,自下而上收 集统计资料的调查方式。 特点: 统一性 → 报表内容、报送时间、 指标涵义、计算方法、 口径统一 可靠性 → 依据基层原始记录
种类: 按调查范围不同 全面统计报表 非全面统计报表 日报 旬报 简明及时 月报 按报送周期长短不同 季报 半年报 系统详尽 年报 优点:全面、统一、连续 局限:缺乏灵活性、时效性较差、虚报 瞒报现象
二、统计调查的基本要求 准确性: 客观反映真实情况,不能虚报 瞒报、伪造篡改。 及时性: 规定时间内及时完成及时上报, 否则时过境迁,起不到作用。 完整性: 全面系统反映全貌全过程。 操作性: 避繁就简,设计方便,操作简 捷,通俗易懂。 经济性: 节省投入,注重效益。
三、统计调查的种类 1、按调查对象包括的范围不同 全面调查: 调查所有总体单位。 包括全面填报的统计报表和 普查 非全面调查: 只调查部分总体单位。 包括重点调查、典型调查、 抽样调查和非全面填报的 统计报表
★ 统计表编制规则 1、标题应简明确切,总标题应注明具 体时间空间; 2、必须注明计量单位,全表只有一种 计量单位时在表的右上方;需分别注明 计量单位时,横行的专设“计量单位” 一栏,纵栏的与纵栏标题在一起; 3、数字为0或忽略不计的要以“0”表 示;无数字的要以“—”表示;缺乏资 料的以“…”表示; 4、表式一般是开口式
★ 方法: 简单分组 按一个标志分组。 如:工业企业按经济类型分组可分为 国有、集体、私营、其他企业。 复合分组 按两个或以上标志多层次分组。 如:按经济类型分: 按规模分: 大型企业 中型企业 国有企业 小型企业 大型企业 集体企业 中型企业 ……………… 小型企业
四、统计整理结果的表现形式(1234) 分布数列 将总体各单位按一定标志分成 若干组,列出各组总体单位数 (次数/频数)或各组总体单 位数在总体中所占的比重(频 率),排列而成的数列称为分 布数列(分配数列、次数分布、 频数分布)。 意义 反映总体单位在各组间分布状况。 表明总体内部构成、平均水平及变 异程度。
★ 分类 品质分布数列(表1) 按标志性质分类: 变量分布数列(表2) 表1 某市2000年工业企业构成表
二、统计整理的基本步骤 制定统计整理方案 对调查资料进行审核订正 数 据 处 理
三、统计整理的基本方法—统计分组 统计分组:根据统计研究需要,将所 有总体单位按一定统计标 志分为若干个性质不同但 有联系的部分。 ★ 特点:相对总体是“分”组间差异 → 相对个体是“合”组内同质 → ★ 作用: 划分社会经济现象类型 反映社会经济现象内部结构和比例关系 揭示社会经济现象间相互依存关系
★ 统计表的结构 总标题 纵 栏 标 题 数 字 资 料 表10 1997年我国三大产业总产值
3、按调查的组织方式不同 统计报表调查: 按国家统一规定的表 式要求,自下而上提 供统计资料。 专门调查:为研究某种问题专门组织 的调查。 包括普查、重点调查、典 型调查、抽样调查 直接观察法 报告法 4、按收集资料方法不同 采访法 问卷调查法
四、统计调查方案的设计 确定调查目的和任务 确定调查对象和调查单位 拟订调查项目 确定调查时间、期限、地点Fra Baidu bibliotek方法 制定统计调查组织实施计划
统计表 将统计调查得来的数据资料经 过整理汇总,按一定结构顺序 系统排列在一定表格内,此表 格即统计表。 (原始数据) 分类:按用途不同 调查表 整理表 (分布数列) 分析表 (指标分析) 按分组情况 简单表(表6、7) 简单分组表(表8) 复合分组表(表9)
典型调查 在对统计总体有一定了解的基 础上,有意识地选择少数典型 单位进行的详细调查,目的是 认识事物本质规律。 典型单位: 同类现象本质特征表现最充分、 最具代表性的单位。 特点:代表性 → 可用于对总体的推断 不严格的推断 → 不能指出推断的 把握程度数据统计,无法计算和控制 推断误差,只能作发展趋势 和规律性的推断
五、统计误差 统计误差: 统计数据与客观事物实际数 ★ 分类: 值之间的差距。 登记性误差 按误差来源 代表性误差 偶然性误差 按误差性质 系统性误差 无意误差 按产生原因 有意误差 统计误差大部分由主观因素造成,可 通过主观努力控制并消除;抽样误差是 代表性误差中的偶然误差或称随机误差, 不能消除,但可事先计算并控制。
★ 原则: 科学性原则: 从研究目的出发,正确选择 最能说明现象本质特征的分 组标志,正确划定分组界限, 保证组间差异、组内同质。 完备性原则: 任何一个总体单位或原始数 据都能归属于某一个组,而 不会遗漏在外。 互斥性原则: 任何一个总体单位或原始数 据在一种统计分组中只能归 属于某一个组,而不能归属 于两个或两个以上的组。
抽样调查 以概率论与数理统计为理论 基础,在统计总体中按随机 原则抽取一部分单位进行调 查,并据以推断总体数量特 征的非全面调查。 特点:随机原则 → 受干扰的可能性小 可推断总体 → 节省人、物、财 力和时间 可计算并控制抽样误差→较准确 抽样误差:由随机性产生的样本指标与 总体指标间的代表性误差
闭口数列 首末两组上下限齐全的数列 开口数列 首组缺下限或末组缺上限 开口组 上限或下限不齐的组 开口组组距 以相邻组距近似代替 开口组组中值 上限-邻组组距/2(缺下限) 下限邻组组距/2(缺上限)
★ 组距数列的编制 1、按数值大小顺序排列 2、确定组数、组限和组距 组数不宜过多也不宜过少 组限和组距确定要体现组与组间质的 区别,要体现组内同质组间差异 3、离散型变量,邻组上下限可重叠也可 不重叠 连续型变量,邻组上下限必须重叠 组限重叠时,按“上组限不在内”原 则达到上限值的单位数计入下一组 4、可等距、可异距
普查 一次性全面调查 特点:一次性 → 用于调查时点现象 全面性 → 范围广、单位多 周期长 → 面广工作量大,不可能 也没必要经常进行,应 尽可能进行必要的周期 性普查 种类:按汇总资料特点不同 一般普查: 任务布置到基层 快速普查: 越过中间环节集中汇总
普查工作组织原则: (1)统一普查内容:统一规定指标口 径和计算方法。 (2)统一普查时点:避免资料的重复 或遗漏。 3 (3)统一普查期限:普查范围内各调 查点应尽可能同时进行、按期完成。 (4)统一间隔时间:同类普查应按一 定周期进行,便于数据动态对比。 如:我国人口、第三产业、工业、 农业普查每十年一次,分别在逢0、3、 5、7的年份进行。
组距数列按各组 组据是否相等: 等距数列(表4) 异距数列(表3) 表4 某班第二学期《统计学》成绩表
★ 组距数列基本概念 组限 各组两端变量值 上限 各组最大值 下限 各组最小值 组距 各组上下限之差 全距 数列中最大变量值与最小变量值 之差 组中值 各组上下限和的一半
变量分布数列按各组变 单项数列(表2) 量值多少及取值范围: 组距数列(表3) 表3 某县2001年家庭平均收入表
2、按调查登记的时间是否连续 连续调查: 又称经常性调查,调查总 体现象在一段时期内的数 量变化累计结果,用于调 查时期现象。 不连续调查: 又称一次性调查,调查 总体现象在某一时点的 状态,用于调查时点现 象。 时期现象:现象量变过程与时期长短 直接相关,可累计相加。 时点现象:现象量变过程与时期长短 不相关,不可累计相加。
累计分布数列 各组频数或频率逐组累 计相加,表明总体在某 一标志值的水平上总共 包含的频数或频率。 如:表4中,成绩不到80分的有多少? 80分以上的有多少? 向上累计 变量值小的组向变量值大的 组逐组累计,表明各组上限 以下总共包含的频数或频率 向下累计 变量值大的组向变量值小的 组逐组累计,表明各组下限 以上总共包含的频数或频率
统计图 用统计图形表示分布数列。 分类: 直方图: 横轴为组限, 纵轴为频数 折线图: 直方图各长方形顶端中点 连线 向上累计从首组下限起,各 按形状 组累计频数落在各组上限 向下累计从末组上限起,各 组累计频数落在各组下限 钟型分布 曲线图: 极限描绘曲线 U 型分布 J 型分布