统计图表
统计图表(statistical tables and graphs),表达统计资料的图表。科学研究收集到的原始数据,经过整理和计算分析得出的结果,常常用统计表和统计图的形式来表达,其目的是便于阅读,便于分析比较,从而可以在较短的时间内掌握统计资料所反映现象或事物的规律性和关联性。因此,统计表与统计图是撰写科学论文、总结工作时的重要工具。
统计表
将统计资料整理分析后列成的表格。采用统计表可以避免冗长的文字叙述,而使人对事物或现象之间的数量关系一目了然。因此,统计表应是简单明了,层次清楚。一个统计表最好只有一个中心内容。繁复、使人费解的统计表起不到统计表的作用。
统计表的结构
包括以下几个方面。
①标题。是表的名称,扼要、确切地说明表的内容、地点和时间,写在表的上方中央。标题的文字不宜过于简略或过于繁琐。
②标目。表内项目的名称。一般分横标目和纵标目。横标目列在表的左侧,用来说明表中各横行数字的涵义;也称作统计表的主辞,一般是统计表所叙述的事物或现象;纵标目列在表的上端,用来说明各纵栏数字的涵义;也称统计表的宾辞,是主辞所叙述的指标。必要时,在横标目或纵标目上可标以总标目。标目文字要简明,有单位的应用括号注明单位或计算单位(如岁,1/10万,%,‰等)。一个表中不宜标目过多或层次过多。
③线条。表内线条不要过多。表的开端有顶线,底端有底线,纵标目下面和“合计”行上面应用横线隔开,其余的横线可以省略。不用左右两侧边线,其他纵线也可免去。表的左上角不宜用斜线。
④数字。表内数字必须准确,一律用阿拉伯数字表示,位次对齐,小数的位数取一致。整数部分位数多时应每隔三位用逗号分开,以便于阅读。表内不应有空格,数字暂缺或未记录时用“…”表示,无数字时用“ -”表示,数字为零时则写“0”。
⑤说明。一般不列入表内。特殊情况需用备注说明时可用“*”号标出,写在表的下面。
统计表的种类
分简单表和复合表两种:①简单表。只按一个标识分组的统计表,如表1。表中将病例数和发病率按病名分组。②复合表。表中数字按两个或两个以上标识结合起来分组,如表2。表中将学段和近视程度两个标识结合起来分组,从中可以分析不同学段学生的不同近视程度的检出率。
统计图
用点的位置、线条的长度、线段的升降、几何图形的面积等来代表数量或数量关系的一种形式。可使统计资料形象化、直观化。使之通俗易懂,便于比较和分析。因此统计图应用很广,但从统计图中不能获得确切的数字,所以它不能完全代替统计表,一般应将统计表同时列出。
统计图种类很多,各有其不同的适用条件和绘制要点,故制作统计图时应根据资料的性质和制作意图选用适当的类型。
统计图制作的基本要求是:①必须有标题,标题简明扼要地说明内容、时间和地点,列在图的下面或上面。②图的纵轴和横轴应有标目和尺度,并注明单位。纵轴尺度自下向上,横轴尺度自左向右,数量一律由小到大。③图中用不同线条或颜色代表不同事物时应有图例说明。④图的长与宽比例一般以7:5或5:7左右为宜。
常用的统计图及其绘制方法
主要有以下几种。
①条图。用等宽的直条的长度表示相互独立的指标的数值大小,比较直条的长短即可说明指标之间的数量关系。因此,条图适用于间断性资料。条图有单式和复式两种(图1。表3)。所列数字同图1。
条图的制作要点为:a.一般以横轴为基线,纵轴表示指标的数量,故纵轴应标明尺度和单位,尺度应为等距离尺度。也可以绘横式条图,即以纵轴为基线,直条呈水平位置,以横轴表示指标的数量,标以尺度。b.纵轴尺度必须从0开始,中间不宜折断,否则直条的长度不能正确反映指标数值的真实比例。c.各直条的宽度应相等;条间的间隙也应相等,条间间隙可与直条的宽度相等或为直条宽度的 1/2。d.直条的排列应按自然顺序或长短顺序排列。复式条图中有关的长条并列在一组,不留空隙,但各组内长条的排列顺序应一致,所用的不同线条或颜色应用图例说明。
②圆图。用以表示事物或现象中各组成部分的构成情况。以圆形面积作100%,将圆形按构成百分比划分成若干个扇形,各个扇形面积即代表各个构成部分所占的比重(图2)。
圆图的制作要点为:先绘一圆形,因圆周为360°,故每1%相当于3.6°圆周角,将每个构成百分比乘以3.6°,即为各构成部分的圆周角度数。一般从时钟12点的位置顺时针方向,用量角器按各构成部分的圆周角度数划分扇形,扇形位置的排列可按自然顺序或大小次序。图中各部分应注明简要文字及百分比,或用图例说明。若要比较两种或两种以上性质类似的资料,应画直径相等的圆,而且各圆中各部分的排列次序要一致,以利比较。
③百分条图。用途同圆图,以直条总长度作为100%,将直条长度按构成百分比划分段,各段长度即代表各个构成部分所占总数的比重。表4资料以百分条图表示时如图3。
百分条图的绘制原则基本上与圆图相同,所不同的只是以长条全长作为100%,百分条图制作简便,也便于比较。
④线图。用线条的升降表示某现象的数量随另一现象变动的趋势(图4)。适用于连续性资料。
线图的制作要点为:以纵轴表示某现象的指标,横轴表示另一现象的量(如时间、年龄等)。两轴尺度均应等距,即在算术坐标上作图。将成对数字先在坐标上点出,再用直线依次连接成折线。不能任意改成光滑的曲线。指标为组段的数字时,点子应点在组段的中点,如图 4中7~8岁组的点子点在7~8岁的中点处。同一图内不宜有太多的曲线,以免混乱不清。有两条及两条以上曲线时应用不同的线条(实线、断线、点线等)或颜色表示,并用图例说明。用不同纵横尺度比例绘出的图,给人的印象也不同,故在制图时要避免过分放大或缩小尺度,纵横轴长度的比例一般以5:7为宜。
⑤半对数线图。在半对数坐标纸上作的线图。用以表示某现象的数量随另一现象变动的速度。半对数坐标纸的纵轴为对数尺度,横轴为等距的算术尺度。因此,在半对数纸上表示的数量关系是对数关系。
表6是某地1951~1956年间历年的肺结核死亡率和白喉死亡率,根据这些数字分别在算术坐标纸和半对数坐标纸上作线图(图5,图6)。由于6年内肺结核死亡率的下降幅度比白喉大得多,故从图 7可见前者的曲线比后者陡得多。肺结核死亡率虽然下降幅度大,但其基数也大于白喉死亡率,故相对来说肺结核死亡率下降的速度不见得比白喉快。图7 不能说明下降速度何者为快,只表明两病死亡率6年内的变化趋势。图8则可以说明下降速度,图中白喉死亡率曲线比肺结核死亡率曲线陡得多。这表明白喉死亡率下降得比肺结核快。半对数线图中线的坡度说明增长(或下降)速度,这是与普通线图的不同点。
半对数线图的制作要点为:以纵轴(即对数尺度)表示变化着的某现象的指标,横轴表示该指标随之变化的另一现象的量(如时间、年龄等)。纵轴上的对数尺度按1~10的对数来划分,1~10,10~100,100~1000,…各称为一环,每一环内的尺度是一致的,都是按1~10的对数来分的,上一环与下一环相差10倍,故在 1~10的下面就有0.1~1,0.01~0.1,0.001~0.01,…,纵轴的起点应根据资料的情况定为0.1或1或10,…等,若起点为0.1,则第一环为0.1~1,第二环为1~10,第三环为10~ 100,…。
表6中最小数为1.0,最大数为164.4,故需用3环,即:1~10,10~100,100~1000。又若最小数为0.005,最大数为 5.3,则需用4环,即:0.001~0.01,0.01~0.1 ,0.1~1,1~10,起点应为0.001。这样,在对数尺度上增长速度相同时其距离的改变亦相同。纵轴没有0 点。若有已印好的半对数坐标纸,定好起点和需用的环后,即可直接将数字点在纸上。若无半对数坐标纸,可将数值换算成对数值,然后在算术格纸上画出。
⑥直方图。用以表示变量(连续性资料)的频数分布。以矩形的面积代表组段的频数,由于资料是连续性的,故各矩形间没有间隙,矩形的总面积代表总频数,面积的分布状态表明频数的分布情况。图7为表7中频数分布的直方图。
直方图的制作要点为:横轴表示变量,纵轴表示频数,表7中的频数即人数,纵轴尺度必须从0开始。各矩形间不留空隙,可划直线分隔,也可不隔。如果频数分布的组距相等,则可直接按纵轴的尺度画出各矩形的高度。若组距不等,要折合成等距,算出相当于等组距的频数,再作直方图。不能直接按纵轴的尺度画出组距不等的组的频数。
⑦统计地图。用以表示现象或事物在地理上的分布,如疾病、人口、医疗机构、学校的分布等。在有关的地图上在不同的位置上用不同的线条或颜色表示数量的大小,如某病患病率的各个水平、不同年龄的人口可用不同的线条或颜色表示(图8);也可用点的疏密表示数量大小,如医疗机构、学校的分布可用点表示,但应说明一个点代表的数量。