欢迎访问发表云网!为您提供杂志订阅、期刊咨询服务!

统计学的标准差大全11篇

时间:2023-07-18 16:40:00

绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇统计学的标准差范文,希望它们能为您的写作提供参考和启发。

统计学的标准差

篇(1)

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。由于统计学不仅运用了数学知识而且也涉及到许多其他专业的只是,因此统计学被应用到了许多学科的各个领域。随着统计学的发展,统计学作为一种有力的分析工具逐渐被应用于各个领域,财务管理在公司运行中一直承担着重要的角色,而且财务管理涉及到许多数据,作为分析数据的工具,统计学必然要运用于财务管理。

一、统计学在财务管理学习中的应用

(一)利用概率分布图进行数据分析

在财务管理中分析数据时有时需要做概率分布图,如通过收益率概率分布图可以得到各种可能结果的收益率,进而进行更好的财务决策,风险相同的情况下选择收益较高的方案。概率分布图越集中、越尖,那么预期值与实际结果接近的可能性越大,背离预期收益的可能性越小。由此,概率分布越集中,股票对应的风险越小。

(二)预测企业的收益率

通过企业以往的相关数据,建立模型,可以预测企业未来的收益率,因此便可以帮助企业更好地投资或者选择经营方案。

(三)通过计算标准差和变异系数来判断

数据的精确度利用标准差这一度量概率分布密度的指标来准确度量数据的精确性,标准差反映的是样本内的个体的离散程度,通常作为判断分布程度的指标,标准差是方差的平方根,在企业进行投资的过程中,需要根据标准差的大小来判断收益的稳定性,一般情况下,标准差越大,代表企业的回报稳定性越差,投资该项目的风险越高,相反,标准差数值越小,表明企业投资该项目的回报稳定性越好,投资该项目的风险越低。同样标准差也可以用于企业资本结构分析,基金股票分析等。然而,有时候进行比较的两组数据的参考标准相差过大或者测量尺度相差太大,此时运用标准差进行比较便没有太大意义,误差会很大,因此需要用变异系数,所谓变异系数是指用原始数据的标准差除以原始数据的平均数,得到的数值,用变异系数进行比较可以排除标准或者参考性不一致的特点,反映数据离散程度的绝对值,其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。变异系数可以同时反映收益和风险,因此,故在处理两个或多个具有显著不同预期收益的投资项目时,他是一个更好的风险度量指数。

(四)在财务能力分析中的应用

1.偿债能力分析

企业偿债能力就是指企业偿还账务的能力,企业偿还债务能力的高低直接可以体现企业的财务风险的大小。按债务偿还期限的长短,又将其分为短期偿债能力与长期偿债能力。短期偿债能力通常设置以下指标:流动比率;速动或酸性测验比率;现金比率。长期偿债能力指标有:已获利息倍数;资产负债率;产权比率;有形净值债务率。

2.盈利能力分析

盈利能力分析是指企业获取营利或者利润的能力,以及对经营成果分配的能力,企业盈利能力的高低直接体现了企业的财务结构和经营成果,盈利能力好的企业具有更优良的财务结构和经营能力。企业盈利能力高意味着企业的经营与规模就会有更好的发展。一般企业盈利能力指标有:销售利润率;成本费用利润率;资产总额利润率;资本金利润率;权益利润率。股票上市公司除上述指标外,还可借助以下指标:每股盈余;每股股利;市盈率;股东权益报酬率;股利支付率;留存盈利比率。

3.资产运用效率分析

资产运用效率是指企业对自身资产的运用能力,良好的资产运用效率可以使企业的现金流和长期资本得到良好的循环和回报,资产运用效率体现的是企业的利润获取能力,资产运用效率越高表明企业的资产周转速度和质量越高,获取利润的能力越大,反之,企业的利润也就越低。资产运用效率指标有:存货周转率;应收帐款周转率;流动资产周转率;固定资产周转率;总资产周转率。

4.综合财务能力分析

综合财务能力分析是结合企业各项财务状况和经营成果的总体的变化趋势进行综合分析,得出企业整体的财务状况,上述的三个指标只是从某一方面来判断企业的财务状况而综合财务分析是进行的整体的全面的系统的分析,具有更高的参考价值。综合财务能力分析的指标有杜邦模型中的权益报酬率和计分综合分析法的实际得分。以上企业财务能力分析指标的计算和分析都离不开统计学的相关知识和工具。

二、在财务管理学习中如何更好地学习统计学

(一)重视统计学的学习

由于财务管理专业的学生对于统计学的认识程度不够,无法深刻认识到统计学在财务管理学习中的重要性以及掌握好统计学的方法论对于财务管理数据处理的便利性,大家只是普遍认为统计学是统计学专业应该掌握的知识,因此大家往往不会认真去学习统计学,而且财经类学院开设的统计学课程往往只是把统计学比较简单的只是或者与财务管理比较相关的知识介绍给大家,往往学习程度太浅。因此,为了提高学生的统计学知识,更好地学习财务管理,必须强调统计学专业的重要性,把统计学重视起来,才能更好地在财务管理学习中运用好统计学,在企业财务分析中,运用好各种指标。

(二)将统计学与财务管理更好地融合起来

长期以来,财经类开设的统计学课程主要是介绍统计学的基本原理和基本方法,以,统计整理,统计调查,统计指教,综合指标,时间序列,抽样推断,相关分析等社会经济统计学内容为主,与财经类学科的专业知识联系不够,而且大多数情况下,只是选择性地讲解一部分知识,原理性的内容有时候并不会去介绍或者学习。如此以来,便不能把统计学只是学好,只是学个皮毛。统计学只是介绍一种方法,如何将这种方法运用到财务管理中,需要将统计学的方法论与具体的实例或者案例相结合,如此以来便能更好地理解统计学与财务管理的内容,既能学会处理数据的方法,又能更好地理解财务状况。如用资产负债表和利润表中的数据项目等各种指标来学习了解综合指标;销售预测和资金需求量的预测可以作为介绍学习动态数列的趋势预测法的案例;结合投资决策的实例来学习了解标志变异指标。结合财务管理专业的背景,通过分析和解决财务问题的实例,既能加深对财务管理理论知识的理解,又能提高利用统计学只是进行财务问题分析的实际操作能力。

【参考文献】

[1]蒋惠凤.财务管理专业统计学教学模式研究[J].新课程(教育学术),2011,07:175-176.

[2]秦红霞.统计学对财务管理学习的影响[J].统计与管理,2014,07:8-9.

篇(2)

0 引言

高等学校英语应用能力考试是高职高专公共英语唯一的全国性考试,其前身是普通高等专科英语考试,是国家为检测和提高普通高等专科英语课程教学质量而建立的,1997年开始试运行,1998年正式投入使用,距今已有16年。高等学校英语应用能力考试现已被高职院校普遍采用作为评价师生教学效果的手段。考试的结果通常以考试成绩暨分数体现。在高职公共英语课程教学研究中,对考试成绩进行统计分析已有涉及,但更多的也只涉及到某一方面,如求出平均分。这些分析不能准确全面的反映学生的考试情况,也就不能公正对师生的教学效果进行评价,这就需要我们对考试成绩科学的统计分析。本文将使用统计学中的集中量数、差异量数及标准分对我校学生高等学校英语应用能力考试测试成绩进行统计分析,以期通过学生的测试成绩来全面科学的了解测试结果,给教师的教学效果和学生的学习效果做出公正的评价。

1 集中量数

集中量数是代表一组数据典型水平或集中趋势的量(王孝玲,2001)。它主要有两个作用:第一,它是一组数据的代表值,用来表示这组数据的典型情况。第二,组间的集中量数是可以比较的,通过比较可以判断组间数据的差别。集中量数主要三种形式,它们分别是平均数、中数和众数。平均数是教师对考试成绩普遍采用的一种统计分析方法。平均数最严密也最易于理解,因此应用也最广。但平均数存在着很多的不足,比如:平均数的典型性容易受极端数据的影响。如果一个班的分数之间差距很大,有的分数很高有的分数很低,这种情况下算出的平均数就不具有典型性。基于此,我们需要采用其它的统计方法,这就是中数和众数。中数又名中位数,是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。众数是一组数据中出现次数最多的数。通过平均数、中数和众数的三者结合,可以为我们的考试成绩提供更全面的信息。

表1

从表1我们可以看出供电1和供电2两个班的高等学校英语应用能力考试成绩平均分都是73。如果仅从平均分这个角度来比较两个班的考试成绩,我们就会得出两个班的考试成绩的集中趋势的量是一样的。但我们通过统计分析发现供电1和供电2考试成绩的中数和众数是不一样的。之前我们讲了,平均数是容易受极端数据的影响,但是中数是不会受到极端数据的影响。从表1我们可以看出供电1有两位学生的考试成绩低于45,属于极端数据,所以此组的集中趋势的量应该用中数来表示即76,供电2组的集中趋势的量可以用平均数来表示即73。

相对而言,平均数、中数和众数是三个较为常见的集中量数,都能在一定程度上反映数据的集中趋势,所以具有内在的关联性。当平均数、中数和众数三者相等时,这组数据即成正态分布,数据的次数分布图就会完全对称,三个数数轴上重合为一点。当平均数、中数和众数三者不相等时,具体地说,当平均数>中数>众数,叫作正偏态。当考试成绩出现正偏态时,说明试题太难。当平均数

2 差异量数

描述一组数据的特征仅用集中量数是不够的。我们在研究一组数据的特征时,不但要了解其典型的情况,而且还要了解特殊情况(韩宝成,2000)。例如在比较同一个年级的几个教学班高等学校英语应用能力考试成绩时,只比较集中量数是不够的,还要对它们的分散程度进行比较。在统计学中,我们用差异量数来描述数据分散程度。常用的差异量数包括标准差和全距。标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的分散程度。标准差的公式如下:

σ=■

表2

从表2中我们可以看出这10个班的高等学校英语应用能力考试成绩平均分比较接近。特别是应电1和供电2,应电2和计算1。它们的平均分依次差0.01、0.18。从平分来看应电1和供电2不分伯仲,应电2要比计算1要稍微好点。但从标准差来看供电2的分散程度要比应电1的小,说明供电2的考试成绩相对集中,故供电2的成绩要比应电1的成绩好。从全距来看,应电1的全距是49,而供电2的全距是36,这也说明供电2的考试成绩相对集中。应电2和计算1的情况也类似。

平均数在一组数据中典型性程度高低也取决于这组数据的标准差和全距,如果标准差和全距小,说平均数的典型性程度高,反之则小。

3 标准分

考生在考试后,按照评分标准对其作答反应直接评出来的分数,叫原始分。原始分反映 了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异 状况,不能刻划出考生相互比较后所处的地位。标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。标准分是以标准差为单位来表示某一分数与平均数的差。标准分的公式是Z=(X-X_bar)/S,式中X为原始分数,X_bar为原始分的平均数,S为原始分的标准差。

表3

将原始分转换成标准分之后,我们就可以很直观的看出某个学生的考试成绩在整个班级中所处的位置。

把原始分转换成标准分之后,标准分成了一个抽象的数据,不受原测量单位的影响(李跃平,2003)。这样我们就可以将某个学生在不同时间参加的考试进比较,不同科目之间的成绩也可以用来进行比较,这是原始分所不能的。

4 结束语

通过把学生的高等学校英语应用能力考试成绩进行统计分析,算出反映数据集中趋势的集中量数、反映数据分散程度的差异量数以及标准分,才能是考试成绩客观全面的反映师生的教学情况,帮助师生改进教学,实现既定教学目标。

【参考文献】

篇(3)

一、应收账款周转率指标的含义及其计算方法

应收账款是指企业销售产品、商品、提供劳务等原因,应该向购买客户收取的款项和代垫的运杂费,它是企业营运资金的重要组成部分。《企业效绩评价操作细则》规定了企业效绩评价指标由基本指标、修正指标和评议指标三个层次共32项指标构成。应收账款周转率指标是属于修正指标中的第五项指标,该指标反映了一个会计年度内应收账款转换为现金的次数,它说明了应收账款流动的速度,也叫应收账款回收期或平均收现期。计算公式为:

赊销收入净额数据来自于损益表,赊销收入净额=销售收入―现销收入―销售退回、折扣与折让;“平均应收账款余额”数据来自于资产负债表,平均应收账款余额=(“期初应收账款余额 ”+“期末应收账款余额”)/2。

一般说来,企业的该项比率越高,说明企业催收账款的速度越快,坏账损失越少,资产流动性和企业的短期偿债能力也会增强;若企业应收账款周转率过低,则说明企业催收账款的效率太低或信用政策过于宽松,会影响企业资金利用率和资金的正常周转。

二、应收账款周转率指标存在的问题及改进

1.对分子的改进

应收账款周转率反映的是本年度应收账款转为现金的次数,那么上述公式中的分子应该是本年应收账款不断收回现金所形成的周转额,而把主营业务收入净额作为分子有失偏颇。因为主营业务收入净额既包括赊销额也包括现销额,把整个主营业务收入净额(不管是现销、赊销)列为分子就暗含一种前提假设,即本年(本期)的销售,无论哪家企业、无论销售何时发生,本年(本期)都必须全部收回现金,只有这样应收账款周转率才能反映本年度或一定时期应收账款转为现金的次数。但关键是主营业务收入净额(即便全是赊销)也仅仅是一年(一定时期)的经营成果,而一般很难在同一年(同一时期)全部收回现金。这种前提假设与实际不相符,因此,主营业务收入净额绝不是应收账款收回现金的周转额,其不能作为应收账款周转率的分子。

根据应收账款的周转过程,赊销形成应收账款(记“应收账款”科目借方),收回现金形成应收账款周转额又使应收账款减少(记“应收账款”科目贷方),那么应收账款累计贷方发生额可以说是非常准确的应收账款周转额了,所以应收账款周转率的分子应为年度(一定时期)应收账款累计贷方发生额。考虑到取数的方便,可作相应的变通处理。由“期初余额+本期借方发生额-本期贷方发生额=期末余额”等式可推出:应收账款回收额=本期贷方发生额=期初余额+本期借方发生额-期末余额公式(1)。

2.对分母的改进

应收账款周转率指标的分母即应收账款净额来自于资产负债表,是一个静态的时点存量,容易受偶然性、季节性等外部因素和人为的内部因素影响,甚至可能发生巨大的期间波动。因此,使用该指标进行业绩评价时,为了减少这些因素的影响,最好使用多个时点的平均数,而不采用年初和年末的应收账款余额。具体方法如下:

根据统计学原理,按月根据时点数列序时平均数法计算年应收账款年平均余额,以减弱会计报告期异常波动的影响,根据应收账款总账所提供的年初及每月末余额,那么:

加权年平均应收账款余额=(X0+X1+X2....+X11+X12)/12公式(2)。其中X0,X1……X11,X12代表年初和1月……11月、12月的期末余额。

因此,改进后的周转率公式如下:

三、应收账款周转率指标风险比较

计算出应收账款周转率指标后,为了使财务报表的外部使用人可以将计算出的指标与其他类似企业的指标相比较,以此判断该指标的高低并判断本企业的应收账款的周转处于怎样的一个水平和代表怎样的风险。因此,笔者试图以全国医药行业总体和同是医药行业的丰原药业(股票代码:000153)1999年~2006年第一季度的应收账款周转率为例子,使用统计学中的离散程度来分析改进后的应收账款周转率,以此可以对企业应收账款周转率进行比较、判断,达到改进企业的信用政策的目的。

以下是1999年~2006年全国医药行业总体应收账款周转率分布图。

丰原药业(000153)公司各年应收账款周转率

根据统计学中的预期值和样本标准差的公式,其中样本数量均为8个(1999年~2006年1Q)分别求出全国医药行业总体和丰原药业的应收账款周转率的预期值E,标准差σ和变化系数q,以此来对丰原公司的该指标所代表的风险进行研究和判断。

A、B、C公司的标准差与变化系数

1.预期值

2.标准差

3.变化系数

从上可以得出,全国医药行业总体的应收账款周转率为4.1825次,比丰原药业高出1.9572个点, 但同时该指标代表的风险即标准差1.278257,也是较大的,高出丰原药业0.582764个点。 全国医药行业总体是属于“收益大,风险也大”的,对于报表使用者来说,应该怎样解读这个指标呢?为了解决这个问题,引入了变化系数的概念,它是从相对角度观察的差异和离散程度,在比较相关事物的差异程度时较之直接比较标准差要好些。该指标是个正指标,指标越小,在其他条件相同的情况下,是可以代表该指标的相对风险较小,如上例中的全国医药行业总体的绝对风险比较丰原药业大(标准差大了0.582764),但相对风险却较小(变化系数小了0.69%)。这样的比较,不管是对全国医药行业总体,还是丰原药业来说,对于应收账款这个指标,都可以做到心中有数,达到管理的要求。

四、结论和展望

众所周知,应收账款是营运资金的重要组成部分,它的大小直接影响企业资金的周转。改进后的应收账款周转率指标能够更好地反映企业从取得应收账款权利,到转化为现金所需要的时间,提高了应收账款指标的可信度。尤其是利用统计学的样本标准差和标准差系数,排除了绝对额因素影响,使得该指标不但可以较准确地反映应收账款的周转情况,还可以在一定范围进行定量比较,使得企业能够找出差距,改进管理,提高企业的资金周转水平。

参考文献:

[1]黄慧馨徐惠玲:《对“应收账款周转率”指标的分析及相关政策建议》,《财会通讯》[J].2004(1)

[2]荆波:《小议应收账款周转率》,《工业会计》,2003(3)

[3]《财务成本管理》,2007年度注册会计师全国统一考试辅导教材,经济科学出版社

篇(4)

(二)科学设置教学内容统计的目的是认识社会经济现象总体的数量方面,从中发现带有规律性的东西。为了达到这个目的,统计需要做一系列的工作。统计课的教学内容就是按照统计工作过程的每个阶段来安排的:统计设计、统计调查、统计整理、统计描述、统计推断、统计分析和数据积累。其中,统计设计和统计数据积累理论性较强,原则上让学生知道“是什么”、“怎么做”就行了。而对于统计调查、统计整理这两部分,内容虽然多,但容易理解,可以简单讲解,让学生多看,借此培养学生的自我学习能力。统计描述、统计推断、分析这几部分内容,要在学生对统计基本概念准确理解的基础上进行系统讲解。搜集统计数据的过程又称为统计调查,就是围绕统计指标及其体系搜集统计数据,特别是原始数据。主要方法包括直接观察法、报告法、采访法、邮寄法和实验设计调查法。统计整理,即对调查资料进行加工汇总。统计调查所获得的资料往往是分散的、不系统的原始资料,这就要求我们必须对统计调查所获得的资料进行科学的整理,并通过合适的形式把这些整理结果表述出来。具体来说,统计整理是根据统计研究的目的和要求,对统计调查所得到的原始资料进行科学分类、汇总,或对已初步加工的资料进行再加工,使之系统化、条理化,成为能够反映现象总体特征的综合资料的工作过程。统计整理主要讲方法,包括分组、汇总和编制统计表和绘制统计图。统计课的主要内容包括:统计描述(综合指标)、抽样推断、统计指数、时间数列(动态分析)和相关与回归分析。这也是重点和难点。

(三)注重学科知识的系统性统计各章节内容的安排是有逻辑性的,前面内容往往是后面内容的基础。学习过程环环相扣,不能跳越某一章节而直接进入后面的章节。总论部分是对统计课程教学内容的概括描述,通过学习,使学生了解统计学的基本框架体系,把握统计学的涵义、研究对象、研究方法及统计活动的过程,尤其要准确理解统计学的基本范畴(基本概念)。统计学基本范畴包括:总体、总体单位、标志、统计指标以及延伸出的小概念。如果把统计课的学习比喻为盖高楼大厦,那么这些基本范畴就是地基或基石。深刻理解领会这些基本概念的含义,准确把握基本概念之间的区别与联系,并能正确运用,就为这座高楼大厦夯实了地基、稳固了基石。教师讲解这些概念时,可结合生活中学生熟悉的例子深入浅出地讲解,课下布置练习进行巩固。

二、统计课重点、难点内容解析

(一)统计学的基本概念最基本的概念包括:总体、总体单位、标志、统计指标。如上所述,这是学好统计课的基础。例如,“总体”这个概念。毫不夸张地说,统计所有章节的内容都是围绕“总体”展开的。统计学的研究对象是大量的客观现象,特别是社会经济现象的数量方面,包括数量特征、数量关系和数量界限,目的是认识社会经济现象发展变化的规律性。而社会经济现象包罗万象,种类繁杂,包括社会的政治、经济、文化、人民生活等领域的各种现象。统计研究时需要分门别类,把他们界定为一个个客观存在的、具有某种共同性质的许多个别现象或事物组成的集合体,即统计总体。个别现象或事物就是总体单位。总体具有大量性、同质性、差异性三大特征。大量性即总体是由许多单位组成的,一个或少数单位不能形成总体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以,统计研究的对象必须包括足够多的个体。同质性即构成总体的各单位必须具有某种共同性质,这是形成总体的客观依据,也是我们确定总体范围的标准。差异性即总体的各单位除了某些方面的共同性外,在其他方面必须有差异,这些差异是统计研究的基础和前提。如果学生不理解“总体”这个概念,就不能在特定的统计研究目的下,准确地界定总体的范围,描述总体的总量指标、相对指标、平均指标就无从理解和计算,更谈不上利用这些指标进行统计推断和统计分析。

篇(5)

将2012年8月至2013年8月在我院接受治疗的39例患者作为研究对象,所有患者均自愿参加本次实验。患者中男19例,女20例。年龄41~81岁,平均年龄(53.26±3.28)岁。首次接受根治性放疗的患者39例,患者的病灶部位有胸下段、胸中段以及胸上段三处。其中病灶位于胸下段的患者有5例,病灶位于胸中段的患者有13例,病灶位于胸上段的患者有21例。

1.2摆位误差测量方法

建立坐标系,规定x轴为患者的左、右方向,y轴为患者的胸、背方向,z轴为患者头、脚方向,其中患者的右方向、头方向以及后方向为坐标系的正方向。以顺时针沿x轴以及z轴旋转的方向为正方向,逆时针方向为负方向,利用图像引导、以CT模拟定位图像作为参考图像,以颈椎和胸椎的椎体作为参考标志,将CBCT扫描重建后的图像与CT模拟定位的图像,在图像引导下在线进行自动配准和人工配准,获得误差数值。

1.3设备

23EX直线加速器(瓦里安公司),机载图像引导系统,机载锥形束CT,热塑面膜(戈瑞公司)。

1.4数据处理

计量资料使用均数±标准差(x-±s)表示,使用t检验计量资料,采用SPSS16.0统计学软件对个体随机误差、个体系统误差进行正态性检验。利用配对t检验比较相关指标的差异,P<0.05,数据间差异具有统计学意义。

2结果

2.1摆位误差

在放疗时,对所有患者均采用热塑面膜进行固定,重复模拟定位,利用三维激光灯,按物理计划要求摆位后,对患者进行CBCT扫描,每个患者每周1次CBCT扫描,各扫描5次,共计195次。所有患者的随机误差以及个体系统误差均服从正态分布。

2.2CTV和PTV之间的间隙值

所有患者在x轴、y轴以及z轴上平移的个体系统误差的标准差分别是3.01、3.51、1.86mm;在x、y以及z轴上个体随机误差的标准差为1.61、2.11、1.16mm。根据公式(Mptv=2.5×系统误差的标准差+0.7×随机误差的标准差),计算CTV和PTV之间的间隙值。其中x轴、y轴以及z轴上CTV和PTV之间的间隙值分别是8.65、10.25、5.46mm。

篇(6)

t检验分为单总体检验和双总体检验。

单总体 检验是检验一个样本平均数与一已知的总体平均数的差异是否显著。

双总体 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。

适用条件:

1、已知一个总体均数。

篇(7)

呼叫中心为服务客户而生,服务质量是呼叫中心的生存之本。因此,几乎每个呼叫中心都对质量监控非常重视,对质检投入相当的人力和物力。然而,面对庞大的录音样本,质检人员显然不可能听完所有的录音。而且,随着呼叫中心规模的不断扩大,任何一个呼叫中心都不可能不计成本的对质量监控进行无限投入,怎样的质检指标才能对服务质量做出科学的衡量,如何才能通过少量样本对服务质量做出评估,是所有大中型呼叫中心质量监控人员需要思考的问题。本文依托统计学原理对上述问题进行分析。

1 呼叫中心质量监控的主要问题

1.1 平均值的不足

有相当一部分呼叫中心是以监控样本的平均值来衡量坐席的业务水平的。然而仅凭“平均值”事实上是无法对坐席人员的真实水平做出准确评估的。平均值所解决的是准确度问题,但却没有解决精密度问题。不论工业生产,还是电话服务,首要的目标都是生产合格的产品,只有准确度和精密度双高才是真正的高品质。

打个比方,A和B两名员工生产同一产品,该产品的耐磨度不能低于2.5,否则为不合格品,同时耐磨度越高越好。A和B各生产了5件,A(2.4、2.3、2.7、2.8、2.8)、B(2.5、2.6、2.6、2.6、2.5),A的平均值为2.60,B的平均值为2.56。可见,虽然A的平均值要高于B,但A有2件不合格品,B却是全部合格,哪个水平更高呢?从质量管理的角度看,当然是B。

我们再继续刚才的例子,如果A(2.4、2.4、2.5、2.6、2.6)、B(2.5、2.6、2.6、2.6、2.5),A的平均值为2.50,B的平均值为2.56,单看平均值,我们会认为A是合格的,因为平均值没有低于2.5,而且与B的差距也很小,只有0.06。但是我们需要看到A有2个不合格品,也就是有40%的不合格率,而B是全部合格,差距还小吗?

另外,一名坐席正常情况下每个月至少要接听1000通电话,以监控30通电话而言,根据排列组合公式可知,在不重复抽样的情况下,能够产生2.43×1055种组合,仅以其中的一个组合来判断坐席的业务水平,显然无法让人信服,因为管理人员无法回答如下问题:这一组合结果与真实值的差异到底有多大,这一组合结果的可信程度到底为多少?

1.2 如何确定监控数量

既然受成本限制,监控力量是有限的,那在确保随机抽取录音的情况下,对于每一位坐席每月至少应该监听多少通录音呢?有科学的公式可供计算吗?

2 运用统计学的方法解决问题

2.1 获知准确度

前文提到,在不重复抽样的情况下,从1000通录音中,随机抽取30通录音,将产生2.43×1055种组合,那这30通录音的平均值当真就没有任何意义吗?当然不是。这30通录音的平均值包含着整体1000录音平均值的信息。事实上,用这30通录音的平均值当作整体1000通录音平均值的做法在统计学上叫做点估计,我们需要做的是,利用这30通录音的数据,来估算出整体1000通录音的真实情况,这在统计学上叫做区间估计。区间估计又分为双边估计和单边估计,单边估计又分为上限估计和下限估计,在这里暂先只讨论上限估计。

在具体介绍上限估计之前,首先要引入两个重要的概念:上限置信区间和置信水平。

用较为通俗的话来讲就是,这1000通录音的真实平均值最高不会超过多少分(记作μ),而且这个“μ”的“可靠程度”有多少。这里所说的“μ”就是上限置信区间,“可靠程度”就是置信水平,置信水平是用概率来度量的,习惯上把置信水平记作1-α,这里α是一个很小的正数,称为显著水平。

根据μ的上限估计公式可知:

其中,是指已监控的30通录音的平均值,s是指已监控的30通录音的标准差,n是指监控数量(在本例中即为30),tα(n-1)是指t分布的反函数。

假设,置信水平为99%,

计算可知,t0.01(30-1)=2.462,μ=90+2.462× =93.596

也就是说,这1000通录音的真实平均值最高不会超过93.596,并且这一结果有99%的“可靠程度”。

需要说明的是,在利用上述公式进行计算时,一般情况下要求n≥30。

另外,tα(n-1)的计算较为复杂,但可以通过EXCEL轻松获得,EXCEL函数为TINV(2*α,n-1)。

2.2 获知精密度

对于精密度的度量,我们采用一个指标,叫做“每千件不合格率”(Part Per Thousand,简称:PPT),工业企业一般用“每百万件不合格率” (Part Per Million,简称:PPM)。要对PPT进行计算,首先要对总体标准差(记作:σ)进行计算,以上例为例就是要对1000通录音的真实标准差进行下限估计。为什么在这里要进行下限估计,而不是进行上限估计呢?因为对于PPT的计算,μ越大或σ越小,PPT就越低,相应合格率(记作:η)就越高,作为KPI指标而言也更有说服力。我们继续以上例为例:

根据σ的下限估计公式可知:

其中,α是指显著水平,s是指已监控的30通录音的标准差,n是指监控数量(在本例中即为30),是指χ2分布的反函数。

根据上例已知,

计算可知:

同样,χ(n-1)的计算也较为复杂,但可以通过EXCEL轻松获得,EXCEL函数为CHIINV(α,n-1)。

现在我们可以进行PPT的计算了,假设合格线(记作:TL)为85分(低于85分为不合格),根据正态分布概率统计公式可知:,即求标准正态分布的概率,EXCEL函数为NORMSDIST((μ-TL)/σ)。

根据上例可知,μ=93.596

经计算,η=92.00%,PPT=(1-η)×1000=80

也就是说,这1000通录音中至少有80通为不合格的录音,并且这一结果有99%的“可靠程度”。

至此,我们已经从数理上解决了准确度和精确度的问题。

2.3 最少监控量的确定

最少监控量是有科学的统计公式可供计算的,具体如下:

①重复抽样情况下:

最少监听数量=(概率度2*标准差2)÷(极限误差2)。

②不重复抽样情况下:

最少监听数量=(全部录音数量*概率度2*标准差2)÷(全部录音数量*极限误差2+概率度2*标准差2)。

其中,“概率度”是由置信水平(1-α)确定的,可通过EXCEL函数NORMSINV((2-α)/2)计算求得。“极限误差”是人为设定的数值,通俗而言,就是人们希望将误差控制在多少分之内。

在实际工作中,当(n/N)

2.4 正态性检验

上文在介绍如何计算PPT的过程中提到了正态分布。事实上,上述PPT计算公式是以样本服从正态分布为假设前提的。虽然正态分布广泛存在,并且根据数理统计原理可知,当样本数量足够大(n≥30)时,样本将符合或近似符合正态分布。但出于严谨,如果条件允许,对正态分布进行检验是有一定必要的。

对正态分布进行检验的方法有很多种,我国已经专门制定了国家标准GB4882-85正态性检验,其中介绍了国际上采用的先进的检验方法。在各种检验方法中,根据奥野忠一等人在20世纪70年代进行的大量模拟计算的结果,认为正态性检验方法中,总的来说,以“偏峰检验”和“夏皮罗-威尔克法”较为有效,前者以样本数量大于100为宜,而后者仅适用于样本数量大于3小于50的情况。因此前者适用于对整体进行评估,后者适用于对坐席个人进行评估。

另外,当大数据下如果检测结果不符合正态分布,则有可能是抽样或评分标准的执行出现了问题,正态性检验在一定程度上也是对抽样是否随机,以及质检人员对评分标准掌握是否统一的一种预警。

3 结束语

运用统计学无疑可对质量管理工作进行科学、有效地改进。但是由于统计学较为专业,一般只有质量监控人员才会去关心和予以运用,其他人员很少会去学习了解,运用更是无从谈起。

呼叫中心的管理人员必须了解,21世纪的质量管理,已经进入了全公司(组织)质量管理(TQM,Total Quality Management)的时代,研究并运用统计学知识对质量管理工作进行完善和改进绝不仅仅是质量监控部门的事情,只有全公司(组织)各部门共同关心、重视、积极参与其中,质量管理水平才能真正提高。

【参考文献】

[1]栗方忠.统计学原理[M].东北财经大学出版社,2008.

[2]许乃威.从统计学看呼叫中心质量管理[J].客户世界,2007(12).

篇(8)

一、引言

当今社会,科学技术日益革新,统计思想逐步成熟,统计工具也被应用于统计领域,该领域也随之得到延伸和发展。而所谓的统计学其主要的内容是通过对数据的收集、统计、整理分析、数据处理等方法,从而更加深入的发掘数据存在的内部规律,以达到更科学、更合理的解释客观事物的目的,加深对该事物的认知。在具体工作和现实生活中,很多客观规律的分析及归纳是运用统计的方法实现的,通用的操作方法如下:首先需要在分析之前对客观事物进行研究和设计,了解该事物的基本特点;其次针对该事物进行抽样调查,调查的范围要全面;再次利用相应的统计软件和数学思想,建立相应的数学模型,对抽样的结果进行统计分析,让数据呈现一定规律;最后便是根据统计分析的结果作出结论性成果,以便能更加深入的研究及分析客观事物存在的内在规律和普遍性原则等。统计学被应用的领域广泛,本文主要针对统计学在财务方面进行研究。

二、统计学应用于财务方面的意义

(一)将统计学应用于财务,能满足企业和行业对产值、资金等方面的计算需求。行业或企业财务数据极为庞大,运用统计方法进行财务统计,便于反应企业或行业的劳动成果和产能产效,为国家统计国内生产总值、人均GDP等提供数据支撑。

(二)将统计学应用于财务,可以帮助企业或个人进行负债核算、资金流核算等,提供基础数据。运用统计学进行财务统计,既可以作为分析企业经济实力的标准,又可以将统计的数据作为核算资产负债的数据来源。

(三)将统计学应用于财务,可以用于研究分析个人、企业、国家三者之间的利益分配关系,通过统计学研究出的普遍性规律来制定符合大多数人需求的收入分配制度,从而达到合理调整利益关系的目的。

三、如何合理运用统计学解决财务管理问题

(一)利用统计学方法进行财务的收益与风险计算财务管理的过程中,经常需要计算财务收益与风险,而对应在统计学中即为算数平均值与标准差的计算。比如,企业在运营过程中,需要计算期望现金流量,往往在现实运营过程中,存在诸多影响未来现金流量的不可控因素,因此计算出的未来的资金流量存在很大的不确定性,但如果采用单一的现金流量,在一定程度上可以保证现金流量的确定性,却不能全面的反应企业的资金运营情况。在这种大背景下,可结合统计学方法,如期望现金流量法,计算未来的现金流量,能提高计算的准确性,取得较好的效果。此外,在企业财务管理的过程中,需要运用到许多基于统计学的财务预算方法,如在预测资金需求量的情况下,可以运用回归法预测、平滑法预测等。当今,基于统计学原理,已经形成了很多专业的财务预算方法,如:预计资产负债表法、线性回归法等,这些方法的运用,加快了财务管理的效率,为财务人员处理庞大的财务数据提供了方法。

(二)利用统计学方法进行审计统计抽样抽样调查是统计学常用的统计方法,而审计抽样,则是抽样调查在财务应用的体现,主要是指审计人员在审计时,审查主体数据量比较庞大,因此仅抽取部分样本进行审查分析,通过分析抽取样本的审查结果,从而大致推断出总体的审查结果,这也是我国财务审查的主要方法之一。统计抽样之前需要先进行假设检验,即在抽样调查之前需要确定抽样规模、范围、基本参数等,之后还需对选取的样本进行初步审核。若在实际审查的过程中,抽取的样本不能满足审查要求,还可对样本的规模进行逐步扩大,以达到抽样结果的特征与总体情况基本相符的目的。在审查的最后,根据样本的审计结果进行推导,从而得出基本符合总体特征的结论。在实际的审计过程中,抽样的方法有很多,如货币单位抽样、变量抽样等。而在选择抽样方法时,审计人员应该根据审计的目标、效率及审查总体的特征合理选择,以达到审查的最终目的。

四、统计方法在财务管理中的应用

当今社会,统计学方法被大量应用于财务管理的各个方面,其最终目的在于提高财务管理的效率,分析财务活动的合理性,为财务活动的预测、决策、控制等提供科学依据。本文从收益率的预测、概率图的运用、数据的准确性及数据变异系数的分析四个方面着手,对统计学在财务方面的应用进行研究分析。

(一)预测未来收益率,提高企业收益。一个企业在实际运营过程中,能很好的把控未来的发展状态及收益情况,是企业发展的重要途径。利用合适的统计学方法可以实现利用已有的数据预测未来一段时间的数据。对应到企业中去,即运用统计学的方法,对企业现有的资源进行统计分析,预测未来一段时间内的收益情况,从而根据预测的收益率指定相应的实施方案,从而达到提高企业收益的目的。

(二)利用概率分布图,进行数据分析及投资决策。在具体的财务管理过程中,可利用统计学方法对已有数据进行处理,并根据需求绘制相应的概率分布图,那么各种数据的变化规律便一目了然,以便于决策者根据其变化规律进行投资或运营。比如在计算企业未来收益率时,可以根据现有的数据进行统计分析并绘制出一条概率与结果近似关系的连续性曲线,并根据该曲线推导出未来的收益率,从而进行投资决策。概率图有两个最主要的特点:概率分布图越集中,则其预期结果越趋向于实际结果,则其风险越小,投资回报率越高。当所得到的概率分布图越集中时,则说明实际结果越有可能接近预期值;反之,概率分布图越稀疏,则实际结果与实际结果的差距越大,风险也越大。

(三)利用标准差,确保数据的准确度。在财务的实际管理过程中,经常需要确定数据的准确程度,而财务人员通常是是利用统计学中的标准差的大小来判断所得到数据的精确程度。计算标准差的步骤如下:第一,根据现有的数据进行预测,得出收益的预测值;第二,将收益率的预测值和实际值相减,得到离差值;第三,计算概率分布方差,即将离差值求平方,并将得出的平方值与预测值相乘,再将这些乘积相加;第四,对方差进行开方计算,得到标准差。

(四)运用数据变异系数,度量单位收益风险。变异系数是标准差与平均数的比值,主要是用来衡量数据的变异程度,即用于度量单位收益下的所面临的风险。这种单位收益的风险判断为企业的决策提供了有效的借鉴。因为变异系数既能计算风险还可以反映企业收益,因此在企业的财务管理中被大量应用。

五、结论

企业或行业的财务管理过程中会面临大量的数据处理,合理利用统计学方法进行数据的统计及分析,对简化数据处理,提升数据准确度、精确度,甚至对于财务决策等各方面均有所助益,因此,将统计学方法引入财务管理具有非常重要的意义。

【参考文献】

[1]李金昌.关于统计思想若干问题的探讨[J].统计研究.2006,(3).

篇(9)

东南大学02级、03级、04级、05级、06级男生各4个自然班(平均每班30人),在一年级时立定跳远的成绩,据此计算出各年级平均成绩及其标准差。见表1

表1男生立定跳远平均成绩及标准差

二、选择统计资料的方法

1.项目选择。本文所选项目是经过与其它身体素质资料对照比较而选择的,它具有一定的代表性和典型性。

2.资料选择。本文在收集资料时,最大程度地剔除了原始资料不可靠部分,保留了可信度较高的部分。

三、制定预测评分表

1.求2007年全校男生立定跳远平均数和标准差的预测值

第一,求2007年全校男生立定跳远平均数的预测值。本文采用K元线性回归方程计算预测值。为计算方便,把02年、03年、04年、05年、06年简写为1、2、3、4、5。设“Xi”为年份,成绩为“Yi”,首先列出Xi和Yi的回归计算表(见表2)。

表2Xi和Yi的回归计算表

2007年全校男生立定跳远平均数预测值的具体计算略,其结果为2.28米。

第二,求2007年全校男生立定跳远标准差的预测值。数据见表1,2007年全校男生立定跳远标准差预测值计算的方法和步骤同2007年全校男生立定跳远平均数的预测值计算,具体计算略。其结果为:S=0.1362

2.求2007年全校男生立定跳远60~90分的预测区间

假设低于60分和高于90分的学生各占总数的5%,显然60~90分之间的人数占90%。查表可知置信概率0.90的预测区间为

若求这个预测区间,可用2007年预测标准差代替剩余标准差。

在回归方程:的上下两侧分别作一条与回归直线平行,并符合上述条件的直线,则为取整计算方便,2.053932取2.06,对应60分,2.50对应90分。

3.根据预测采用累进评分法制定2007年全校男生立定跳远评分表

第一,求累进评分数学模型的抛物线方程

累进评分法的优点在于使分数的累进与成绩提高的难度相适应,并能对成绩作出较为客观的评价。其数学模型为

Y=KD2-Z

其中Y为累进分数,K为系数,D为某成绩在正态曲线图横轴上的位置,Z为基分点以左的分数。把X-1S的位置定为60分,X+3S的位置定为90分,查D值表知,-1S位置的D=4,3S位置的D=8,代入公式得:

90=K.82-ZK=0.625

60=K.42-ZZ=50

代入数学模型得抛物线方程:Y=0.625D2+50

第二,求2007年全校男生立定跳远成绩所对应的D值

把60~90分之间2007年全校男生立定跳远距离按递增0.02米进行排列:2.06、2.08、2.10、......2.50,其间隔为22个。

与之对应的D值间隔为:8-4/22=0.1818。见表3

表3立定跳运成绩对应D值表

第三,将表4数值代入抛物线方程:

Y=0.625D2+50

Y2.06=0.625×42+50=60

Y2.08=0.625×(4+0.1818)2+50≈60.93

Y2.10=0.625×(4+2×0.1818)2+50≈61.90

Y2.12=0.625×(4+3×0.1818)2+50≈62.91

中间数值计算省略

Y2.50=0.625×82+50=90

Y2.52=0.625×(4+23×0.1818)2+50≈91.83

Y2.54=0.625×(4+24×0.1818)2+50≈93.71

Y2.56=0.625×(4+25×0.1818)2+50≈95.64

Y2.58=0.625×(4+26×0.1818)2+50≈97.60

Y2.60=0.625×(4+27×0.1818)2+50≈99.60

注:小于2.06的得分略

第四,把上述数据列表,并按四舍五入进行修正。见表4

表4立定跳远得分表

四、结论与建议

1.本文采用统计学方法,以作者多年积累的学生身体素质资料为根据,以东南大学男生立定跳远成绩为素材,详细叙述了该项目评分表的制定过程。

2.这种评分表与传统的评分表相比,更适合学生的实际情况。它为教师提供了把握学生及格率以及平均成绩的方法,具有一定的现实意义。

3.本研究采用的累进计分的方法,使学生的最后得分与成绩提高的难度相适应,方法更科学,结果更合理。

篇(10)

6岁以下是儿童生长发育的关键时期,这一时期患营养不良,将会对儿童的生长发育产生诸多近期和远期的不良反应。全球婴幼儿死因中50%以上,都直接或间接地与营养不良有关。儿童的营养状况是衡量人群营养状况的敏感指标,也是国际上开展营养监测所采用的常见指标。

国内外的研究显示:儿童营养不良的影响因素主要由贫穷所致食物短缺、家长缺乏营养知识、儿童偏食以及忽视科学喂养等方面构成。

1调查对象和方法

1.1调查对象本调查系2009年中国疾病预防控制中心“建立贫困地区6岁以下儿童营养健康状况相关危险因素检测数据信息系统”项目的子项目之一。采用多阶段随机整群抽样方法,确定将商都县和扎鲁特旗作为调查点,共抽取了4个乡8个居委会(村),628名0-5岁儿童为调查对象。

1.2调查指标测量和结果判定

1.2.1儿童体重和身高(长)测定体重测量:采用RCS-160数显电子人体秤,能自行站立的儿童直接电子秤称重,幼小儿童则由母亲抱其测量后再单独测量母亲体重,二者之差即为儿童体重,重复测量两次。

身高(长)测量:3岁以下儿童身长测量使用WB-A卧式测量床,3岁及以上儿童使用SZ-200坐高身高计进行测量。

1.2.2营养状况评价指标根据0-5岁儿童的生长发育特点,本次营养状况评价采用Z评分法,参考2000年中国CDC推荐的性别年龄别身高体重参考值,作为评价儿童营养不良的评价指标。本次主要选择发育迟缓率、低体重率和消瘦率为判定儿童营养不良情况评价指标。

1.2.3营养状况评价标准根据WHO通过cubic splines(三次样条函数)对曲线进行平滑处理的BoxCox-Power-Exponential(BCPE)方法所绘制的儿童生长曲线来进行比较:中重度发育迟缓―年龄别低于参考标准身高中位数减两个标准差和三个标准差;中重度消瘦和低体重―年龄别体重低于参考标准体重中位数减两个标准差和三个标准差;中、重度营养不良―低于标准年龄别身高、年龄别体重、身高别体重两个标准差和(或)三个标准差。

1.3统计分析用EpiInfo软件建立数据库和逻辑检错程序,资料统一录入。采用spss13.0统计软件进行数据录入及统计分析,采用率进行统计描述,运用χ2检验进行比较分析,假设检验的水准均设定为0.05。

2结果

2.1基本情况本次在商都县和扎鲁特旗共调查了0-5岁儿童628人,分别为312人(49.7%)和316人(50.3%)(见表1);男孩317人(50.5%),女孩311人(49.5%),各年龄组儿童人数比例基本均衡(见表2)。调查儿童中,民族因素无显著差异。

2.2内蒙古商都县和扎鲁特旗0-5岁儿童营养不良情况

2.2.1营养不良情况概况与2006年全国农村0-5岁儿童营养不良水平相比,我区商都县和扎鲁特旗0-5岁儿童发育迟缓率降低约2.1倍,差异有统计学意义(X2=37.18,P

2.2.2两个地区之间0-5岁儿童营养不良水平比较商都县和扎鲁特旗的0-5岁儿童营养不良率差异有统计学意义(P

3讨论

2009年我区商都县和扎鲁特旗0-5岁儿童营养情况与2006年全国农村儿童平均水平相比,儿童生长发育迟缓率(3.8%)低于全国农村平均水平(11.7%),而低体重率(9.4%)和消瘦率(8.8%)均高于全国农村平均水平(6.9%和2.4%)。这一结果主要与该地区社会经济、文化教育水平、以及喂养和母亲的照料等因素密切相关。

3.1家庭贫困经济的发达和落后必然影响儿童营养素的摄取和营养状况[1],虽然造成儿童营养不良的因素是多方面的,且各种因素间相互影响,但贫困往往是造成儿童营养不良的根本原因[2]。抽样调查的两个地区为国家级贫困县,调查中年人均总纯收入不足1500元(人民币)的分布,商都县为42.6%(133/312),扎鲁特旗达47.2%(149/316),两地差异无统计学意义(X2=1.30,P>0.05)。家庭收入的低下可影响母亲及儿童的膳食结构,进而造成营养不良。

3.2母亲/双亲文化程度偏低缺乏科学喂养知识是影响儿童健康的重要因素。在调查中发现,贫困地区儿童的父母或抚养人受教育程度普遍较低,其中初中或初中以下的文化程度占到了60%以上。由于缺乏科学的喂养知识,添加辅食的时间过晚或者品种过于单一,都会导致儿童机体的抵抗力低下,反复患呼吸道、消化道疾病导致营养不良发生率升高[3]。

综上所述,要加强我区贫困地区妇幼保健队伍的建设,提高队伍的专业性和指导性;其次,开展健康教育,加强母亲的儿童营养相关知识,进行科学喂养,巩固和提高0-4个月母乳喂养率[4]的同时,注意幼儿期儿童及时添加辅食,注意各种微量元素的摄入和平衡。保证儿童生长发育所需的各种营养素,改变儿童不恰当的饮食习惯等。

参考文献

[1]刘爱东,赵丽云,于冬梅,等.中国5岁以下儿童营养不良现状及其变化趋势的研究[J].卫生研究,2008,37(03):324-326.

[2]陈春明,何武,常素英.中国儿童营养状况15年变化分析――中国儿童生长发育主要影响因素的变化[J].卫生研究,2008,35(06):765-768.

[3]Brown plementary feeding of young children in developing countries:A review of current scientific knowledge[M].Geneva:WHO,1998.

篇(11)

中图分类号:TP319 文献标志码:A 文章编号:1673-8454(2014)04-0065-04

课程考核是检验教学质量的重要途径和关键手段,考核成绩作为量化评价指标,能够有效反映学生的学习情况和教师的教学效果。系统科学的成绩分析,不仅能够客观公正的反映学生的学习状态和知识技能的掌握程度,而且能够引导教师发现教学过程中存在的不足和主要问题,帮助教师正确认识问题背后的关键影响因素,促使教师不断改进教学方法,切实提高教学质量。

一、成绩分析方法

常用的成绩分析方法有频数分析法、集中量分析法、差异量分析法。频数分析法包括等级频数及频数分布曲线,集中量分析法包括算数平均数、中位数、众数,差异量分析法包括全距、平均差、标准差。教师手工计算上述参数存在一定难度,一方面许多教师没有教育统计学基础知识,不了解数理统计分析方法,另一方面手工计算过程纷繁复杂,不仅费时费力,而且容易出错,难以实现成绩分析的高效性和准确性,必须采用技术手段解决这一问题。考虑到《课程成绩登记表》普遍采用Excel软件,笔者以此为平台进行二次开发,采用VBA开发技术自定义解决方案,针对课程考核结果进行自动成绩分析。

二、开发工具

VBA(Visual Basic for Applications)是微软公司开发的一种通用控制Visual Basic编程语言,可以方便地调用和定制主应用程序对象。VBA内嵌在Microsoft Office(Word、Excel、Access等)软件中,用来扩展Microsoft Office应用程序功能。用户可以根据需要编写VBA宏代码,创建自定义解决方案,自动完成重复工作,提高工作效率,实现高效办公。VBA的开发和运行依赖主应用程序,本课题利用Excel中内嵌的VBA实现自动成绩分析。[1]

三、设计目标

在《课程成绩登记表中》设置“图表生成”按钮,鼠标单击后出现选择对话框,显示“请单击某一单元格”,选择某列数据标题单元格作为分析对象,确定后自动生成“成绩分析”工作表,自动统计并显示总人数、平均分、中位数、标准差、最高分、最低分、各分数段人数及百分比、峰度、偏度,自动生成柱状图和正态分布曲线,如图1所示。

四、功能设计

成绩分析针对某个班级的某门课程进行,VBA宏程序由数据准备、数据统计和曲线图生成三个模块构成。

数据准备模块包括原始成绩录入、数据列选择、分析页面生成三个环节。任课教师首先将原始成绩录入到《课程成绩登记表》中,之后点击“图表生成”按钮,在选择对话框中确定某列数据作为分析对象,完成数据列选择,单击“确定”,程序根据用户指定单元格所对应的数据列自动生成“成绩分析表”。

数据统计模块和曲线图生成模块是系统设计的核心部分,系统执行VBA宏程序,自动进行数据计算并显示统计结果,同时自动生成柱状图和正态曲线图。

1.数据准备

原始数据录入由任课教师手工完成,这里不再阐述。

原始成绩录入后,鼠标单击“图表生成”按钮,系统自动弹出“请选择”对话框,其宏代码如下。

err: On Error Resume Next

Set myCell = Application.InputBox(Prompt:=" ", Title:="请选择", Default:="请单击红色字体中的某一单元格", Left:=800, Top:=500, Type:=8)

If myCell Is Nothing Then Exit Sub

If myCell.Row 4 Then

MsgBox "单元格输入错误,请重新选择"

GoTo err

ElseIf myCell.Column > 8 Then

MsgBox "单元格输入错误,请重新选择"

GoTo err

ElseIf myCell.Column < 3 Then

MsgBox "单元格输入错误,请重新选择"

GoTo err

ElseIf myCell.Value = False Then

MsgBox "请单击红色字体中的某一单元格"

GoTo err

如果正确选择了红色区域的某一单元格作为分析列,单击“确定”后系统自动进入数据统计模块。考虑到操作过程中可能出现错误选择单元格的实际情况,为了提高程序的容错性,增加了错误处理程序,当操作人员不慎选择了非指定区域的其他单元格时,系统自动弹出错误提示框,如图 2所示。

成绩分析页面(sheet2)生成部分的宏代码如下。在生成成绩分析页面(sheet2)的同时,确定成绩登记表(sheet1)中的数据统计范围。

ColumnNo = myCell.Column

Set myCell_1 = Sheet1.Range(Cells(5, ColumnNo), Cells(34, ColumnNo))

Set myCell_2 = Sheet1.Range(Cells(5, ColumnNo + 9), Cells(34, ColumnNo + 9))

Set ReturnRange = Sheet2.Range(Cells(2, 12), Cells(52, 12))

Sheet2.Select

Sheet2.Activate

Sheet2.Visible = xlSheetVisible

2.数据统计

数据统计模块包括总人数(CountA)、平均分(Sum/ CountA)、中位数(Median)、标准差(StDev)、最高分(Max)、最低分(Min)、峰度系数(Kurt)、偏度系数(Skew)。

总人数为点计数据,将学生人数作为点计结果。

平均分(算术平均数) 和中位数属于集中量数据,用来描述数据集中趋势的统计量,能够反映成绩分布的一般水平。平均分反映的是一组成绩的总体平均水平。平均分的理想数值为75分,70-80分之间为合理范围。中位数像一条分界线,将数据分成前半部分和后半部分,用来代表一组成绩的中等水平。

标准差为差异量数据。可以直接地、概括地、平均地描述数据变异的大小,对于同质性数据来说,标准差越小,数据的变异程度越小,数据越整齐,分布范围越集中,反之标准差越大,数据的变异程度越大,数据越参差不齐,分布范围越广。通常情况下,一组成绩数据的标准差应该在7-10之间为合理范围,标准差小于5, 说明分数过度集中,试题区分度较低,标准差大于15,说明分数过度分散,试题区分度过高。

最高分和最低分为度量数据,既有相等单位又有绝对零点。

峰度系数和偏度系数表示频数分布的形态。偏度表示正态分布曲线的对称性,-1.5

数据统计模块的宏代码如下:

Sheet2.Cells(21, 7) = WorksheetFunction.CountA(myCell_1, myCell_2)

Sheet2.Cells(21, 4) = WorksheetFunction.Sum(myCell_1, myCell_2) / WorksheetFunction.CountA(myCell_1, myCell_2)

Sheet2.Cells(22, 4) = WorksheetFunction.Median(myCell_1, myCell_2)

Sheet2.Cells(23, 4) = WorksheetFunction.StDev(myCell_1, myCell_2)

Sheet2.Cells(24, 4) = WorksheetFunction.Max(myCell_1, myCell_2)

Sheet2.Cells(25, 4) = WorksheetFunction.Min(myCell_1, myCell_2)

Sheet2.Cells(26, 4) = WorksheetFunction.Kurt(myCell_1, myCell_2)

Sheet2.Cells(27, 4) = WorksheetFunction.Skew(myCell_1, myCell_2)

除了上述统计数据之外,还要计算各分数段人数及百分比,将分数划分为优秀(90-100)、良好(80-89)、一般(70-79)、及格(60-69)、不及格(60以下)五个等级,统计不同等级区间的人数分布情况,其宏代码如下:

Sheet2.Cells(22, 7) = WorksheetFunction.CountIfs(myCell_1, ">= 89.5") + WorksheetFunction.CountIfs(myCell_2, ">= 89.5")

Sheet2.Cells(22, 8) = Sheet2.Cells(22, 7) / Sheet2.Cells(21, 7)

Sheet2.Cells(23, 7) = WorksheetFunction.CountIfs(myCell_1, ">= 79.5") + WorksheetFunction.CountIfs(myCell_2, ">= 79.5") - Sheet2.Cells(22, 7)

Sheet2.Cells(23, 8) = Sheet2.Cells(23, 7) / Sheet2.Cells(21, 7)

Sheet2.Cells(24, 7) = WorksheetFunction.CountIfs(myCell_1, ">= 69.5") + WorksheetFunction.CountIfs(myCell_2, ">= 69.5") - Sheet2.Cells(23, 7) - Sheet2.Cells(22, 7)

Sheet2.Cells(24, 8) = Sheet2.Cells(24, 7) / Sheet2.Cells(21, 7)

Sheet2.Cells(25, 7) = WorksheetFunction.CountIfs(myCell_1, ">= 59.5") + WorksheetFunction.CountIfs(myCell_2, ">= 59.5") - Sheet2.Cells(24, 7) - Sheet2.Cells(23, 7) - Sheet2.Cells(22, 7)

Sheet2.Cells(25, 8) = Sheet2.Cells(25, 7) / Sheet2.Cells(21, 7)

Sheet2.Cells(26, 7) = Sheet2.Cells(21, 7) - Sheet2.Cells(25, 7) - Sheet2.Cells(24, 7) - Sheet2.Cells(23, 7) - Sheet2.Cells(22, 7)

Sheet2.Cells(26, 8) = Sheet2.Cells(26, 7) / Sheet2.Cells(21, 7)

3.曲线图生成

曲线图生成包括直方图生成和正态曲线图生成两部分。[2]

绘制直方图的方法是:首先将0-100分以间隔2分的级差分成50个等级,分数段设置为0、2、4、6、8、10……96、98、100,在VBA宏程序中使用FREQUENCY函数统计各分数段人数,宏代码如下:

If ColumnNo = 3 Then

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!C$5:C$34,K$2:K$52)+FREQUENCY(成绩登记表!L$5:L$34,K$2:K$52)"

ElseIf ColumnNo = 4 Then

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!d$5:d$34,K$2:K$52)+FREQUENCY(成绩登记表!m$5:m$34,K$2:K$52)"

ElseIf ColumnNo = 5 Then

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!e$5:e$34,K$2:K$52)+FREQUENCY(成绩登记表!n$5:n$34,K$2:K$52)"

ElseIf ColumnNo = 6 Then

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!f$5:f$34,K$2:K$52)+FREQUENCY(成绩登记表!o$5:o$34,K$2:K$52)"

ElseIf ColumnNo = 7 Then

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!g$5:g$34,K$2:K$52)+FREQUENCY(成绩登记表!p$5:p$34,K$2:K$52)"

Else

Sheet2.Range("l2:l52").FormulaArray = "=FREQUENCY(成绩登记表!h$5:h$34,K$2:K$52)+FREQUENCY(成绩登记表!q$5:q$34,K$2:K$52)"

End If

完成各分数段人数统计后,在Excel成绩分析表界面中使用SERIES函数绘制直方图,SERIES函数具体形式为“=SERIES(成绩分析!$Q$1,成绩分析!$K$2:$K$52,成绩分析!$L$2:$L$52,1)”,如图3所示。

绘制正态曲线图的方法是使用NORMDIST函数,该函数用于返回指定平均值和标准差的正态分布函数。平均分(平均值)和标准差在前面已经获得,将其带入NORMDIST函数生成正态曲线图。NORMDIST函数的具体形式为:“=NORMDIST(K2,D$21,D$23,0)”,其中D$21单元格的内容为平均分数值,D$23单元格的内容为标准差数值。

完成正态分布函数计算后,在Excel成绩分析表界面中仍然使用SERIES函数绘制正态分布图,SERIES函数具体形式为“=SERIES(成绩分析!$S$1,成绩分析!$K$2:$K$52,成绩分析!$S$2:$S$52,2)”,如图4所示。

五、结束语

系统实现了设计目标和功能要求,以Excel软件为平台进行二次开发,按照成绩分析工作的实际要求编写宏代码,开发成果具有较强的实用性和适用性。界面简洁清晰、操作简单,运行速度快,实现了成绩分析工作的科学性、高效性和准确性。