欢迎访问发表云网!为您提供杂志订阅、期刊咨询服务!

统计学大数据分析大全11篇

时间:2023-09-05 16:37:41

绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇统计学大数据分析范文,希望它们能为您的写作提供参考和启发。

统计学大数据分析

篇(1)

关键词:

大数据;统计学;研究方法

中图分类号:

F27

文献标识码:A

文章编号:16723198(2015)11005201

随着信息技术的日益发展与普及,信息以及数据在社会经济发展过程中发挥的作用越来越重要。现如今,“大数据”时代已经来临,于是如何更有效地利用数据快速做出科学决策也已成为众多企业甚至是国家所共同关注的焦点问题。在数据处理和分析方法方面,《统计学》以及在其基础上发展而来的实证统计方法是当前的主流,这些方法可以帮助数据持有者从大量的数据中挖掘有价值的信息,并为其相关决策提供理论支撑和方法支持。然而,传统的实证统计方法在最新出现的大数据情境下,却呈现出了诸多缺陷,例如传统数据收集方法无法实现大规模(甚至是总体)数据的收集,传统统计方法和分析软件无法处理大规模数据,等等。于是,在将传统统计学方法应用于最新的大数据情境和问题之前,需要首先明确大数据所要求的处理方法与传统的统计学处理方法存在哪些关联和区别,然后才能够决定是否可以应用既有统计学理论和方法来处理某些大数据问题。

1大数据的界定

根据一位美国学者的研究,大数据可以被定义为:it means data that’s too big, too fast, or too hard for existing tools to process。也就是说,该学者认为:在关于大数据的所有定义中,他倾向于将之定义为那类“太大”、“太快”,或现存工具“太难”处理的数据。一般而言,大数据的特征可以概括为四个V:一是量大(Volume);二是流动性大(Velocity),典型的如微博;三是种类多(Variety),多样性,有结构化数据,也有半结构化和非结构化数据;四是价值大(Value),这些大规模数据可以为持有企业或者组织创造出巨大的商业或社会价值。

Victor在其最新著作《大数据时代――生活、工作与思维的大变革》中指出,大数据时代,思维方式要发生3个变革:第一,要分析与事物相关的所有数据,而不是依靠分析少量数据样本;要总体,不要样本。第二,要乐于接受数据的纷繁复杂,而不再追求精确性。第三,不再探求难以捉摸的因果关系,应该更加注重相关关系。这些变革反映出了大数据处理方式与传统统计学分析方法的很多关联以及主要不同。因此,下面我们分别针对两者的联系和区别进行讨论。

2大数据与统计学分析方法的联系

从18世纪中叶至今,统计学已经经历了两百多年的发展历程,不论是基础理论还是社会应用都极其坚实而丰富。大数据作为一种新兴的事物规律认知和挖掘思维,也将会对人类的价值体系、知识体系和生活方式产生重要影响,甚至引发重大改变。作为两种认知世界和事物规律的基本方法,它们在以下两个方面存在紧密关联。

(1)挖掘事物规律的基本思想一致。统计学(statistics)探索事物规律的基本方法是:通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析和总结,做出推断和预测,为相关决策提供依据和参考。对于大数据,维克托指出,大数据思维的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识。通过这两个定义可以看出,不论是传统的统计学方法还是新兴的大数据分析方法,都是以数据为基础来揭示事物特征以及发展趋势的。

(2)均采用量化分析方式。大数据分析的基础是数据化,也就是一种把各种各样现象转变为可制表分析的量化形式的过程。不论是传统统计学中所应用的数据(定性和定量数据),还是大数据时代即将被转化和采用其他形式数据(如文字、图像等),最终都是通过量化分析方法来揭示数据中所蕴含的事物特征与发展趋势。

3大数据与统计学分析方法的区别

(1)基础数据不同。在大数据时代,我们可以获得和分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机抽样。这意味着,与传统统计学数据相比,大数据不仅规模大,变化速度快,而且数据来源、类型、收集方法都有根本性变化。

①在数据来源方面,在大数据背景下,我们需要的纷繁多样的数据可以分布于全球多个服务器上,因此我们可以获得体量巨大的数据,甚至是关于总体的所有数据。而统计学中的数据多是经由抽样调查而获得的局部数据,因此我们能够掌握的事“小数据量”。这种情况下,因为需要分析的数据很少,所以必须尽可能精确的量化我们的数据。综上,大数据情况下,分析人员可以拥有大量数据,因而不需要对一个现象刨根问底,只需要掌握事物大体的发展方向即可;然而传统的小数据情况下则需要十分注意所获得数据的精确度。

②在数据类型与收集方面,在既往模式下,数据的收集是耗时且耗力的,大数据时代所提出的“数据化”方式,将使得对所需数据的收集变得更加容易和高效。除了传统的数字化数据,就连图像、方位、文本的字、词、句、段落等等,世间万物都可以成为大数据范畴下的数据。届时,一切自然或者社会现象的事件都可以被转化为数据,我们会意识到本质上整个世界都是由信息构成的。

(2)分析范式不同。在小数据时代,我们往往是假想世界是如何运行的,然后通过收集和分析数据来验证这种假想。也就是说,传统统计实证分析的基本范式为:(基于文献)提出理论假设-收集相关数据并进行统计分析-验证理论假设的真伪。然而,在不久的将来,我们将会在大数据背景下探索世界,不再受限制于传统的思维模式和特定领域里隐含的固有偏见,我们对事物的研究始于数据,并可以发现以前不曾发现的联系。换言之,大数据背景下,探索事物规律的范式可以概括为:数据观察与收集――数据分析――描述事物特征/关系。

(3)数据分析方法不同。传统统计学主要是基于样本的“推断分析”,而大数据情境下则是基于总体数据的“实际分析”,即直接得出总体特征,并可以分析出这些特征出现的概率。

(4)分析视角不同。传统的实证统计意在弄清事物之间的内在联系和作用机制,但大数据思维模式认为因果关系是没有办法验证的,因此需要关注的是事物之间的相关关系。大数据并没有改变因果关系,但使因果关系变得意义不大,因而大数据的思维是告诉我们“是什么”而不是“为什么”。换言之,大数据思维认为相关关系尽管不能准确地告知我们某事件为何会发生,但是它会提醒我们这件事情正在发生,因此相关关系的发现就可以产生经济和社会价值了。

4结语

综上,相对于传统而言,大数据思维主要包括三个重大转变。首先,要分析与某事物相关的所有数据,而不是依靠分析捎来能够的数据样本;其次,研究人员应乐于接受数据的纷繁复杂,而不再追求精确性;最后,认知世界的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。以上三个转变构成了大数据思维的核心。在统计学的进一步应用和发展完善过程中,需要结合以上转变所产生的挑战,思考有效的统计学发展对策。

参考文献

篇(2)

一、引言

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”(麦肯锡咨询公司)大数据时代已经到来了,决策将日益基于数据和分析而做出,而并非基于经验和直觉。大数据应用已经在商业、经济等领域取得了显著的成功。而在目前,教育领域中,各种数字学习环境的普及和推广,越来越多的人员在网络环境下发生学习行为。学习者与学习系统之间,学习者与学习者之间,学习者与设备之间,每天都在发生大量的交互数据,这些数据有着海量的数据规模(Volume)、多样的数据类型(Variety)、快速的数据流动和动态的数据体系(Velocity)、巨大的数据价值(Value),这些都符合大数据的4V特性。海量的数据给传统教育数据的存储和分析都带来了巨大的挑战。如何通过技术手段对教育大数据进行分析处理,使教育领域的方方面面都受益,最终有效促进教与学,已经越来越受到研究者的重视。而学习分析理念的提出,为教育大数据的应用找到了很好的途径。

二、学习分析概述

早在2010年美国新媒体联盟的《地平线报告》中就预测学习分析技术将在未来的四到五年内成为主流。第一届学习分析和知识国际会议认为:学习分析技术是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术。

学习分析所服务的对象涉及教育系统的各个相关人员,学习者、教育者、教育研究者、教育管理者、学习服务提供者等等。使用数据挖掘、社会网络分析、统计分析等多种技术对教育大数据进行解释和分析,根据解释与分析的结果,评估学习者的学习进展,预测未来的表现,并发现潜在问题,以便学习者能更准确地把握自己的学习情况,优化学习过程,教育者能及时调整教学活动和教学内容,优化教学方法和教学策略,为学生提供个性化的教学资源与建议,同时也能为教育管理者的决策提供科学依据。国外对学习分析技术的研究已经取得了一定的效果,而国内还处在理论研究和综述阶段。基于教育大数据的学习分析系统的构建可以为学习分析的应用和实践提供重要指导,更好地提高学习效率,有效促进教与学。

三、学习分析系统的总体架构

国内外许多学者都从不同角度对学习分析进行了整体框架的设计,但每个框架都有其局限性,经过实践验证的框架依然很少。学习分析的基础和核心是海量的教育数据。围绕数据开展数据的采集、存储、分析、表示以及应用五个环节的活动。本文以数据为核心,依据数据流动的过程来构建一个更加灵活和可扩展的学习分析系统的架构模型(见图1所示)。

图1 学习分析系统架构图

学习者的学习行为发生在各种数字环境中,如传统的学习管理系统、网络课程以及开放学习环境(MOOCs)等,社会性学习系统,如博客,微博,各种社交网络等。交互当中所产生的数据都会被记录到原始数据库中,而原始数据来源众多,形式不一,存储和处理都有困难。通过聚集、抽样、维归约、离散化和二元化等预处理,让原始数据更加适合挖掘,将预处理得到的学习数据存储到学习数据库中,与学习者相关的一些基本数据存储在学生信息库中。在特定的时间中学习分析引擎会从学习数据库和学生信息库中获取数据进行分析,依据需求不同,在分析过程中使用不同的数据挖掘和分析工具及模型。分析结果作用于学习者、教育者、研究者、教育管理者等不同层次,提供相应的教育干预,学习内容和过程、教学设计和策略优化。当然,分析结果也要以报告或可视化图表等形式在展示平台输出。

四、结束语

学习分析是大数据技术在教育领域中的应用。在大数据技术的支持下,深度挖掘学习行为模式,交互数据之间所隐藏的潜在价值,学习质量分析,个性化教学内容推送等都将成为可能。在对学习分析进行不断深入研究的同时,也存在许多挑战。如何快速有效地收集和预处理来源多样的原始数据,使用哪种工具、算法能更准确地得到有效预测,如何做到保护学生隐私等,都是我们要考虑的问题。相信这些挑战都将在不久的将来得到解决。

【参考文献】

[1]Barwick H.The “four Vs” of Big Data.Implementing Information Infrastructure Symposium[EB/OL].2012-10-02.

篇(3)

一、引言

在现如今的社会,无论是干什么都离不开信息。小到穿衣吃饭,大到国防军事,每一样都需要信息才能完成。信息是一个名词,围绕着它有信息的产生、信息的处理加工、信息的传递、信息技术的发展等等的一系列环节。所以在现代社会信息就如同一个核心细胞,其他细胞的工作都是围绕它展开进行的。我们对信息一定要敏感而精准。

二、何为大数据时代

大数据最初是由麦肯锡公司所提出来的,它在物理、生物、化学、金融、通讯行业出现并存在已经有一段时日,但它真正为人们所熟知认识却是因为互联网行业的飞速发展。人们总是用它来表述现时代是一个信息爆炸、海量、共享的时代。现如今一个决策的出台不再是凭借昔日的经验和感觉,而是数据的收集、整理、处理、分析所得出的结论。这就表示了一个新的时代,也就是信息数据时代的到来,经济、商业、金融、贸易等多个领域,信息已经成为主宰。这就是大数据时代,也是信息的年代。

三、统计学专业基本概况

统计学,从名称来看貌似是一个新兴专业,其实不然,它是一门非常古老的学科。它最早始于希腊雅典的亚里士多德时代,距今已有两千多年的历史。统计学是通过对数据信息的搜索、整理、分析、描述,以达到窥测所测对象的本质的目的,它是预测对象未来性的一门综合性科学。运用到了大量的数学和其他学科的专业知识,它的使用范围几乎涵盖了社会科学和自然科学的各个领域。统计学家王见定的研究已经说明了数理统计学永远打不败社会统计学,所以在以后的发展道路上,将是社会统计学与数理统计学共存与互补共同前行的模式。

目前作为高校所开设的一门学科,统计学专业主要有一般统计、经济统计两类专业方向,它所培养的是具有良好的数学、经济学素养,熟练掌握统计学的基本理论和方法,熟练地运用计算机分析数据,在企业、事业单位、经济管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的专业型精英类人才。

四、如何很好发展大数据时代下的统计学专业

首先从上文的论述中我们可以得出以下结论:統计学的技术手段是,搜索、整理、分析、描述数据,它的目的是预测、推断检测对象的本质,它是一门综合性非常强的科学性学科。从它的使用广度上来看,它几乎覆盖了社会科学和自然科学的各个领域。所以统计学的“势力”非常大。

而统计学所依赖的基础则是数据,传统的统计学中数据的收集主要包括实验数据、调查数据以及各种途径收集到的第二次数据。但是在经过一段时期的实践后人们发现这种方法得到的数据经常会存在一定范围内的误差,这对样本的客观性是一个根本上的影响,同时样本选取结果产生影响,因此传统的数据收集方法很难适应统计学的飞速发展的需要。从这个层面上来说,大数据的出现是科学发展到一定阶段的必然结果。因此大数据的产生和统计学的发展有着密不可分的关系。从另一面来看大数据的出现也是统计学中的核心环节实现,也就是数据的采集实现了大幅度的跨越。大数据时代的到来意味着检测对象的任何数据都能应用到统计过程中,打破了数据采集处理的局限性,再加上精准、合理的统计处理方法,使得统计结果将更具有代表性和说服力。

同时大数据、统计学、云计算技术三者的强强联合,预计未来的统计学势必会发生革命性的变革。大数据将对未来产生深刻影响,目前可以预见的统计学未来发展的前景有以下两个关键的点:第一点是在数据中科学性将和数据本身形成联盟。数据科学独立门户成为一门专门的学科势不可挡,数据的重要性不言而喻。统计学也将乘浪前行迎来新的发展的奇迹。对于数据平台,也将实现跨领域共享,最终将数据的共享扩展到企业层面,成为未来产业的一员。第二点则是数据的管理处理的竞争力大大增强,数据管理成为企业竞争力中的核心竞争力,直接关乎财务表现。数据资产是一个企业的核心资产,这个理念会逐步深入人心。之后,企业对于数据管理便有了更加精准的定位,企业就会将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关。届时,统计学的相关知识将会有大作为,每一位统计学专业的学生的就业前景将是不可估量的。统计学的发展前景也是一片大好,大数据、云计算、统计学三者则是珠联璧合,我国乃至全世界的信息技术又会迎来新的浪潮,并且是一浪高过一浪,让我们拭目以待。

五、结束语

本文就大数据,统计学二者的定义、概念首先做了介绍。其次是对统计学和大数据包括云计算在内的联合后的优势,以及未来的发展前景做了合理的分析与预测。数据时代已经起航,我们每一个人万万不可落后,我们要追赶信息技术的时代潮流,乘风破浪,迎难而上。为我国信息技术的发展增砖添瓦,为实现自我的价值奋斗不息。

参考文献: 

[1] 薛艳.大数据时代统计学专业教学体系的改革[J].教育教学论坛,2015(4):110-111. 

[2] 周茂袁.大数据时代统计学专业教学改革的初步探索[J].教育教学论坛,2015(35):105-106. 

篇(4)

1 引言

 

甘肃省作为我国西部经济欠发达省份,以教育信息化带动教育现代化发展,坚持以深度融合、机制创新、企业参与、应用驱动为导向,在教育管理信息化基础建设、深化应用、创新融合方面,克服基础条件差等困难,努力实现跨越式发展。

 

认真贯彻落实《教育信息化十年发展规划(2011—2020年)》精神,(简称《十年规划》)。《十年规划》提出了我国教育信息化未来十年的8项任务和5个行动计划,这8项任务和5个行动计划又被概括为“三通两平台建设”。三通即:“宽带网络校校通、优质资源班班通、网络学习空间人人通”,两平台即“教育资源公共服务平台、教育管理公共服务平台” [1]。

 

2 甘肃省教育管理公共服务平台顶层设计

 

“十二五”期间,重点建立覆盖全省各级各类教育的基础数据库及其管理信息系统,为各级教育行政部门和各级各类学校提供教育管理基础数据和管理决策平台。

 

按照教育管理信息系统“两级建设、五级应用”原则,坚持“核心系统国家建、通用系统省级建、特色系统本级建”的建设模式。以甘肃省教育数据中心为依托,集中省级硬件基础环境、人员技术力量,统筹建设教育管理公共服务平台和教育资源公共服务平台,两平台硬件环境共建共享,充分发挥效益,为全省教育管理和应用提供服务。国家级核心系统全面部署,省级通用系统基本完善,各级特色系统逐步推进。

 

在整体推进过程中,以硬件基础环境建设为基础,以保证国家核心系统部署与落地应用为第一要务,以省级通用系统建设与应用为特色,利用大数据统计分析为各级各类教育行政部门提供科学的决策服务,促进教育公平和教育现代化发展。

 

3 甘肃省教育管理公共服务平台基础运行环境[2]

 

为保障我省教育管理信息化的整体推进,向全省各级各类教育行政部门提供教育管理公共服务和基础数据支撑,从2010起,加强省级教育数据中心建设工作,为省级和不具备机房环境的市州提供网络基础环境。按照“国家教育管理公共服务平台《省级数据中心建设指南》”中总体要求进行建设,按照B类数据中心建设标准,建成了面积达250多平方米,安全、高效、节能、功能齐全、服务到位的省级教育数据中心。

 

4 甘肃省教育管理公共服务平台建设情况

 

从2013年截至目前,我省教育数据中心已部署的国家核心管理系统有:中小学生学籍管理系统、中小学校舍安全管理系统、学生资助管理信息系统、中等职业学校学生管理信息系统、学前教育管理系统、教师管理信息系统、基础数据库、应用支撑平台、安全运维监测平台等,基本完成了教育部要求的全部系统的部署。

 

5 运用技术手段,实现各系统数据挖掘整合

 

2014年在国家核心系统建设的基础上,为了便于各业务系统数据分析报表的查看和检索,我省专门开发了甘肃省教育综合数据监测系统,通过统一的教育管理数据监测平台,对所有业务系统数据进行监测,通过统一的门户平台进行展示。

 

该系统设计面向服务的体系结构(SOA),使用J2EE和HTML5程序设计并且在数据的抽取、转换和加载运用了目前先进的ETL技术,通过对中小学学籍系统数据库、教师管理系统、中等职业学校学生管理信息系统数据库、校舍安全管理系统数据库的关联,动态提取各种数据,生成教育行政部门所需的各种统计报表。系统通过学生、教师和学校三个横向维度,按照学前、基础教育、中等职业教育和综合四个纵向维度,把各业务系统报表统一进行展示,并跨系统进行数据关联和对比,按照教育决策部门需要,灵活方便地生成的各种类型报表,按照折线图、饼状图、柱状图和数据报表等形式直观方便地进行展示。

 

6 利用大数据分析共享,提高社会公共服务能力

 

按照“核心系统国家建、通用系统省级建、特色系统本级建”的原则,进一步落实“一库五应用”建设目标,甘肃省在国家核心系统建设的基础上,对各孤立分散的业务系统数据进行跨系统整合,科学、精准、可持续的获取数据,深度挖掘分析数据,从而打造甘肃省教育管理数据监测服务系统,为全省教育行政部门提供科学有效的决策数据。

 

根据我省当前的信息系统实际情况,结合今后教育信息化的长远发展和规划,将各业务系统数据通过抽取、转换、加载等环节,加载到甘肃省教育管理数据监测服务系统中,满足甘肃省教育管理数据监测及分析需要。如:学籍系统、教师系统、校安系统、学期系统、中职系统等都是原始的基础数据,如要跨系统进行数据分析对比和提取,应了解:①农村六年制小学按照学生人数统计教师的分配情况,初级、中级、高级教师的分配情况,教师的年龄结构情况,音体美艺术类专业教师的分配情况。②根据学校片区分布和片区学生教师人数,分析片区学校布局是否合理。③通过小学入学人数、幼儿园入园和毕业人数、义务教育人口监测中适龄入学人数对比,分析入园和入学情况。④查看全省大班情况等。要得到这些分析报表,必须通过对各业务系统源数据进行动态抽取、转换、加载和分析,最后生成所需要的报表。

 

7 结语

 

篇(5)

大数据在如今社会已经成为热点词汇,不仅在计算机领域,在其他各个行业都能够得到运用,为各个行业提供便捷,为了让大数据能够得到充分利用,下文将对大数据分析相关方面进行讨论。

一、大数据与大数据时代

(一)大数据大数据是在当今科技飞速发展的情况下,一种新兴的信息数据处理技术。随着社会科技的进步,各行各业对于数据的应用也越来越广泛,传统的数据处理技术耗时较长且精准度较为低下,已经不能满足现代科技对数据应用的要求。新时代的大数据系统具有超大的数据容量,同时兼容半结构化与结构化的数据,远远超出传统数据库管理系统的管理能力。因此新的大数据技术就此诞生。大数据在发展过程中,具有比为鲜明的特点。与传统数据处理技术相比,大数据具有数量庞大、多样化、速率快、价值高的特点。在信息处理的速度不断加快的当今社会,这样的特点为大数据的广泛应用打下了坚实基础。由于数据的数量较为庞大,且各种数据近年来的增长趋势呈指数型,其数据的种类和形式也各有不同。其次,合理利用大数据技术,能够在一定程度上降低成本,提高效率,因此,大数据处理各项关键技术的进一步的开发与利用已成为了提高自身效率,实现核心竞争力的重中之重。

(二)大数据时代大数据时代是指在物联网技术、计算机技术、数据信息处理技术的基础上,通过互联网途径,大量收集并处理分析数据资源,而形成一种新型的信息时代。大数据时代的主要核心内容是对庞大的数据体系进行处理以发挥价值,从而提升数据分析效率以及数据应用价值。大数据时代是由多种信息技术共同组成,可以有效地避免数据处理中不同步、使用不方便的情况发生,具有高效可靠的数据处理、整合、分析及汇总的功能。因此,大数据时代的新型数据处理技术可最大程度的对数据进行分析与挖掘,极大提高处理数据的效率。

二、大数据时代与统计学

(一)大数据时代与统计学的关系统计工作是集数据的搜集、整理、分析和解释为一体的系统的过程。大数据与统计二者互相依存,通过统计的方法和原理对数据进行整理和分析,提高数据的精确度和适用度,以此来实现数据的价值和利用率。由此看来,大数据与统计学的联系既紧密,又存在区别。大数据与统计学的关系甚为密切,它们都是关于数字的学科。统计学为大数据提供了了施展方向,而大数据将统计学引领至更深更广的空间。共性之一就是社会与数据。几乎所有的行业与大数据都有着密切联系,这些联系或直接或间接,而人们正是通过获取数据并进行分析,从而才能得到商业知识和社会服务等能力。大数据与统计学的区别。首先,信息规模不同。大数据的分析对象是与某事物有关联的所有数据,要求数据量庞大。统计学则是用样本来分析和推断总体的数量特征。在大数据时代,则可以通过各种方法和渠道获得全面而又完整的的信息资料,从而完成更多从前无法完成的事情。其次,动静标准不同。数据经过了搜集、整理、分析的过程就很有可能因为精确性不足而被认为失去了用处。而大数据时代,则不必再担心这个问题,数据的精确性和原始性不在被过分重视,人们可以接受复杂数据。第三,数据搜集形式不同。在以往数据搜集形式主要是抽样调查,方法局限。而在大数据时代,特点是信息爆炸和互联网飞速发展,这一情况得到改观。最后,思维方式不同。大数据时代人们的思维发生转变,人们开始更多的关注事物的相关关联。

(二)大数据对统计学研究工作的影响首先,大数据丰富了统计学的研究对象。在大数据时代,我们既可以以结构化数据作为测量单位对文本、图像和视频等进行分析,还可以对非结构化数据实行分析。其次,大数据影响了统计学的工作进程。统计数据需求丰富,原有的统计抽样分析不能在适应时代的发展,而现代科技方法如透过传感器自动收集数据等方法取代了传统方法,更加便捷有效。

三、大数据数据分析理念

篇(6)

关键词:

大数据;人才培养模式;教学模式

2015年9月5日,我国政府公开《国务院关于印发促进大数据发展行动纲要的通知》,大数据逐步走上我国经济社会发展的大舞台,在社会各个领域中发挥着巨大的促进作用。高等教育作为我国培养高素质人才的主要阵地,避免不了受到大数据的冲击和影响。有效利用大数据是化解冲击并促进高等教育改革的明智之举。高等教育改革的关键是改革人才培养模式,将大数据融入人才培养模式改革的各个环节会达到事半功倍的效果。

一、大数据引领统计学专业人才培养模式的改革方向

1.大数据引领培养目标的改革方向。随着大数据的迅猛发展,大数据分析公司不断涌现,传统的调查公司、数据分析公司纷纷转型,社会急需大量的大数据分析人才。统计学专业按以往培养目标培养的数据分析人才已经不能满足社会需要,因此必须对人才培养目标进行改革,培养目标应从培养专门的统计人才转换为培养精通统计学知识、计算机技术(大数据分析技术),了解相关行业背景的复合型统计人才,保障统计学专业能够为社会经济发展输送高质量的大数据分析人才。2.大数据引领课程设置的改革方向。课程设置是实现培养目标的关键环节,为实现培养大数据分析人才的目标,课程设置应该与培养目标相配套。课程设置的核心课程中应该引入大数据技术相关的计算机软件、语言及算法课程,选修课程中应该增设一些辅助大数据分析的数据挖掘类相关课程及不同行业的相关专业背景课程。3.大数据引领实践教学的改革方向。实践教学环节设计的基本原则是能够有效检验理论教学环节的学习效果,同时锻炼学生的分析问题,解决问题的能力。因此,相应于培养目标和课程设置的改革,实践教学环节的改革应注重学生大数据分析能力的检验和锻炼,积极为学生创造丰富的大数据分析实践机会。例如,在调查分析课程中引导学生改变传统的调查方法,尽量通过数据挖掘揭示某一类现象背后的发展规律,积极开展与大数据分析公司或者相关行业的企业的合作,为学生进行大数据分析实践提供数据及技术支持。4.大数据引领教学方法和手段的改革方向。MOOC、翻转课堂和大量的在线资源的出现为统计学专业教学方法和手段的改革提供了丰富的资源基础,有效构建充分利用各种资源的混合教学模式将成为统计学专业人才培养模式改革的一个重要组成部分。5.大数据引领评价方法的改革方向。传统的评价方法主要注重期末时的总结性评价,忽略过程评价,因此应广泛和合理利用教学各个环节留下的痕迹,即形式各样的数据,创新教育教学评价方法,以此达到对学生、教师及教学效果的科学评价。

二、大数据融入统计学专业人才培养模式的构建

1.大数据融入人才培养目标的制定。人才培养目标的制定一方面要适应经济社会发展的需要,另一方面要从生源质量,办学条件出发,不能盲目追求高目标,因此适当对本校统计学专业历届生源质量和办学软硬件条件等相关数据进行挖掘和分析,有利于制定切实可行的人才培养目标。当然这需要人才培养目标制定者有一定的数据挖掘和分析的能力,需要学校各个相关部门的配合,实际操作起来存在一定困难。2.大数据融入教学方法和手段的选择。教学方法和手段的选择一方面依靠丰富的资源,打破传统的大客厅式的封闭教学模式,另一方面要注重以学生为本和因材施教,这就需要对每个学生的基本素质有客观的把握,仅靠教师的力量很难做到这一点,因此应适当引入相关技术和设备帮助收集课堂教学,课后作业等教学各个环节的实时数据,利用大数据技术全方位综合考量每一位学生的基本素质,为教学方法和手段的选择提供客观的依据,真正意义上做到因材施教。对于一些利用计算机或其他电子设备完成的环节,收集数据的同时,应适当建立针对不同学生的教学策略,以此实现个性化教育。3.大数据融入实践教学环节的设置。统计学专业的实践环节设置应充分考虑利用学习分析和数据挖掘技术分析学生的学习心理,学习行为及学习能力,充分了解学生的前期学习情况,分析教师课堂教学水平和教学能力,充分挖掘教师的特长,以此为基础打造实践教学环节师生的完美匹配,不再拘泥于一个班级或一个专业的学生同时进行相同的实践项目,可以有效提高实践教学的水平和学生的实践能力。4.大数据融入教学评价体系的完善。传统的教学评价体系不能够客观评价人才培养的各个环节的效果,通常是对结果的评价。因此,学校需要利用大数据技术全面分析和挖掘每一个环节的相关数据,包括学生的学习过程,教师的教学过程等,有效利用数据说话,避免对学习效果及教学效果的片面评价,完善统计学专业的教学评价体系。大数据为统计学专业人才培养模式的构建带来了机遇的同时也提出了挑战,我们不能盲目跟风,应认真结合统计学专业学科特点及各方面的条件,合理利用大数据,构建切实可行的人才培养模式。

参考文献:

篇(7)

2011年2月,国务院学位委员会进行了学科调整,统计学完全从数学和经济学中独立出来,上升为一级学科,设在理学门类中,编号为0714。统计学上升为一级学科后,下设的二级学科包括数理统计学、社会经济统计学、生物卫生统计学、金融统计、风险管理和精算学、应用统计学。统计学上升为一级学科对统计学专业的教学带来巨大影响。

 

同时,随着大数据时代的到来,使得传统的统计数据收集、处理与分析方法面临新的挑战,从而推动统计学的发展进入了一个全新的阶段。在统计学上升为一级学科以及大数据时代已经到来的大背景下,统计学专业的课程教学也面临着新的挑战,需要进一步改革与调整。

 

一、大数据时代的到来

 

(一)大数据的生成

 

伴随着人类对客观世界各领域数字化程度的不断提高,每天都有大量的数据产生,并且其产生的速度也越来越快。这些数据来源广泛,其中最主要的来源有:科学研究(如天文学、生物学、高能物理等实验数据)、社交网络、电子商务、物联网、移动通信等。

 

(二)大数据的定义

 

为了应对数据大规模增长带来的机遇和挑战,美国《Nature》杂志在2008年9月4日率先提出了“大数据”的概念。国际数据中心IDC 是研究大数据及其影响的先驱,在2011年的报告中定义了大数据:“大数据技术描述了一个技术和体系的新时代, 被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。但是大数据是一个新兴而且内涵不断发展的概念,尚没有统一公认的定义,只能从其特点上加以认识。

 

(三)大数据的特点

 

与传统数据相比,大数据的特征可以用五个“V”来表示,即Volume(容量大)、Variety(种类多)、Velocity(时效性强)、Value(价值高)、Visualization(可视化呈现)。大数据容量大是个相对的概念,受时间、行业和数据类型等因素的影响;种类多是指数据集的结构异质性,科技进步导致了结构化、半结构、非结构化数据的日益增多;时效性强是指大数据被生成、处理、移动的速度相当快,是区别于传统数据最显著的特征,这也增加了对即时分析、加工数据的需求;价值高是指大数据潜在的高价值能为评价和决策提供依据。可视化是大数据分析的关键步骤,是对有价值信息加以提炼并显示的过程。

 

(四)大数据的应用

 

大数据具有5Vs(Volume、Velocity、Variety、Value、Veracity)特点,蕴含着巨大的社会价值、经济价值和科研价值,已引起了产业界、学术界、政府部门和其他组织的高度关注和重视。

 

近年来,世界发达国家相继布局大数据战略,诸如联合国“数据脉动”计划、美国大数据战略、英国“数据权”运动,大力推动大数据发展和应用。大数据已纳入我国国家发展战略,国务院2015年8月31日印发了《促进大数据发展行动纲要》的通知(国发[2015]50号),指出:“大数据成为推动经济转型发展的新动力,大数据成为重塑国家竞争优势的新机遇,大数据成为提升政府治理能力的新途径。以数据流引领技术流、物质流、资金流、人才流,将深刻影响社会分工协作的组织模式,促进生产组织方式的集约和创新。探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”

 

二、大数据给传统统计学带来的冲击

 

(一)数据收集方法上

 

不同于传统的调查抽样方法获取数据,大数据的收集来源渠道通常为现代网络渠道,如互联网、物联网等。不同的数据源的数据采集需要专用数据采集技术, 如包含格式文本、图像和视频的网站数据,通常需要web爬虫技术。

 

(二)数据存储上

 

大数据的存储不同于传统的数据存储方式,有固定的格式和结构,对于大数据的数据库来说,可以直接将所探测到的信号自动容纳到其中;大数据需要有先进的存储设备,传统的存储设备已经不能容纳如此大量的数据。

 

(三)数据分析上

 

传统的统计分析方法,难以胜任对非结构化的大数据的分析。当前大数据分析技术的研究可以分为6个重要方向:结构化数据分析、文本数据分析、多媒体数据分析、web数据分析、网络数据分析和移动数据分析。

 

(四)数据展示上

 

数据可视化的目标是以图形方式清晰有效地展示数据的信息。一般来说,图表和地图可以帮助人们快速理解信息。但是,当数据量增大到大数据的级别,传统的电子表格等技术已无法处理海量数据。大数据的可视化展示需要专业的软件来完成。

 

三、大数据时代统计学专业教学改革

 

大数据时代的到来对统计学也带来了新的机遇和挑战,特别是大数据对于数据分析人才产生了巨大需求,同时也要求统计专业学生掌握更为复杂统计软件的编程和操作。大数据背景下,统计学要适应新的形势,需要对课程教学进行有针对性的改革。

 

(一)大数据时代统计学专业毕业生就业方向定位

 

大数据时代的到来,使各行各业,包括政府、企业、个人都希望能从大数据这座金矿中挖掘出对自己有价值的金子,从而增加了对统计专业毕业生的需求。一直以来,我国统计工作领域主要是政府统计、部门统计、民间统计。传统意义上,政府及各个部门是统计学学生就业的首选。然而,随着大数据时代的来临,越来越多的毕业生选择发展空间更为广阔的民间统计。民间统计相对于政府统计来说,涉及范围十分广泛,包括各类统计咨询公司、统计调查公司、统计研究院等,介于市场和企业、行业之间。民间统计的发展前景十分广阔,可以预见,随着大数据时代的来临,统计学作用的提高,民间统计必会成为统计专业毕业生选择就业的主要渠道之一。

 

(二)大数据时代统计学专业课程设置改革

 

大数据时代,在对统计数据分析人才需求增加的同时,也对统计专业毕业生的大数据处理能力提出了更高的要求,这就需要统计学专业在课程设置上,增加大数据处理与分析方法课程,如《大数据分析方法》、《数据挖掘》等,培养学生能够使用专业统计软件(R/SAS/Python)进行大数据的挖掘、清洗、分析等。

 

(三)大数据时代统计学专业学生实践能力培养改革

 

在课堂教学之外,通过广泛举办大数据技术创新大赛、大数据技术创新与创业大赛、数据挖掘挑战赛,支持学生成立大数据研究协会,举办大数据相关讲座论坛等方式,增强学生分析和处理大数据的能力。另外,还要加强校外大数据实践教学基地建设,通过与通信、互联网、电子商务等企业大数据开发中心以及大数据研究咨询机构合作,为学生提供给更多的实习、实践机会。

 

四、总结

 

总之,面对大数据时代的到来,统计学专业需要积极改革与调整课程的设置,注重学生实践能力的培养,以适应各行各业对大数据分析与挖掘人才的需求。

 

篇(8)

2019年12月,农业农村部、中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知,部署了用数字化引领驱动农业农村现代化,加快农业农村生产经营、管理服务的数字化改造的发展战略,将全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平作为农业农村发展的目标[1]。农业农村的数字化建设离不开专业人才的培养。农林经济管理专业毕业生的就业方向主要有农业经营单位、面向农业农村的政府管理部门、事业单位、科研院所等。随着农业农村数字化发展战略的推进,给传统的农经人才培养带来了一系列的挑战[2]。在数字经济和智慧农业的时展背景下,数据分析能力是农经专业学生重要的核心竞争力。如何提升农经专业学生数据分析能力,是农经专业人才培养中面临的重要课题[3]。

1农业农村数字化发展战略给农经人才培养带来的挑战

1.1对农经人才的数据思维的更高要求

在大数据时代,无论是农业生产经营活动,还是农村的行政管理中都有大量的数据资源。农业企业、农业合作经营组织、农产品产销数据、农产品溯源数据为农业经营者提供了生产、物流、销售环节大量的数据资源。经营者需要认识到数据是一种新的生产要素,要调动数据作为生产要素的属性,让数据分析为管理决策服务[4]。在数字中国的建设进程中,各级政府部门工作人员通过各级各部门的行政管理智能,收集了大量省、市、区、县级的区域经济社会发展数据。社区网格化管理下收集了微观层面的农业经营单位数据、农村常住人口数据、医保数据、扶贫数据、农村小额信贷数据。这些数据资源是政府提高行政效率、提高政务服务质量的宝贵资源。

1.2对农经人才的数据分析能力的更高要求

在大数据时代,每天都有海量数据生成,如何能更好地利用这些数据,让数据能发挥其为管理决策服务的功能,与数据使用者的数据分析能力是密切相关的。例如,农业经营单位在农业生产环节的农业投入数据、农产品销售数据、电商平台的客户反馈评论、农产品库存的动态数据,如何整合分析这些数据,要求农业经营者系统掌握数据分析、数据挖掘、文本分析等多元化的数据分析方法。政府管理部门掌握的农业人口的迁移数据、农村常住人口网格管理数据、农村居民医保数据、扶贫数据等,数据类型丰富,数据量庞杂,如何实现数据库的整合,要求政府部门工作人员掌握数据库管理、大数据分析技术。

2农经专业数据分析课程群建设中存在的问题

2.1课程之间连贯性不足

以笔者所在的高校为例,为农经专业本科生开设的数据分析类课程,见表1。数据分析课程群包括了通识教育、专业教育和实践教育。从目前的课程设置来看,涵盖了数据库、统计学、经济计量学、多元统计、大数据分析等领域,内容丰富。数据库应用由计算机学院开设,是一门通识教育课程,在授课时教师往往将其视为一门计算机类的入门课程,在教学中没有针对农经专业学生的特质,将数据库的教学与其在农经领域的应用结合起来。学生在学习中往往会觉得该课程与专业联系不够紧密,教学内容枯燥,缺乏学习兴趣。

2.2学生学习的软件种类繁多,但不够深入

在统计学和多元统计课程中,学生将学习EXCEL、SPSS或者R语言的应用,在经济计量学课程中学生将学习Eviews或STATA的应用,在数据挖掘与大数据分析课程中学生将学习Python语言的应用。在每一门课程中学习的软件都不同,对于软件的学习缺乏连贯性和延续性,虽然学生接触的软件种类多,但是由于学时所限,每一种软件都只是入门级的介绍,无法进入到深度学习。

2.3与专业课学习联系不够紧密,缺乏应用机会

学生缺乏在专业课学习中运用数据分析类课程所学知识的机会。数据分析类课程主要介绍数据分析方法和软件的应用,但大部分都安排在第5学期和第6学期。学生在学习了数据分析方法后,缺少在专业学习领域里运用这些方法的机会。例如学生若要完成产业经济学、农业技术经济学、农产品国际贸易学的专题研究、课程论文,需要用到统计学、经济计量学、大数据分析的方法,但在第2-4学期开设大量专业课的学期,数据分析类课程还没有开设。若能将数据分析类课程尽量靠前安排,学生可以在后续的专业学习、课题研究中运用所学的方法,一方面夯实数据分析技能,另一方面也可以增加学生对专业课的学习兴趣。

2.4排课不够科学

在大三阶段,学生可以选修多元统计、数据挖掘与大数据分析、Python语言三门选修课。但到了大三,学生专业课的学习任务重,选修课种类考虑繁多,学生选课可能出于兴趣、学分安排或者准备考研保研考虑,并不是每一位同学都会选修上述课程。尤其是计算机能力不太强、对数学类课程感到困难的同学,会倾向于选择难度小的课程。

3基于项目驱动式教学理念的数据分析课程群改革

3.1开展项目驱动式教学的意义

项目驱动教学法是基于行动导向的探究式教学方法,是将真实的或模拟的项目转化为教学项目,结合课程内容将项目分解为若干工作任务,创设工作情境,引导学生完成任务,进而实现项目教学目标的教学活动[4-5]。项目驱动式教学法最显著的特点是“以项目为主线、教师为主导、学生为主体”,改变了以往“教师讲,学生听”被动的教学模式,完善了学生主动参与、自主协作、探索创新的新型教学模式。与传统教学方法相比,教学实施过程中,学生的目标更清晰明确,可避免传统课堂教学的被动性,进而提高学生学习知识的兴趣和主动性[6]。在数据分析课程群中引入项目驱动教学,一方面能让学生运用所学的数据分析方法分析现实问题,创设数据分析情境,加深对所学方法的理解和运用,激发学习兴趣,培养自主学习能力;另一方面也可以有针对性地创设围绕“三农”问题的数据分析项目,让学生从数据分析中加深对“三农”问题的感性认识,培养对农经专业学习的兴趣,提升对农经专业的认同度。具体来讲,可以从以下方面开展对数据分析课程群的改革[7]。

3.2统筹规划教学内容,加强课程间的连贯和递进

农经专业数据分析课程群目前主要包括必修课数据库应用、统计学和经济计量学,选修课多元统计、数据挖掘与大数据分析,以及实践课R语言与统计应用、Python语言。统计学教学的重点在于对基础性的统计方法的运用,经济计量学教学的重点在于让学生掌握经济计量分析的范式,如何利用经济计量模型开展实证分析。多元统计强调对复杂多维数据信息的提炼。数据挖掘与大数据分析教学的重点在于大数据时代数据挖掘方法的应用。此外,针对于目前学生所学的软件门类过多,软件操作不够熟练,建议在统计学、多元统计、数据挖掘大数据分析中统一采用R语言进行教学,让学生通过几门课程的学习,能够熟练掌握一种统计分析软件。

3.3基于项目驱动对教学内容进行整合及优化,调动学生主动参与

例如统计学课程介绍了基础性的统计分析方法,在后续课程经济计量学、多元统计、数据挖掘与大数据分析中引导学生运用基础性统计分析方法,对数据进行初步的统计分析和整理,为经济计量分析、多元统计、数据挖掘做好数据处理上的准备,让学生体会到关联课程中所学知识的联结。鼓励学生积极参与“三下乡”活动,开展田野调查实践,围绕“三农”开展调研,运用统计和计量方法对调研数据进行分析,鼓励学生参与到教学中来,培养学生的学习兴趣,学以致用。

3.4建设“项目驱动”实践教学模块

结合农经专业课程体系,建设数据分析课程群“项目驱动”实践教学模块。在农经专业的课程体系中开设的农业经济学、农产品贸易、农村社会学等专业性课程对大量的“三农”问题进行了探讨,这类课程中涉及的城乡差异问题、收入和消费问题、农产品价格波动、农产品贸易等现实问题的研究,都离不开基于现实数据的定量分析。因此,在农经专业的数据分析课程群中可以结合教学内容引导学生对专业课学习中热点问题的研究,围绕课程教学大纲,建设“项目驱动”实践教学模块,理论联系实际,让学生在研究项目中运用所学的数据分析方法,加深对专业知识的理解。

4农经专业数据分析课程群优化方案

在大数据时代,数据分析能力是学生的核心竞争力之一。数据分析类课程在建设中要强调理论与实践的结合,不能只是将教学停留在课堂上,引入体现专业特色的实践教学环节。可以从以下几方面开展数据分析课程群的优化:第一,数据分析基础类必修课安排在大一学年。在第1学期,可以安排R入门、Python入门、数据可视化课程,让学生尽早接触当前主流的数据分析软件,激发学生对R或Python的学习兴趣,让学生自我拓展学习空间。R入门、Python入门、或者数据可视化课程都属于数据分析的基础课程,无需其他先修课程。在这一时期,让学生开始接触数据分析软件,学习数据可视化的分析工具,有利于培养学生的数据思维、数据意识和软件实操能力。第二,将与农经专业课有关的专业必修课统计学、经济计量学安排在第3-4学期学习。统计学课程需要学生先行修读高等数学和概率论课程,经济计量学需要学生先行修读微观经济学、宏观经济学,因此可安排在第3-4学期。让学生在掌握了一定经济管理专业知识后,可以更好地体会统计学、经济计量学方法论学科的应用价值。第三,将数据分析进阶类选修课多元统计、大数据分析、数据挖掘、机器学习等课程安排在第5-6学期。为高年学生提供丰富的数据分析类选修课,让学生结合自己的兴趣、未来的发展规划学习更加多元化的数据分析技术。鼓励学生能在专业论文习作、学科竞赛中有更多的机会运用自己所学的数据分析方法,增加学生的收获感和成就感,挖掘学生的学习潜力。第四,改革课程考核评价体系,采用项目式管理和评估的思路,由学生自主开展一个数据分析项目,从收集数据、提出问题、分析数据到提炼研究结论,开展小组团队成员互评。教师跟踪学生的项目开展过程,从学生的学习态度、投入程度、数据分析质量等综合评价学生的学习效果。

5结束语

将项目驱动教学引入到农经专业数据分析课程群的建设,让学生参与到教学中去,突破传统教学中“教师教学生学”的局面,让学生通过参与项目,运用数据分析方法解决项目中的实际问题,激发学生的学习兴趣和潜能,让学生体会到所学知识的应用价值,让学生不再对数据分析类课程望而生畏。本文的研究对于农经专业学生数据分析能力的培养有重要的意义,强调理论与实践的结合,提高学生数据分析的高阶能力,也能为同类课程开展项目驱动教学提供借鉴。

参考文献:

[1]农业农村部中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].

[2]李虹贤.农业经济管理专业人才培养模式创新研究与实践[J].智慧农业导刊,2022,2(7):110-112.

[3]冯开文,陶冶.农业经济管理专业实践教学改革———以中国农业大学经济管理学院为例[J].教育现代化,2017,4(23):54-56+63.

[4]杜洪燕,陈俊红.乡村振兴背景下中国数字农业高质量发展路径研究[J].南方农业,2021,15(21):213-214.

[5]金娥.基于项目式学习的《现代教育技术应用》课程学习框架的设计与实践研究[D].武汉:华中师范大学,2021.

篇(9)

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)49-0248-02

随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、互联网应用的丰富,更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代已经来临,它对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。大数据是指海量数据集,其来源包括动漫数据、企业IT应用带来的数据、博客、点击流数据、社交媒体、机器和传感数据等。它是互联网、电子商务的又一次重大革命,对数据处理、数据挖掘、数据分析提出了新的挑战。如今互联网行业、电子商务行业中的数据应用及分析已经相当普遍,为了应对大数据时代的要求,同时要具备较强的统计学功底和娴熟的计算机软件运用能力,而今完全具备这些能力的数据分析专业人才是极其匮乏的。数据分析师便应运而生,不仅互联网行业、电子商务行业需要大量的数据分析师,近年来项目数据分析事务所不断涌现,而项目数据分析师因其专业技能及量化的数据分析为客户以及所在单位控制决策风险、保证利益最大化而备受各界青睐,以待遇优厚和地位尊崇而闻名国际,也被视为我国21世纪的黄金职业。《华商报》将项目数据分析师纳入了新七十二行,《HR管理世界》将项目数据分析师评为七大赚钱职业。本文就如何在统计学专业开展数据分析方向进行了阐述,首先论述了数据分析的重要意义,其次讨论了数据分析方向的课程构建,最后分析了如何加强理论与实践环节的结合。

一、数据分析的重要意义

大数据预测美国总统:美国时代周刊报道称,数据驱动的竞选决策才是奥巴马竞选获胜的关键。数据分析团队在筹集竞选经费、锁定目标选民、督促选民投票等各个环节的决策中都发挥了重要作用。这意味着华盛顿竞选专家的作用极具下降,能够分析大数据的量化分析家和程序员的地位却大幅提升。如今从事专业数据分析工作的企业如项目数据分析师事务所、数据挖掘公司等都应市场需求而大力发展,并且受到风险投资的青睐。如美国社交数据挖掘公司Datasift于2012年宣布,获得1500万美元风险投资。2013年,DataSift成为Twitter的“认证合作伙伴”,主要负责海量微博社交数据分析。这是该公司今年第二笔融资,五月份其曾融资720万美元。又如面向开发者的大数据应用软件平台服务提供商Continuity最近获得1000万美元的融资,目前融资总额已经达到1250万美元。

数据分析的应用无处不在,那什么是数据分析呢?数据分析就是用适当的统计方法对数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析技术不仅能通过对真实数据的分析去发现问题,还能够通过经济学原理建立数学模型,对投资或其他决策是否可行进行分析,预测未来的收益及风险情况,为做出科学合理的决策提供依据。在提高工作效率的基础上,也增强企业管理的科学性。无论是在国家政府部门,还是企事业单位中,数据分析工作都是进行决策和做出工作决定之前至关重要的一个环节。因此,针对项目可行性、风险承载力、投资回报率以及相关经济效益指标等方面的分析工作显得格外重要。在这个工作过程中,专业的数据分析人员扮演着无比重要的角色,数据分析成果的质量高低直接决定着项目投资、企业经营决策计划最终的方向。所以,各个行业对数据分析人员的需求之多是不言而喻的。传统行业,如政府机构:一类是计委、经委、统计局等一些经济综合管理部门所设有的调研处、研究室和情报所。第二类是商业、粮食、物资、银行等经济主管业务部门会设有信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。而伴随着数据分析应用的扩大,其在新兴行业中也得到了发展,如计算机软硬件及IT行业、电子商务与网络游戏、金融保险、消费品、咨询业与广告媒体、大型设备与重工业以及房地产行业等对数据分析师的需求量很大,尤其是电子商务,由于利用互联网,能够比传统零售业具有更好的数据收集和管理能力,能积累海量的数据,因此更看重从海量数据中挖掘出用户偏好和市场机会。研究机构:比如市场研究公司、咨询公司、证券公司、研究院。自主创业:取得注册项目数据分析师(CPDA)资格证可以自主创建或就业于项目数据分析师事务所等。所以,数据分析的行业应用是极其广泛的,并且随着大数据时代的到来,数据分析尤其是数据挖掘将借助互联网的发展,逐步形成人们依靠的重点,并可能成为未来发展与竞争的重点之一。由此我们可以看到数据分析师的就业前景是非常广泛而乐观的,无论是数学专业、统计专业,还是计算机专业的学生,都可以通过系统的学习数据分析课程来适应对数据分析人才的要求。

二、课程体系构建

1.主干课程。主干课程包含高代、数分、概率论、数理统计、多元统计分析、时间序列分析、市场调查与分析、统计预测与决策、数据结构、C语言、数据分析、数据挖掘、大数据分析与展示。理论课程的学习可以使学生了解数据分析的基本内容,学会如何对已获取的数据进行加工处理,如何对实际问题进行定量分析,以及如何解释分析的结果。掌握几种常用数据分析方法的统计思想及基本步骤,并具备一定的分析论证能力。

2.实验课程。数据分析的操作离不开计算机。目前数据分析行业常用的一些统计软件有SAS、SPSS和R软件。SAS软件是一个模块化、集成化的大型应用统计系统。它的功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。SPSS软件是一个社会科学统计软件包,是采用图形菜单驱动界面的统计软件,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。R软件是一套完整的数据处理、计算和制图软件系统,包括:数据存储和处理系统、完整连贯的统计分析工具、优秀的统计制图功能、可操纵数据的输入和输入等功能。这三个软件在数据分析中针对不同行业的需求有不同方向的应用。

3.专业课程。从数据分析的行业需求出发,好的数据分析人员不仅要有较强的数据分析能力,还要有该行业的背景及相关知识的储备,这样才能将数据分析与行业特性联系起来,发挥数据分析的最大功能,即所谓的“因地制宜”。同时要兼顾学生的兴趣与学习的联系,需提供多领域的课程选择,如:经济学、金融学、保险学、管理学、会计学等。而在软件学习方面也要拓宽渠道,除了实验课程安排学习的软件,学生可根据自身发展意向再多掌握一些软件如:SQL数据库,熟悉office常用功能,尤其熟练运用Word和PowerPoint、Excel图表及数据分析等。同时还应该结合对数据分析师的要求设置一些相关课程:投资数据分析、市场调研与预测、预测技术分析、现金流量表编制、风险投资项目筛选、不确定性分析、编制数据分析报告等。

三、实践环节

培养数据分析的专业型人才目的就是为了学以致用。数据分析本身就是为了从数据中发现问题、建立模型、预测收益风险企业决策进而做出合理正确的决策判断。因此,学习了基本的知识和技能就要运用到实际操作中。学校可以和本地的数据分析事务所,或者大量需求数据分析人员的互联网行业建立实训基地,进行合作式教学,使得学生在实习的过程中能够理论联系实际,切身体会数据分析的商业操作体系,这样就能够促进学生有目的、有取舍地针对自身情况学习钻研,继而就能够培养出适应经济发展,满足市场需求的应用型人才。

四、结语

在大数据时代到来之时,数据分析在互联网中的应用将会空前广泛,与此同时对数据分析师的需求也将会井喷,无论是在军事、工业、企业还是在政治上,大数据分析都将会十分紧缺。因此,目前对数据分析师的培养刻不容缓。本文从分析数据分析行业发展及其重要意义、数据分析专业课程设置以及教学实践环节方面对构建数据分析课程体系进行了探讨。不仅从教学课程的内容上予以安排,而且更加注重引导学生自主学习,特别强调理论结合实践的合作式教学。希望能够结合行业需求合理地构建课程,培养出专门从事数据分析的项目数据分析师,从而能够满足市场需求和自身发展。

参考文献:

[1]范金城.数据分析[M].科学出版社,2010.

篇(10)

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)43-0101-03

一、研究背景

自2002年桂林理工大学在广西开办了第一个统计学本科专业以来,针对当时理学学位的统计学专业培养的学生虽然数理基础相对扎实,但普遍统计思想不够,实际应用能力较弱的现状和特点,对统计学专业进行了全方位的改革研究,确立了"数学与统计学相融,从培养学生扎实的数理基础和极强的统计分析应用能力有机相结合的理念出发,构建了新的课程体系和教学内容,取得了系列研究成果。2009年研究成果开创“应用性、实验性、案例性”一体化的统计学专业课程体系和教学模式,获得广西高等教育自治区级教学成果二等奖[1],并在其后分别把统计学学科建成广西重点学科和广西高等学校优势特色专业,以及把应用统计实验室建成广西高等学校重点实验室。

虽然我校统计学专业的教学改革和建设取得了许多成果,但近几年,我们也逐渐感觉到在大数据新形势下,我校应用统计学专业的教学体系还有一些不适应的地方,且某些问题还有日益凸显的趋势,我们原来的某些研究成果已不再适应新时代的要求,这就迫使我们继续进行改革研究,探讨在大数据背景的新形势下,如何培养统计学专业复合型和应用型人才,如何准确把握统计学的发展方向与发展形势,如何调整人才培养模式,如何调整相关课程和课程内容,以培养适应大数据背景下社会经济发展需要的统计学专业人才。

许多国家越来越重视数据在大数据时代重要作用,我国也不例外,2012年9月,国家统计局第7次局务会提出,尽快开展在政府统计中应用大数据的研究。2013年可以看作是我国政府统计之大数据元年。2015年9月《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)[2]颁布,标志着我国正逐步进入大数据建设的新时代,为此,国家统计局积极推动大数据在各方面的应用与实践。而大数据的核心是数据,应用统计学学科是与数据分析处理联系最为紧密的应用性学科,因此,应用统计学专业的教学体系应顺应大数据发展的趋势。在大数据背景下,应用统计学专业在继承传统数据分析技术的基础上,对所需的数据处理技能提出的需求更高了。这就是说,大数据对应用统计学的培养目标,以及教学内容等的冲击无疑是最大且不可避免的,这给应用统计学专业带来了巨大的挑战,同时也为应用统计学学科的发展带来了前所未有的机遇。

大数据逼迫人们改变分析、处理数据的手段、思维和理念,这就逼迫应用统计学专业改革必须引入新手段、新思维和新理念。培养应用统计学人才必须与时俱进,才能不断适应大数据新时代的要求,这关系到应用统计学专业培养的人才能否适应和满足社会的需求,因此,这一研究是十分必要、十分迫切且有着重要的理论和实际应用意义。

篇(11)

预测性分析。大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。

语义引擎。非结构化数据的多元化给数据分析带来新的挑战,我们需要一套工具系统的去分析,提炼数据。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。