前言:我们精心挑选了数篇优质大学数学统计学文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词:统计学;大数据;利用;发展
统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。随着统计学夜上海论坛发展的同时,一个大规模生产、分享和应用数据的时代正在开启:大数据的真实价值就像漂浮在海洋中的冰山,绝大部分的数据都隐藏在表面下等着人类去探索。
1 利用所有的数据
在传统的统计学中,由于记录,存储,分析数据的工具不够好,所以总是倾向于从总体中抽取样本来分析,因为统计学的一个目的就是用尽可能少的数据来证实可能重大的发现。统计学家证明:采样分析的准确性随着采样随机性的增大而大幅度提高,但是与样本数量的增大关系不大。当样本数量达到了某个值的时候,从新个体身上得到的信息会越来越少,就同经济学中的边际递减效应一样。
夜上海论坛 在大数据时代,不使用随机分析的方法,而是采用所有的数据。即“样本=总体”。统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的。慢慢的,就会抛弃样本分析。
2 接受不精确
对小数据而已,统计学已经可以把数据处理的很好了,但是在大数据时代,太多的数据使原始统计方法捉襟见肘,因为数据量的大增会使得结果不太精确。执迷于精确性是信息缺乏时代和模拟时代的产物,只有接受不精确性才能进入我们从未涉足的邻域。接受不精确是从“小数据”到“大数据”的重要转变之一。因为拥有更大的数据量所带来的利益远远超过增加一点精确性,所以也就能够接受不精确的存在了。要想得到大规模数据带来的好处,混乱应该是一种标准途径,而不应该是尽量避免。
夜上海论坛 3 追求相关关系而不是确定因果
在小数据时代,相关关系也是有的。统计分析的目的在于如何根据统计数据确定变量之间的关系形态及其关联的程度,并探索其内在的数量规律。人们在实践中发现,变量之间的关系分为两种:函数关系和相关关系。相关与回归是处理变量之间的一种统计方法。变量之间存在的不确定的数量关系,称为相关关系。一般来说,可以用散点图和相关系数来描述和测度相关关系。
相关关系的核心是量化两个数据之间的数理关系,它没有绝对,只有可能性。大数据的相关分析法更准确,更快,而且不易受偏见的影响。知道是什么就够了,没必要知道是什么。通过探求“是什么”而不是“为什么”,相关关系帮我们更好的了解这个世界。如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。
夜上海论坛 4 数据的来源并非那么简单
在一般看来,要想得到一些你所需要的数据是需要通过各种不同方法测量或是记录才能得到,而有时候,数据会从你意想不到的地方得到。也许你精心地设计了你的实验或是探究,但是到了真正操作才会发现事情并不像你想象的那么简单。
首先,由于在大数据时代,数据不是那么的有规律,所以才要考虑数据的一系列问题。这些数据或是资料是不是一定要自己去得到,或是可以参考别人已经有过的结果,这样可以节省精力和时间。如果是参考别人的数据要考虑时效性和使用范围。也许不是专门为你的设想而准备的数据。大的数据库有着小数据库所没有的价值,大数据的核心就是挖掘出大的数据库所拥有的独特的价值。
5 数据的利用方式
夜上海论坛 在统计学中,对数据的利用不仅包括对数据求平均值,方差,分位点,可以的话还要得到数据中的某种关系或是联系,如父母的身高会不会对下一代产生影响,不仅要分析父母的身高,还要分析孩子的身高,从中发现有没有相关关系,得出自己的结论。
在大数据时代,数据没这么简单的让你下手,所以对数据的利用方法也随着情况的不同而不同。数据的用途已经从基本的用途移动到了二级用途,使得数据随着时间的推移而变得更有价值。明白了隐藏在冰山下面的绝大部分数据的价值后,创新型企业就能够提取其潜在价值并获得潜在的巨大收益。尽管如此,数据再利用的重要性还没有被充分认识到。要解锁这些数据,就必须通过新一代统计人员的不懈努力并借助新一代的方法和工具。
随着大数据的出现,数据的总和比部分更有价值。将数据的总体组合在一起,重组组合本身的价值也比单个更大。如果决定使用有生产价值的数据,就需要不断的更新数据库并淘汰无用的信息。即使数据基于基本用途的价值会减少,但潜在价值却仍然强大。潜在的数据价值需要通过创新的分析来释放。不出意外,给数据的潜在价值贴上价格标签会带来无限商机。
6 小结
个人认为统计学和数据挖掘一起可以更好的利用数据。一个可以对数据进行有效合理的分析,一个可以用多种多样的算法来更好地处理数据。在大数据时代,重要的是数据自身和大数据的思维观念。如果能做到数据,技能和思维三者具备,就能更好地服务于大数据时代,就能在大数据时代有非常大的竞争优势。
参考文献:
大学数学教学大纲
课程代码318.009.1编写时间
课程名称数理统计
英文名称Statistics
学分数3周学时3+1
任课教师*徐先进开课院系**数学学院
预修课程
课程性质:
夜上海论坛 本课程为数学学院本科生开设,是概率论基础的继续,介绍数理统计学的基础知识。
基本要求和教学目的:
课程基本内容简介:
夜上海论坛 数理统计是一门理论研究与数学实践相结合的学科,它区别于概率论基础部分,不从概率空间出发,而是考虑如何给随机现象装配一个概率空间。
夜上海论坛 数理统计学研究数据资料的收集、整理、分析和推断,广泛地应用于社会科学、工程技术和自然科学中。
教学方式:
教材和教学参考资料:
夜上海论坛 作者教材名称出版社出版年月
教材概率论,第二册,数理统计(两分册)人民教育出版社1979
夜上海论坛 参考资料陈希孺数理统计引论科学出版社1981
峁诗松,王静龙,濮晓龙高等数理统计高等教育出版社,施普林格出版社1998,2003
J.O.BergerStatisticaldecisiontheoryandBayesionanalysis,2ndedition
夜上海论坛 中译本:贾乃光译,统计决策理论和贝叶斯分析Springer-Verlag,NewYork
中国统计出版社1985
1988
教学内容安排:
第一章引论
夜上海论坛 本章的教学目的是阐述数理统计学的基本问题,介绍数理统计学的基本概念。指出了现阶段的教学内容是研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,而不是考虑如何设计获得数据的试验。
统计量是从数据中提取信息的工具。本章介绍了两种常用求估计量的方法,介绍了刻画统计量性能的一致最小方差的概念。
§1统计学的基本问题
§2数理统计学的基本概念
夜上海论坛 §3求估计量的两种常用方法
夜上海论坛 §4一致最小方差无偏估计
第二章抽样分布
本章假定待研究的母体服从最常见的正态分布,导出了常用统计量,,的分布。本章的结论是对小样本讨论的,由于正态分布的特殊性,它们也可作为大样本情形的极限分布。
本章还介绍了与正态母体相联系的柯赫伦定理与费歇定理。
§1正态母体子样的线性函数的分布
§2分布
§3分布和分布
夜上海论坛 §4正态母体子样均值和方差的分布
第三章假设检验(I)
本章的教学目的是让学生认识到参数估计、假设检验和区间估计是针对问题的不同性质而作的三种统计推断,掌握并正确理解显著性检验问题的处理步骤。在本章的执行过程中,给出了一些典型的假设检验问题的分析和理解,以帮助学生掌握和运用这一统计思想。
本章介绍了具有一般意义的广义似然比检验。
§1引言
§2正态母体参数的检验
夜上海论坛 §3正态母体参数的置信区间
§4多项分布的检验
§5广义似然比检验
第四章线性统计推断
夜上海论坛 本章主要讨论数理统计学中两类重要的问题,线性模型和回归分析,介绍了处理另一类问题的方差分析。在数学过程中,解释了在复杂问题中使用线性模型的合理性,也分析了统计假设在实际问题中的意义。
在本章的执行过程中,比较了回归分析与线性模型的异同点。
§1最小二乘法
§2回归分析
§3方差分析
第五章点估计
本章从理论的角度讨论了一致最小方差无偏估计的性质。介绍了一些寻找一致最小方差无偏估计的方法。
夜上海论坛 §1最小方差无偏估计
关键词:大数据;统计学;教学改革
夜上海论坛 伴随着网络信息计算的急速发展,各领域数据以迅雷不及掩耳之势的速度不断更新,同时人们对数据的看法也在不断变化,采取的决策也在不断深化,人们在各个领域做出的决策都在由“以业务为中心”向“以数据为中心”转变。有人说,获取数据的人将获得世界的青睐,因此,对数据的统计与分析能力是当今一项非常重要的技能[1]。
统计学作课程作为各大高校开设的一门必修课,在学生接受的课程教育体系中起着重要的基础作用。同时随着各行各业数据分析的深入,高校统计学课程也必须顺应时展,进行教学改革,力争培养能毕业后与各行业顺利对接、有较强数据分析能力的人才。
一、当前统计学课程教学中存在一系列问题
当前,统计学课程教学中有一些不尽如人意的地方,无论是教学大纲的编制、教学进度的安排还是教学中采用的软件应用性上,都有一些小问题,给教学工作者带来很多困惑。
(一)教学大纲内容多,教学时长却较以往更短
夜上海论坛 高校一般每学期都会就下一年上统计学课程的该年级学生编制教学大纲,大纲内容全面、综合,涵盖了几乎统计学教材中的全部知识。统计学知识点包括导论、数据的收集、整理、分析、抽验分布、参数估计等。内容多,且覆盖范围广,且要求学生有較好的数学基本功,能快速理解、掌握每个公式和理论背后的含义。同时,为提高学生处理数据的能力,大纲中还要求给与一定数量的实训学时,要学生掌握SPSS,SAS等统计软件。目标很好,希望学生能真正掌握统计学课程的精髓。只是时间太有限,学校分给学生学习统计学课程的时长只有48学时,有一学期甚至压缩到了32学时,课堂教学时明显感觉时间紧,无法详细讲述书中的重要知识点,课堂上老师只能走马观花的讲讲重点,学生听的也是懵懵懂懂,知其然不知其所以然,不能理解定理、公式背后的含义,学习效果没有想象中好[2]。
(二)学生基本功不扎实
夜上海论坛 统计学课程本质上是采用的数学方法,其理论基础是微积分和概率论基础等数学系课程。对于非统计专业的学生而言,数学课是从小就伴随着他们的噩梦,从小就缺乏学习数学、利用公式解决问题的兴趣。进了大学后,更为枯燥、深奥的符号在他们看来更是一场莫名其妙的游戏,内心不愿参与到这场游戏中,只能形式上听一听,至于老师上课时传授的内容和精髓,则根本不曾记住过。薄弱的数学功底导致了他们在学完微积分、概率论后接触统计学课程时无法理解统计学里的基本知识,甚至大数定律、中心极限定理这些最基本的统计知识他们都无法理解其深意。
(三)学生以考试及格为目标,重理论轻实践
夜上海论坛 统计学考试方式为理论考试,无上机操作考试。虽然教学大纲中明确要求有一定比例的实训学时,只是由于统计学课程知识点繁多,有些老师为讲完理论知识,不得已压缩学生上机操作的时间。而大部分学生上统计学课的目的是为了及格,也不重视统计软件的操作,导致通常一学期的课结束了,学生还不会使用SPSS软件进行聚类分析。造成了学生处理数据的能力非常差,进入企业工作后一定要接受额外培训才能分析数据,这与企业所需人才严重脱节。
夜上海论坛 (四)教学方法陈旧,不能采用新型教学手段
夜上海论坛 现在的统计学课程几乎还是采用满堂灌的填鸭式方法教学,老师在课堂上讲,学生在课堂听,整堂课下来,老师筋疲力尽,学生听得味同嚼蜡,有些地方没跟上老师节奏的,后面便再也不去听了,课堂效率低。如今互联网时代,很多新的教学方法应运而生,如微课+翻转课堂、对分课堂等,且这些方法是行之有效的,可以调动学生学习能动性。而统计学课堂却没有采用这些教学方法。
(五)统计学教材与当今大数据时代脱轨
很多高校给学生上课前选教材时都会选国家级规划教材,希望这些教材能保留统计学的精髓知识的同时,也顺应当今大数据时代的要求,倾向于讲述提高学生数据处理能力。只是老师们在选教材时还是会发现两难全。
统计学教学中有很多亟待提高的地方,基于此,统计学教学改革势在必行。
夜上海论坛 二、统计学教学改革措施
大数据时代,统计学课程可充分利用时代给予的“数据”红利,充分发挥工具的作用,将统计学中的方法充分与数据结合,使学生能自如运用统计学知识处理数据,并挖掘数据背后的含义。统计学教学改革可侧重以下几个方面:
(一)编制合适的教学大纲,制定相应的教学时长
教学过程中一定要分清重点,主次分明,不能什么都视为很重要的知识点。适当调整授课节奏,重点知识重点讲解,非重点知识可一语带过甚至不讲,编制合理的教学大纲。同时教学中注意尽量减少一味的讲公式、定理,要针对性教学,针对非统计学专业的学生,可尽量减少讲解定理的证明,多讲些现实中定理的应用,可穿插案例教学。讲授过程中慢慢引入统计工具与技术,力争理论与实践相结合,以适应大数据时代分析数据的需要。另外,可制定合适的教学时长,32学时只是入门级教学,可根据学生的专业适当延长学时。
(二)重视上机操作,提高实践操作的重要性
大部分非统计学专业的学生上统计学课是因为必修,为了修学分而上这门课。本着及格即万岁的小算盘,课堂上玩手机睡觉,平时得过且过,考前学习一下老师画的重点题,一学期轻松飘过。为让学生真正掌握统计方法,成为新时代需要的人才,可提高上机操作占学生成绩的比重,增加实训课时,并给学生分配任务,学会用主成分分析处理哪些问题,学会SPSS中的哪些统计方法。每次实训课结束前,要求学生上机演练一遍得出结果方能下课。且上机操作的表现可折合成平时成绩,作为学生总成绩的一部分;或者期末考试前会有一次上机操作考试,分数作为总评成绩的一部分。大数据时代,学生们一定要有使用简单的基础软件对数据处理的能力。而能力的培养,除了学生本身的兴趣外,还要从制定相应的制度强制学生树立自我培养的意识开始。
夜上海论坛 (三)注重案例分析,注重实用性,鼓励学生参与课题或比赛
统计方法的学习是为了以后更好地应用。为了增加学生学习的能动性,教学中可以通过案例分析的方法,将现实中实际问题和数据作为分析对象,并考虑现实背景,教授学生采用何种统计方法能更好解决问题。这种方法不仅能帮助学生长见识,拓宽视野,更能让学生切实感受到什么叫学以致用,感受到为未来进入职场积淀知识,力争成为大数据时代的综合性人才的重要性。
同时也可鼓励学生申请或参加课题,培养发现现实问题、采用统计方法分析问题和解决问题的综合能力,一个课题从开始申请到顺利结项,绝不单单只靠几个分析方法就能解决的,它是对一个人或团队综合能力的考验,涉及到撰写文案的功底、将现实问题去粗取精后凝练成模型的能力,以及解決问题所采用方法的准确把握的能力等,整个过程需要有计划的进行,方能有条不紊的将课题完成。
夜上海论坛 目前,很多高校提供了培养学生创新创业能力的比赛,还有全国数学建模比赛等,这些平台和机会都可以帮助学生,他们用自身所学的理论和上机操作知识,紧随新时展,采用先进的数据分析方法,锻炼解决问题的能力。同时这些实践经验反过来正作用于课堂教学,提高学生学习兴趣,使学生更加有侧重点地学习。
(四)采用翻转课堂、对分课堂等新型教学方法
夜上海论坛 经验告诉我们,满堂灌的授课方式效果真的不是多好,激发学生兴趣,提高学生学习的能动性是关键。大数据时代,可以借助互联网信息技术新方法,利用翻转课堂、对分课堂等新的教学方法,提供平台和教学资源,让学生自主学习,之后可分组讨论所学知识,对于不清楚的可自行搜索或者上课讨论,课后总结,这样线上线下教学的方式,使学生主动掌握学习节奏,增强师生之间的互动性。
(五)选择适合学生的统计学教材
夜上海论坛 如今市面上的教材数不胜数,如何选择合适的教材让教学工作者颇为头疼。对非统计学专业的学生,可选择应用性强的近三年教材,侧重案例解析和上机操作的,尽量少一些定理、公式的证明,更多的侧重于应用,这样有利于让学生感受到理论知识的实际应用,培养创造性思维。
三、结语
统计学教学改革不是一蹴而就的,需要老师和学生的共同努力。本文基于当前统计学课程教学中普遍存在的问题,探讨了统计学课程教学改革的措施,如授课内容、考核方式等,从而提高教学效果,提高学生处理数据的能力。
参考文献:
夜上海论坛 [1]胡云霞.大数据背景下统计学教学改革与创新研究[J].现代商贸工业,2018,29(35).
[2]章政.大数据背景下经管类专业统计学课程教学改革研究[J].创新创业理论研究与实践,2019(24).