前言:我们精心挑选了数篇优质数据分析设计文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

关键词:习题设计;发展 ;数据分析观念
【中图分类号】G 【文献标识码】B 【文章编号】1008-1216(2016)12C-0029-02
简单的数据统计重在让学生经历数据的收集、整理和分析过程,掌握一些简单的数据处理技能,感受数据蕴含着的信息,培养初步的数据分析观念。在课堂教学中,这一核心知识受到教师的足够重视,然而我们的课堂时间有限,仅仅依靠教材提供的有限的统计活动还不足以发展学生的数据分析观念。如果能够依托统计教学的核心,灵活设计夜上海论坛习题,从不同侧重点进行有针对性的训练,有意识地让学生运用数据分析解决问题,将能发展学生的数据分析观念,使习题成为教材的有益补充。
夜上海论坛 一、丰富统计素材,主动收集整理数据
夜上海论坛 培养数据分析观念的首要方面是引导学生有意识地从数据的角度思考有关问题,就是遇到有关问题时能够想到通过设计简单的数据收集计划收集所需数据,解决所求问题,从而体会到数据是有用的,数据中蕴含着我们想要的信息。教师在进行练习设计时,要考虑不同年龄学生生活经验和认知水平的差异,赋予习题鲜活的背景,激励学生主动收集整理数据。
在学习了简单的统计图表之后,我设计如下统计练习:
夜上海论坛 夏天到了,吃冰激凌成为很多孩子的爱好,学校门前的张老板想通过一个调查来了解哪种口味的冰激凌在我们学校最流行。
夜上海论坛 (1)小组讨论:要完成这项任务,你们需要做哪些工作?请在下面的表格中,圈出需要的选项。
1 确定调查时间,设计调查用的统计表。
2 以小组为单位,每班随机抽取15名学生,对他们最喜欢的冰激凌进行调查统计。
3 以小组为单位,对我校学生的年龄进行调查统计。
4 汇总统计表,绘制条形统计图。
夜上海论坛 (2)小组合理分工,展开调查统计。
(3)根据分析结果给张老板提出一些建议。对爱吃冰激凌的同学又会提出什么建议?
夜上海论坛 吃冰激凌是孩子们的最爱,与学生的生活密切相关,很容易引起他们的共鸣。学生意识到要想帮张老板解决这一问题,调查收集数据是必需的,有用的,激发学生热情投身学习活动。真实的统计数据,会帮助张老板解决现实的问题。而对爱吃冰激凌的同学提建议,又有意识地对学生进行健康常识教育。由扶到放的习题设计,帮助学生逐步提高开展实际调查的能力。
二、精心设计问题提高分析数据信息能力
从不同角度分析数据,以便从数据中获得尽可能多的信息,并发现蕴含其中的一些规律,是数据分析观念的基本内涵之一。练习中通过精心设计问题串,引导学生从不同角度理解和分析数据信息,感受数据分析方法的多样性,并为发现和提出更有意义的问题提供机会。
小明家每两个月交一次水费,每次用水的吨数如下表:
月份 1~2月 3~4月 5~6月 7~8月 9~10月 11~12月
用水量(吨) 8 5 6 16 7 6
根据上表回答以下问题:
(1)从上表中知道,用水量最多的是哪两个月份?最少呢?分别占全年总用水量的百分之几?
(2)全年平均每个月用水多少吨?
(3)根据生活常识,你能解释一下为什么7~8月份的用水量最多吗?
夜上海论坛 (4)如果想说明7~8月份的用水量比全年的1/4还多,选( )统计图表示最容易使人明白。
本题中前两题从一组数据的极值入手,大致了解数据的分布范围,对于家庭用水量有个初步了解。然后通过计算解决其中一个月份与全年之间的关系,并通过平均数分析用水情况,对于出现的极端情况,尝试利用生活常识进行解释,使学生体会极端数据出现的原因,最后通过选择统计图,加深对各种统计图的特征的把握,进一步增强学生根据解决问题需要灵活选择统计图分析数据的能力。
三、连贯使用数据提高收集整理数据意识
夜上海论坛 对于同样的数据,由于背景和目标不同可以有多种分析的方法,需要根据问题背景选择合适的方法。每年学校都会组织学生进行体检,我将学生的身高情况及时收集,保存。在解决“ 铁道部门规定,儿童身高在120厘米以下乘火车免票,120~150厘米之间享受半价。我们班有多少人乘火车可以享受免票?有多少人需要购买全价票?”这一习题时,我组织学生讨论并形成一些可行的收集学生身高的方法,将最近学生体检的身高数据及时呈现在大屏幕上,学生感到非常惊讶,感到老师真是个有心人,根据提供的数据学生很快列表整理信息,顺利解决问题,老师这种收集和整理重要数据的习惯,使学生也受到潜移默化的影响。这时,我进一步追问,看到这些身高的数据,它们还能帮助我们解决什么问题。学生想到可以了解自己身高在班级处于什么情况,学校可以根据身高给我们定做课桌椅,可以定做校服……这时我又呈现,定做校服时大号、中号、小号和特号相关的身高要求,然后让学生根据需要重新对刚才的数据进行分组整理。通过变换问题情境,使学生体验到同一数据由于要解决的问题不同,整理、分析的方法往往会不同。
到了五年级学习了折线统计图,我再一次将学生身高情况呈现给学生,不同的是这次我将每个同学1~5年级的身高情况都呈现出来,学生感到非常兴奋,“你能将自己这5年的身高情况绘制成折线统计图吗?”,学生绘制非常用心,在组内交流近5年身高增长情况时更是积极主动,分析得头头是道。这时我又引导学生根据自己身高增长情况对六年级的身高进行预测,并学习老师,做一个“数据收藏家”,记住自己的身高,到时看看自己预测得准不准。
等到六年级复习时,我再次呈现,学生将六年来的身高增长情况绘制完整,并检验自己的预测,同时对自己15岁时的身高情况再次进行预测,此时,给学生增加了我市近年来男、女生平均身高增长统计图,发现男女生13~15岁身高增长的一些规律,很多同学又调整了预测。同样的身高数据由于解决的问题不同,分析方法大不相同,对数据进行横向及纵向的比较,会使我们的判断和预测更准一些。
夜上海论坛 四、巧设矛盾冲突促进动手实验能力提升
夜上海论坛 游戏是激发学生主动参与统计活动的很好方式,在游戏实验活动中通过数据体会概率事件的随机性,在教学可能性时,我设计这样一题:
夜上海论坛 小明和小军两人玩游戏,袋子里放有2个和1个,每次任意从中摸出两个图形,摸完后放回,如果摸到的两个图形能拼成平行四边形为小明赢,如果能拼成小房子图形,则是小军赢。你认为这样的游戏公平吗?同桌的同学玩一玩,看看拼成哪种图形的人赢的次数多?想想为什么?
游戏中的三个图形中有两个是相同的,任意从中摸两个,结果只有2种情况,学生很容易认为游戏是公平的,实际上两种情况出现的可能性大小不同,极易引发学生争辩,促使学生主动通过实验活动求证结论。动手实验正是学生体会随机现象的最佳路径,通过学生的实验,认识到游戏的设计是不公平的,与原有猜测产生冲突,学生急于一探究竟,发现小军赢的可能性会大一些。当然,游戏试验中,也会出现拼成平行四边形的次数等于或超过小军的现象,这一非常规情形的出现也是体会随机现象的重要资源,使学生深刻体会小军赢的可能性大一些,游戏是不公平的,但是小军不会一定赢,更有利于学生感悟随机现象的特点。
五、适度综合运用,全面感受分析数据的意义
夜上海论坛 统计与概率的内容和其他数学领域的内容有着紧密的联系。这部分课程的教学,应为发展和运用比、分数、百分数、度量、图像等概念提供活动背景,为培养学生综合运用知识解决问题能力提供机会。
王阿姨在汽车销售公司上班,工资由基本工资和销售奖金组成,即每销售1辆汽车给予一定数量的奖金。下表显示王阿姨今年3~6月份销售汽车的辆数与工资情况:
夜上海论坛 销售汽车辆数 8 10 11 12
夜上海论坛 月工资(元) 3000 3300 3450 3600
夜上海论坛 根据上表提供的信息你能算出王阿姨的基本工资是多少,每销售1辆汽车的奖金是多少元吗?
夜上海论坛 本题紧密联系社会生活实际问题,学生需要在认真理解题意的基础上,借助计算分析题中的数量关系,发现不同信息之间的联系,从而得出正确的计算方法,提升学生数据分析能力,在综合解决问题的过程中全面感受分析数据的意义。
夜上海论坛 商务平台商品数据分析系统集数据获取、数据统计和分析,系统设计有如下考虑:
1)商品ID号:根据上线商品的ID号直接获取商品的评论,并对评论进行等级评定;
2)评论平均分:计算评论平均分,据此可判断商品是否合格;
3)评论分分布:计算评论的合格数及其比例。等级评定时是多个操作人员同时对同一商品数据进行评论操作,评论评分定级是人工进行的,操作人员的主观对商品评论操作有一定影响。因此需要将所有操作人员的评论评分数据进行统计对比分析,以控制整个评定的有效性。
2系统设计
本系统根据MVC的三层框架,利用JSP技术制作动态网页,通过JDBC技术访问数据库,使用JSP作为服务器端应用程序处理客户端的请求并在Web服务器中进行业务逻辑处理并返回客户端请求的结果。在JSP里嵌套HTML以及CSS对WEB页面进行设计,引入Bootstrap封装的样式,达到系统数据呈现的设计要求。页面数据呈现与后台数据交互是整个系统的核心,对数据进行归纳计算和整理并呈现到用户界面上。用户只需获取到公司平台上线商品的ID号就可以通过系统抓取商品评论数据;同时对数据进行整理分析得到评论平均分、评论分数比例等数据;同时可以系统整理分析出整体上线商品的整体趋势,通过饼状图直观地看出商品的品质分布。
夜上海论坛 2.1系统功能结构设计
夜上海论坛 商务平台商品数据分析系统分为三个模块,八个基本功能,分别是管理员登陆、用户登陆、用户注册、商品评论抓取评分、商品评论数据的统计和分析、用户管理和修改密码等。
1)管理员登陆:管理员输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是字母,密码字母和数字皆可。管理员是系统指定的,不可以注册。
2)用户登录:普通用户输入用户名和密码,数据经由UIServlet传递给ControllerServlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是6-20位字母,密码是6-15位字母和数字组合皆可。若没有账号,可以在用户登录JSP页面点击注册,通过UIServlet跳转到注册页面。
3)用户注册:用户注册需要输入Email、用户名、密码等信息,Email有格式判断,必须输入正确的格式,用户名必须是6-20位字母,密码是6-15位的字母数字组合皆可。输入正确后可以成功申请新用户,随后跳转到普通用户登录界面登录系统。
4)商品评论抓取评分:普通用户与管理员皆可操作,在输入框中输入商品的id号,点击查询,就可获取到“淘宝网”中商品的前一百条评论,并且按照评论时间顺序进行呈现。其后的评分框,按照规定只能输入1-5的数值,同时点击保存,数据就会存入数据库中。
夜上海论坛 5)商品评论数据统计:此功能方便普通用户清楚的跟踪自己的工作进度,对于管理员可以掌控平台上线商品的商品质量,会显示出该操作人员所操作的所有商品的平均分、合格率,可以看出该操作人员操作的商品评分状态详情。
6)商品评论数据分析:此功能为管理者观察网站整体上线商品的质量分布,点击查询,会统计所有使用系统的普通用户操作过的所有商品数的评论数据。如此管理者可以通过这些数据对网站上线商品进行调整。以操作人为条件,区分每个人的操作数据,可以控制一定的主观误差,还有整体的上线商品的趋势。普通用户可以看出自己的主观意见和其他用户的差别。
夜上海论坛 7)用户管理:管理员可以对普通用户进行增加和删除,用户管理界面对普通用户不可见。管理员有权限重置普通用户的密码。
夜上海论坛 8)修改密码:管理员和普通用户都可以自行更改密码。
夜上海论坛 2.2系统数据库设计
夜上海论坛 数据库能够对商务平台商品数据分析系统的后台数据进行添加、删除、查询,修改。本系统采用MySQL数据库设计,分别是用户信息表、评论评分信息表、商品数据分析表和商品数据统计表。用户信息表主要保存管理员和普通用户的登录信息:用户的用户名、密码、级别还有Email。评论评分信息表主要保存评论内容、评论的时间、评论评分、商品id、操作人员、商品名称等。商品数据分析表主要保存操作人员、操作商品总数、平均四分以上的商品总数及其比例、合格率大于80%的商品总数及其占比、合格率大于60%的商品总数及其占比、不合格商品总数及其占比等内容。商品数据统计表主要保存商品id、操作人员、商品名称、评论平均分、评论合格率、评论不合格率等信息。
3结束语
[关键词]数据分析;大数据;智慧校园;决策支持
夜上海论坛 1国内外研究开发现状和发展趋势
1.1现状与趋势
夜上海论坛 在当今大数据、云计算、物联网和移动互联网等新思路、新技术快速发展的又一历史时期,高等教育面临着前所未有的发展机遇,在经历了网络化、数字化、信息化管理阶段之后,“智慧校园”将是在“互联网+教育”趋势下最重要的发展思路。随着计算机技术的不断发展,各种系统结构化和非结构化数据以前所未有的惊人速度迅猛增长,“大数据”时代已经到来。大数据是指数据结构比较复杂、数据规模大的数据集合。其数据量已经远远超出了一般数据管理工具可以承受的处理时间以及数据处理及存储管理能力。在当今大数据环境下,高校管理系统的数据结构及数据量发生了巨大的变化。在数据存储、数据管理、数据分析及数据挖掘等方面面临着巨大的机遇和挑战。为了有效地利用大数据为高校决策分析提供更好的服务,必须基于大数据建立相应的数据分析系统。
夜上海论坛 1.2国内外研究与开发综述
随着大数据的发展和教育信息化的不断深入,基于大数据开展的高校校园数据分析与应用逐步受到重视。对大数据的定义始终没有形成统一的意见。维基百科对大数据(Bigdata)的定义是:所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。麦肯锡全球研究院将大数据定义为:无法在一定时间内使用传统数据库软件工具对其内容进行获取、管理和处理的数据集合。加特纳(Gartner)于2012年修改了对大数据的定义:大数据是大量、高速、多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与优化处理。而在高校学生数据的分析应用方面,国内外高校均有开展相关的研究。纽约州波基普西市玛丽斯特学院(MaristCollege)与商业数据分析公司Pentaho合作发起开源学术分析计划,旨在一门新课程开始的两周内预测哪些学生可能会无法顺利完成课程,它基于商业分析平台开发了一个分析模型,通过收集分析学生的学习习惯,包括线上阅读材料、论坛发言、完成作业时长等数据信息,来预测学生的学业情况,及时干预帮助问题学生,从而提升毕业率。上海财经大学基于校园信息化数据基础,开发了校务决策支持系统,面向人才培养、内部管理、科学研究和师生服务等方面开展决策分析;华东师范大学利用校园信息化基础数据,开展了校车人数与载客分布分析,提升了校车使用率;利用一卡通数据开展了贫困生的特征确定、潜在贫困生分析、后续跟踪验证,有效提升了帮困扶贫的工作效率。
2需求分析
结合西安欧亚学院信息化建设基础与海量的数据积累,建立“智慧校园”数据分析系统,通过此平台的建设和应用,运用数据挖掘和知识发现,从而在大数据中获取数据之间内在的相互联系,以及其中可能存在的某种规律,从而有效提升校园管理的决策效率,提升教学科研与管理服务的综合水平。通过调查走访各部门,了解教师、学生与行政管理人员的相关需求。主要包括四个方面:一是教学数据分析需求。包括各分院、招生办、教务处等部门对于招生、学生学习行为、教学质量、学科建设与学生就业等方面的分析。二是生活服务数据分析需求。包括图书馆、后勤等部门对于学生的消费行为即图书借阅、网络行为、资源利用等项目的分析。三是财务、人事、宣传等部门对于全校的资产、师资力量、宣传效果等项目的分析。四是研究发展部门对于全校科研项目与成果完成情况的分析(见图1)。
3系统方案设计
3.1框架设计
夜上海论坛 结合需求情况,开展系统的总体框架设计,初步将系统分为三大板块,包括数据监测、决策支持和查询定制(见图2)。
3.2系统方案
系统总体架构包括四个层次,分别是数据引擎、数据挖掘、数据库解决方案和交互平台。数据引擎部分将集成校园WIFI、固网、一卡通、教务系统等各类信息系统的数据,形成数据源,数据挖掘将通过分布式计算架构和数据分析平台对潜在数据进行分析与建模,通过数据库建立本系统的分析数据库,最终通过PC、手机等客户端向用户进行呈现(见图3)。
3.3典型应用研究内容
夜上海论坛 3.3.1教学质量评估教学质量评估属于高校定期必须完成的任务,教学评估的主要目的是更好地发掘出教学过程中存在的一些问题,从而及时地对教学方法进行调整,最终实现教学质量的提升。将大数据运用到高校教学评估系统之中,不但能够在很大程度上提高高校教学管理的科学性,同时还可以提高信息化教学的实用性。把基于大数据挖掘的算法运用在教学评估工作之中,找出教学效果、信息技术在教学中的应用、师生之间的沟通互动等因素之间的联系,从而给高校的教学部门带来非常科学的决策信息,同时让教师可以更加有效地开展教学工作,提高教学质量。
夜上海论坛 3.3.2教师教学能力分析以往的教学缺乏大量数据支撑,教学的质量高低主要靠教师自我度的把握。现在,可以通过在线课堂等技术,搜集大量课堂情况信息,比如学生对知识点的理解程度、教师课堂测试的成绩、学生课堂纪律等。通过这些数据的分析,了解教师熟悉教案的程度、课堂氛围等,改善教学水平。也可以通过深度分析学生在教学过程中教师的课堂表现,从而发现课程的闪光点以及不足,从而让教师能够进一步地对课程教学进行改善,提升教学质量。
3.3.3个性化课程分析个性化学习是高校教学改革的目标,过去的班级制教学中无法很好达到这一点,通过把大数据挖掘技术和学习内容结合起来,指导学习者规划学习发展方向,制订学习规划,实现个性化学习功能。通过评估个人情况,根据分析结果推荐可能取得优秀成绩的课程方案。首先获取学生以往的学习表现,然后从已毕业学生的成绩库中找到与之成绩相似的学生信息,分析前期成绩和待选课程结果之间的相关性,结合专业要求和学生能力进行分析,预测学生选择的课程中可能取得的成绩,最后综合权衡预测学生成绩和各门课程的重要性,为学生推荐一份专业课程清单。
夜上海论坛 3.3.4学习行为分析通过一卡通门禁信息、网络信息、课程信息、在线教育系统等相关数据,可以把学生到课堂时间、上课表现、作业完成情况、自习情况等学习信息记录下来,进行变量分析。当一些与学习行为有关的因素(如旷课、纪律问题、课堂表现)发生变化时,对学生提示并进行分析。通过这种系统分析,可以很好地规划学生的学习时间,提高学习效率。
4技术创新点
4.1大数据环境下提升数据挖掘范围
相比于传统常规环境下的数据获取渠道,大数据环境下,校园数据的获取更为广泛和准确。常规环境下的数据主要以经费收支、课程建设、问卷、访谈、课堂观察等来源,而在大数据环境下,通过对事件数据、舆情数据、一卡通、日志搜索等数据的抓取与分析,更能够准确地反映实际校情。
夜上海论坛 4.2可视化技术展现数据分析结果
夜上海论坛 利用大数据分析的数据挖掘与可视化分析,能够直观地呈现大数据特点,同时能够非常容易被使用者所接受,就如同看图说话一样简单明了。智慧校园中,结合学生学习、生活消费的各类数据,通过系统分析与图表展现,让用户只管了解数据分析的结果。
夜上海论坛 4.3数据质量管理提供重要支持
本项目结合大数据发展趋势,充分利用数据挖掘、建模与可视化展示技术,系统存储数据主要是从校内外各种数据源中获得最原始数据,并对该部分数据进行整合形成数据层,然后将数据层中的数据经过抽取、清洗、转换、装载进入数据仓库从而形成支撑层,在支撑层的基础上,可以根据需求对数据进行挖掘分析,从而构建决策层。