潜在影响:中
时间表:远期(4年以上)
数据的新形式、数据的可视化以及人与数据的交互方式正在发生根本且迅速的改变。因此,数据素养的内涵也在发生着变化。大数据时代,人们不仅是数据报告的被动接收者,更要成为积极的数据探索者。他们需要具备规划、获取、管理、分析数据以及根据数据进行推断的能力。其目的是利用数据分析工具和可视化工具描述世界并回答令人困惑的问题。因而,各学科对提升数据素养的需求以及各行各业对数据分析的需求均在不断增长。了解大数据及其威力与局限,对于成为积极公民和共创民主社会繁荣至关重要。当代学生更要从小就学会用数据工作和思考,以更好地适应数据驱动的社会。
大数据具有很多可变因素。数据规模很大,没有明显的组织结构,难以驾驭且毫无规律。有人将它定义为无法用Excel电子表格这样的工具处理的巨大数据集合。更麻烦的是,大部分大数据被收集起来并不是为了解决我们所感兴趣的问题。它仅仅是数据的堆积,只是看上去和我们的问题有关。因此我们必须重新认识、了解收集什么数据、为什么收集、如何收集及到哪里收集,以回答诸如“数据提供的证据的可信度有多高?”之类的问题。
但是,大数据更容易让人得出错误结论,且更容易使人相信这些结论。人们很容易从中发现大量的模式,但这很可能只是数据收集的结果,而非事实。由于来自于大量数据并使用了高深的技术,使得这些无效的结论似乎更有说服力,更难怀疑或者批判。例如,当机构使用某些算法给求职者排序,进而拒绝他们的工作申请时,这会无意识地造成对某些人群的歧视。数据和算法将复杂的世界简单化,让世界简单使得我们容易度量,但脱离具体情境时也会导致误解。
为应对大数据的挑战,研究者和教育工作者开始重新思考各个年龄阶段所使用的数据教育方法。随着技术应用在生活的各个方面以及大数据的日益普及,我们应该更加关注概念理解和培养数据素养,而不是学习一套孤立的工具和程序。随着时间的推移,任何特定的程序功能都可以被软件实现。因此,学生最需要培养的是对数据和概率的概念性理解。数据教育应从关注结果的显著性转向数据建模,培养学生审查、评估和修改统计模型的能力。数据建模提供了将数据、概率和情境相联系的机会,有利于培养核心的统计思维。大数据模拟、可视化和数据处理方面的技术创新使得年轻学生也能够解决复杂的问题。
大数据教育在本质上是跨学科的。与数据打交道需要掌握各种技能和概念,包括统计学、计算机科学和数学相关的技能与概念。学生必须学会如何使用工作场所和实验室中常见的数据。例如,访问和组织数据库中的数据、从网站上抓取数据、将文本处理成可以分析的数据以及确保机密数据的安全性。CODAP和Tableau这类新的探索性数据分析工具提供了交互环境,帮助人们观察和理解他们手上的大数据。这些数据分析工具可以用来鼓励学生探索、玩乐和解决自己的疑惑。
教会学生熟练地使用大数据进行工作和思考,会为不同的课堂带来深度影响,让学生更富有积极性和创造性,带来更成功的教学结果。大数据教育为培养学生创建、表达、测量、建模和推理数据的能力创造了机会,有利于提升儿童和成年人的想象力。尽管现在有一些工具可以让数据的导入和可视化更简单,但学生在解释数据和理解可视化结果方面仍需要帮助。他们还需要学习如何使用数据来研究问题,学习如何根据多个数据集和各种量表来证明他们的观点。
海洋追踪(Ocean Tracks)项目提供记录着太平洋海域动物生活路径的大型数据集,人们能以地图、表格和图表的方式可视化这些数据。其中,在探究空间(Inquiry Space)中,学生能够可视化自己通过探究或模拟产生的数据。学生使用海洋追踪平台研究海洋动物在太平洋迁徙的方式,探究周围环境是如何影响这些运动的。
通用在线数据分析平台(Common Online Data Analysis Platform,简称CODAP)为学生提供了探索真实数据的工具。它能帮助使用者简单快速地可视化不同数据,激发他们的好奇心并鼓励探究活动。这个免费的、开放源码的网络数据工具,既可作为开发平台,也可供中学以上的学生作为应用软件使用。数据可以来自于外部,通过网络加载到平台,也可通过嵌入平台中的模拟或游戏产生。平台呈现了数据视图和表格、图形以及地图动态链接(见图7)。CODAP可以被整合到课程中,帮助学生探索和学习来自任何领域的数据,提高他们使用数据作为证据来支持观点的技能。

图7 用户在CODAP中分析龙卷风数据
资源:
1) Blog post that considers what data science is and how to teach it:Erickson, T. (2017). Smelling like data science. https://bestcase.wordpress.com/2017/02/21/smelling-like-data-science
2) Text and video introducing the Common Online Data Analysis Platform and showing it in use in schools: http://www.oceansofdata.org/projects/commononline-data-analysis-platform-codap
3) The Ocean Tracks interface was designed to enable students to develop questions, plan and carry out investigations, and analyse and interpret data: http://oceantracks.org/about http://oceantracks.org/map/
4) This article from The Guardian newspaper introduces some of the main themes of Cathy O’Neil’s book, referenced below, which deals with the harmful effects of algorithms: Weapons of Math Destruction: Cathy O’Neil adds up the damage of algorithms http://bit.ly/2eYuH4o
5) Tableau is a commercial data tool that enables paying customers to use visual analytics for data exploration: https://www.tableau.com
6) Using Ocean Tracks with students to investigate marine migration: Busey, A., Krumhansl, R., Mueller-Northcott, J., Louie, J., Kochevar, R., Krumhansl, K., & Zetterlind, V. (2015). Harvesting a sea of data: using authentic data to investigate marine migrations. The Science Teacher, 82(5), 44-49. www.ltd.edc.org/sites/ltd.edc.org/files/Article.pdf
7) Guidelines for courses in data science: De Veaux, R. D., Agarwal, M., Averett, M., Baumer, B. S., Bray, A., Bressoud, T. C., Bryant, L., Cheng, L. Z., Francis, A. Gould, R. et al. (2017). Curriculum guidelines for undergraduate programs in data science. Annual Review of Statistics and Its Application, 4, 15-30. http://bit.ly/2lqW7rT
8) Consideration of the ways of thinking, questioning, and problem-solving that learners can develop as they work with data:Finzer, W. (2013). The data science education dilemma.Technology Innovations in Statistics Education, 7(2). http://escholarship.org/uc/item/7gv0q9dc
9) O’Neil, C. (2017). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. New York, NY: Crown Publishing Group. What will it mean to be statistically literate in the next decade? Wild, C. J. (2017). Statistical literacy as the earth moves. Statistics Education Research Journal, 16(1), 31-37. http://bit.ly/2ifMeso