[转载]综述:大数据与教育革命

标签:
转载 |
http://s5/mw690/537ef173gda335cef7b44&690
在此之前的1970年,著名的未来学家阿尔文·托夫勒在他的第一本畅销书《未来的冲击》中,就对大量数据、非结构化数据、信息通道和信息过载有了惊人的预测。他指出大量的“人工编码信息”将代替自然信息,将充斥人们生活,却又惊人的准确度。1991年,施乐公司为了推广无纸化办公,提出了“普适计算”的概念,并开发出了相关产品,这个目前看起来像移动终端的东西,实际上的发展到现在,有一个中国人耳熟能详的名字:物联网。而物联网所产生的大量环境信息,是大数据重要的来源。
1998年,斯坦福大学的两个研究生用普通性能的硬盘拼装起来,并写出了现在被称为GFS的搜索程序,依靠这个程序获得了赶着开会听得不耐烦的太阳公司创始人的10万美金投资,这个公司就是谷歌,而把普通硬盘拼装起来的思路,后来发展成为我们今天很热的一个词汇:云计算。
1998年的另外一件大事就是博客的诞生,博客和云在那一年同年诞生,他们相爱结婚却是多年以后的事情。博客的诞生产生了另外一种大数据:社会网络数据。
2002年,美国前任国家安全助理将大量的恐怖主义信息输入数据库并形成大数据应用,这应该可以称为大数据元年。在当年的11月,看着图像点击鼠标的美国将军,瞬间通过无人机发射的导弹将位于也门的拉登同伙远程消灭,如果说得牵强一点,此时大数据、云和物联网第一次完成合作。
收集信息所带来的隐私争议以及收集信息和处理方式,使得这项计划马上发生了转向。2004年,美国国家安全局另辟蹊径,通过社交网络查找恐怖嫌疑犯。国家安全局能够这样做,得益于云和社交网络的结婚生子,而孩子就是大数据。
技术总是首先帮助那些处于边缘的人。2008年,黑人穷小子奥巴马决定雇佣FACEBOOK联合创始人Hughes,利用社交网络技术分析和应用,奥巴马登上了总统宝座并完成了Hughes的愿望:总统来到Hughes父母身边亲自夸奖这个从哈佛退学的专家。大数据应用在2012年奥巴马连任中再次获得成功,在最后胶着阶段,奥巴马利用系统的指示,不断地以恳求的口气给精准设计过的选民发电子邮件,大选结果差距之大出乎意料。
1997年5月11日,IBM公司研制的超级电脑“深蓝”战胜了国际象棋世界冠军卡斯巴罗夫。2011年,同样是IBM公司研制的超级电脑“沃森”战胜了美国连续几十场获得智力竞赛冠军的选手,这次难度更大,因为计算机面临的是不确定的和隐含逻辑的问题。这个包含了2880个CPU和数千本大英百科全书的计算机,才名至实归地可以成为大数据应用。
专家们谈到大数据,总是谈到四条:第一,数据体量巨大,从数量单位的TB级别,跃升到PB级别,也就是大了至少100倍;第二,数据类型繁多。包括所有的结构化、半结构化和非结构化数据。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。通过以上的特点,我们很容易判断,“深蓝”不是大数据,而“沃森”是大数据应用。
数字和数据,一字之差,技术悄悄走过一个时代。在数字时代,结构化的数据、量化的决策方法、较少的和经过筛选的高密度的数据质量,使得数字成为诉求:数字城市、数字中国和科学决策;然而大数据时代,一个数字背后的背景数据(即元数据)、评论数据等,全方位地定位了这个数据的意义,数据应用的侧重点由专家移向了客户、由理性移向了感官(专业上称可视化)、由单一的结论移向了个性化的判断。
2012年,美国教育有史以来,有了巨大的争议,成功创业贝宝(PayPal)和投资脸谱网(FaceBook)、YOUTUBE公司的彼得·蒂尔,设立了一个基金,给与有创意和创新能力的大学生每人10万美金的创业启动金,前提是这个学生必须辍学。我们如果留意美国近几年的成功企业家,就会发现在这群人中退学生比例非常高。是什么造成了上述教育的变化呢?包括在线教育在内的教育数据的变化,是很重要的原因
2004年,澳大利亚人马丁为了解决他所在的住在沙漠那一边的职业学院学生乘飞机上课的难题,开发了一个开源的课程平台,这就是MOODLE。教师通过这个平台,可以与学生进行互动、考试、资料分发等一切想得到的功能。2010年,这个平台数量已经达到100万门户,目前他们绝大多数在云端。2006年,美国的密西根大学等学校开发了SAKAI平台,这个开放的高等教育为主的平台,同样达到了数十万门户的教师使用量。通过这些开放课程的平台,学生们可以得到大量的课程资源。2006年为解决自己的亲戚学习数学的问题,孟加拉裔金融白领萨尔曼·可汗将自己的10分钟的教学视频扔到了网上,几年后这个网站注册用户达到1000万。而到了2012年,美国一年之内的在线课程的投资总额达以十数亿美金以上。
在我们通常的误区里,在线课程是这场教育革命的最重要特征,于是大量的中国中小学开展在线教育尝试。然而,大量的结果表明,并没有大数据产生:每年中国各级教育机构投入的绝大多数的精品课程相关的投资,产生的数据量少得可怜,大数据,迷局在哪里?
大数据时代,解放了的知识本身被学校扔掉,学校不再是知识的独家代理商,人的本身才是教育的重点。本文作者在上海某大学讲授《网络工程课》课程时,大学三年级的60个学生在一个学期内对这门课程的点击量达到70000次,所花时间占他们该学期开设所有10门课程学习时间的60%,这一门课程的资源总合达到75G。是什么原因造成了学生的积极性和很大的数据量呢?本文作者是通过任务教学、可视化诱导、日志排名、学习效果反馈、社交网络等MOODLE 和SAKAI 常用的或者定制的插件,来调动起学生巨大的热情。同样的,复旦大学将开源的SAKAI扔到网上,数百门课程主动地由师生使用起来。相比起为考核而设立的各级精品课程网站,效果天差地别。
谷歌自动驾驶汽车的发明人特隆,在自己的人工智能课程中,试图尝试类似SAKAI课程,他决定把在线课程再推进一步。特隆将自己人工智能的技术应用在教学平台中,根据学生学习的难易,用程序算法调整教学进度和进行互动,结果,这门课全球有16万人选课,完成考试的22000人,特隆本人所在的斯坦福大学的正式学生没人进入前400名。
在《未来的冲击》一书中,托夫勒精准地用专门的章节预测了未来的教育,他谈到过去的教育是为工业化做配套的:上课的铃声、课程大纲、班级、教室、每节课45分钟、集中物流般的大规模学生和教师聚集、如工厂计分般地考核系统等等,联想到中国具有特色更加普遍的班主任、大队中队小队干部,今天我们这些苏联当年二战过后以计划经济推动工业化重建所创设的为工业社会配套的教育体系被完整地保留了下来。托夫勒说:“教育体系试图模拟社会体系而建立起自己训练有素的模拟场景”,如果说60年前,我们模拟了那个时代工业化的场景的话,那么,大数据时代,教育又将意味着什么喝如何模拟现实世界呢?
加州大学洛杉矶分校环境设计教授亚历山大说:“集中的、与世隔绝的大学扼杀各种学习机会;大学如同传统的市场,成百上千个小摊点,来者不拒,能者为师,有人去授课,这门课就算开设了;他们可以去上课,上到一半可以去小便,小便之后不回去。”
目前教育变革的讨论,过于集中在在线教育(远程、平板、电子、数字),这正像任何一个科技让人们最先想到的都是偷懒的哲学:自动化时代最先想到的是卓别林演的自动吃饭机,多媒体时代人们最先想到的是游戏。在线教育本身很难改变学习,在这场教育革命的浪潮中,由在线教育引发的教育由数字支撑到数据支撑变化(教育环境,实验场景, 时空变化,学习变化,教育管理变化)等等,确是很多人没有在意的巨大金矿 。
教育环境的设计、教育实验场景的布置,教育时空的变化、学习场景的变革、教育管理数据的采集和决策,这些过去靠拍脑袋或者理念灵感加经验的东西,在云、物联网、大数据的背景下,变成一种数据支撑的行为科学。
http://s9/mw690/537ef173gda3361701c28&690
匹兹堡大学儿童医学研究中心的实验环境实景
在荷兰有个教授将数十个实验室,横跨欧洲十多个实验室的仪器联在一起,实现了从发电厂到电站的数据整合,再配上预约和实验数据采集系统,完成了一次虚拟和真实的交互教学。
http://s4/mw690/537ef173gda3362cf0123&690
荷兰案例
在上海的东华大学,学校正在将10多个学院的数十个实验室管理起来,通过物联网和云的技术将实验系统连接起来,实现实验室数据的整合、分析、可视化、报表,依靠数据,不再依靠人的上报。
http://s8/mw690/537ef173gda33642dcfc7&690
东华大学实验数据可视化
在美国,有一个网站叫TRULIA,这个网站是一个房产网站,但是将房产信息、税收信息、犯罪信息、学区信息、学校政府评价、社会评论集成在一起,美国几乎任何一个学校和学区的情况都使用可视化技术方便地直观地展现在人们眼前。在美国宾州,有一个叫做EDLINE的网站,将学生的每次作业、每次考试记录在网上,完成学生的日常GPA积累,这个网站的技术并不难,然而能够坚持下来的数据积累,对于学生、家长和教育管理非常重要,大家都知道,美国的大学入学GPA非常重要。依靠这个GPA 再加上学生的SAT和ACT所提供的分析报告以及志愿者活动资料,就决定了学生的大学去向。
印度裔英国教育家苏迦特,在印度山区的偏远小村,放置“墙上的电脑”并装上摄像头对孩子学习行为进行监控,发现学生的“学习是一种自组织行为”,从而进一步推进了建构主义的学习理论和实践。而2012年的很多在线教育投资不需要装摄像头,学生的学习行为记录像显微镜一样被观察到并可以进行分析和反馈,而主持这些技术的人如果是类似“沃森”的设计人,事情该有多么可怕,但事情正在发生。
教育将继经济学之后,不再是一个靠理念和经验传承的社会科学和道德良心的学科,大数据时代的教育,将变成一门实实在在的实证科学。
2013年4月12日,在美国的匹兹堡的斯威克利高中正在进行校园开放日活动,在回答学生和家长关于入学标准的时候,校长说:“实质只有一个,那就是能否给你几小时读100篇历史文献并回答问题和辨别真伪”。斯威克利高中选材似乎连数学都放弃了,事实证明这所美国著名的私立高中是成功的。美国高考的重要参考SAT考试,主要由三部分构成:批判性思维、数学和写作,是什么让斯威克利高中的校长口中入学标准连写作和数学都不看重呢?
苏迦特的一个观点很具有代表性:“你能够想象和确认,你所教的和考核的东西,在今后20年学生们走向工作岗位还管用吗?”为此,苏迦特分析,只有三种最基本的东西在今后的大数据时代是学生用的到和必须学的东西:“第一是阅读,第二是搜索,第三是辨别真伪”,谈到数学,苏迦特说:“也许数学,将成为一种体育运动”。基本能力加每个孩子特长的“体育运动”,构成了苏迦特心目中的未来教育,这种体育运动也许是数学,也许是领导力、是音乐、美术和篮球。数学也许是每个孩子的体育运动,也许是一部分专业运动员的体育运动,但大数据时代的数学,将不会是教育的基本标准和指向,这事情,滑稽不?
目前的经济,已经进入后工业化的大数据时代:经济结构转向服务经济,劳动力大规模转向服务业,职业分布由工厂转向办公室,社会焦点从围绕生产转向围绕创新;同时,人与机器的主流社会关系也逐渐转向人与数据之间的关系。若干年后的社会的竞争是以服务和创新为核心的,然而我们的教育还围绕着减少犯错和标准化的魔咒。大数据教育提供了另外一种可能,标准化的教育将转向网络完成而人才培养和个性化将主要由学校承担:“越来越小的班级、越来越近的学校、越来越聚焦的教育支持、越来越个性的培养方式,将使教育摆脱工业化时代。”“为什么数学课每天都有,而舞蹈、音乐和体育课一周一次呢?” 罗宾逊这个疑问逐渐得到改观,针对性和多元的教育目标正在普遍得到认可,尤其是在私立学校中。
在托夫勒的《未来的冲击》中,托夫勒描绘了未来世界由于多维信道带来的难题,在最新的一些未来学派的观点中,人们又提出了混合时代:在这个数据世界里,人与人的关系将让位于人与技术共同进化,技术将不仅转变人类社会的经济形态,更将从更深远的意义上改变我们对自身存在的认识。
混合时代
大数据时代给人最大的难题正如托夫勒所说,来自信息过载所带来的“信道危机”。在单一的信息来源情况下,比如高考的分数、固定的复习资料,教育最好的办法是重复吸收那些经过筛选的编码信息。中国的黄冈中学、衡水中学,在旧的教育体制下,非常成功地迎合了高考的指挥棒。大家应该注意到,无论是黄冈中学、衡水中学还是杜朗口中学,这种模式只适合信息闭塞的情况,不大适合北京上海等信息过载的城市。在以网络技术无限广阔的应用所带来的大数据信息压力时代,如何搜索、阅读、辨别信息成了一个巨大的难题。