加载中…
搜博主文章
基础资料
  • 性  别:
个人经历
抱歉,该用户没有填写任何资料
个人简介
抱歉,该用户没有填写任何资料
个人资料
山财大_大数据商务分析实验室
山财大_大数据商务分
析实验室
  • 博客等级:
  • 博客积分:0
  • 博客访问:804
  • 关注人气:0
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
访客
加载中…
好友
加载中…
评论
加载中…
留言
加载中…
博文
分类: 参加比赛

2019年10月26日,第二届全国大学生大数据技能竞赛华北赛区比赛在北京中国农业大学计算中心举行,来自30所高校35支参赛队晋级本次比赛,参加大数据技术技能现场赛。我校管理科学与工程学院的六名同学在杨成伟老师的带领下参加了本次比赛,孟欣,冯邵帅,袁久存的山财一队与项紫啸,冯邵帅,苏日新组成的山财二队获的两项二等奖,李希茹作为预备队员参加了热身赛。
本次比赛由中国大数据技术与应用联盟发起,中国工程院院士谭建荣担任本此竞赛组组长,北京邮电大学副校长郭军教授、中国大数据技术与应用联盟副理事长赵平生但任副组长,组员均来自国内著名高校的教授及相关企业的首席运营官。竞赛贴近真实工作环境,主要从大数据环境搭建与运维水平、数据采集与预处理能力、数据分析软件使用水平、数据分析算法与挖掘能力等方面进行全面比赛。
通过参加本次比赛,提高了参赛学生的大数据技能、数据科学思维、实践能力和协作能力,增长了见识,激发了学生的自主学习热情,为我校培养更多高素质技能型人才。

阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 
分类: 大数据
【特别感谢帮助截图的大数据实验室可爱的同学们】

一、实验目的

1.学会下载开源软件

2.学会windows下虚拟机软件安装部署

二、实验内容

1、下载虚拟机
阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 
分类: 大数据
【感谢祝翠玲老师提供的资料和整理工作】
一、实验目的
Ubuntu是基于Linux的免费开源桌面PC操作系统,在Windows操作系统下使用开源虚拟机软件VirtualBox安装操作系统Ubuntu,为搭建hadoop提供基础环境。
二、实验步骤
(1)安装前准备
1. 安装好的VirtualBox虚拟机软件
请确认安装好VirtualBox,如仍未安装VirtualBox,请点击下载地址
VirtualBox下载地址,并按前面的实验步骤进行安装。
2. Ubuntu LTS 16.04 ISO映像文件
在后面的实验中我们都使用Ubuntu16.04版本。
(2)安装步骤
(一)开启CPU虚拟化
如果电脑较新或者内存大于4G,建议选择64位的Ubuntu系统。
如果选择的系统是64位Ubuntu系统,那么在安装虚拟机前,则必须要进入电脑的BIOS系统开启CPU的虚拟化,否则不能出现64位的Linux
阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 
分类: 大数据

1、安装MySQL

   1)在线安装mysql

在使用

阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 
分类: 大数据

一、实验目的
由于在Linux中安装伪分布式环境,需要Java JDK的支持,因此,在安装Hadoop之前,需要安装相应的JDK,并配置相应的环境变量。
二、实验步骤
1、下载JDK
(1)首先去官网下载linux操作系统的jdk,需要根据自己linux的版本下载对应的文件。
 
阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 


一、实验目的
安装了虚拟机之后,如果有Linux镜像文件,可以直接将镜像文件加载到虚拟机中,避免重新安装Linux环境,简化操作过程。
二、实验步骤
1、检查电脑是否支持虚拟化功能
由于虚拟机需要电脑硬件的虚拟化功能支持,所有首先要检查所用电脑是否支持虚拟化支持。打开securable软件,这是一款检查CPU是否支持虚拟化的测试软件。
2、开启电脑虚拟化支持
阅读  ┆ 禁止转载 ┆ 收藏 
分类: 参加会议

2019年9月21日(星期六)管理科学与工程学院大数据商务分析实验室杨成伟老师带领学生宁砚紫、白秀冉前往淄博参加2019年学术年会。此次年会围绕中国制造未来方向:人工智能+智能制造主题展开论坛,与全省计算机业界专家就学术研究、技术发展、人才培养、校企合作等事项展开交流,并参加多个论坛活动。

阅读  ┆ 评论  ┆ 禁止转载 ┆ 收藏 

CNAIS核心期刊及学术会议目录201510月)

英文核心期刊

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2019-06-17 11:17)
标签:

杂谈

 

第四章 单机上处理大数据

(一)
1、本章涵盖:
a.在一台计算机上处理大数据集。
b.Python库适合处理较大的数据集。
C.理解选择正确的算法和数据结构的重要性。
D.理解如何调整算法以在数据库内部工作。

2、本章介绍了在一台计算机上处理大数据集所使用的技术及工具。侧重于介绍当数据过多、无法装入机存取处理器( Random Access Memory, RAM)时,执行分类和回归算法将用到的工具。这里的数据是就数据规模而言的,即海量数据( large data),指的是在内存处理或运行速度方面会引发问题,但依然可以用一台计算机处理的数据。

3、本章大体思路:首先概述了我们处理大数据集时可能面临的问题。随后针对这些问题,作者

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有