【DiVoMiner】三步将研究数据"装"进我的数据库,就是这么简单!
标签:
研究工具研究论文文本分析内容分析法大数据技术 |
分类: DiVoMiner®使用教程 |
把大象放进冰箱需要几步?
第一步:打开冰箱门
第二步:把大象放进去
第三步:关上冰箱门
大家可能会有疑问
"我的冰箱那么小,虽说是三步走,但我的冰箱也装不下大象啊!"
今天小编讲的"三步走"是真的可以把"大象"放进你的冰箱的。因为您在DiVoMiner®平台(me.divominer.cn)上建立的专属数据库可以由您来定义它的空间和大小(回顾前文:如何快速建立您的专属数据库)。
研究资料和数据的准备是研究过程中不可或缺的部分,如何将我们准备好的数据规整地汇集到一起,供我们随时随地做研究呢?
如果我们分析的是近五年某报刊上的报道
过去的做法
把近五年的某报刊全部找到,
搬到我面前:
我开始了一页一页的翻阅,整理……
如今有了计算机辅助、大数据技术、
网络挖掘、机器学习……
把我们准备好的研究数据装进数据库中
仅需三步!
进入me.divominer.cn或扫描下方二维码快速注册帐号,永久免费使用学习版!
请您打开DiVoMiner®跟着操作,
效果会更好哦!
(我们已在平台上准备好示例数据供大家使用,马上扫码体验👆)
在DiVoMiner®上创建话题成功后,自动进入到【数据管理】-【总览】页面。
http://p3.pstatp.com/large/pgc-image/d5dab9a972a0411ebce01346a5579a40
在这里,您可以看到各数据库中整体数据情况,如编码库、回收库、已编码量、当前话题已用数据容量及文件容量等信息。
一个话题中可建立多个数据库,允许您上传多种不同类型的数据。为方便您直接上传数据,研究话题会预设一个数据库。
建立数据库
例如,若您想建立"新闻"和"微博"两个数据库。
☛可直接修改预设数据库名称为"新闻数据库"。
☛点击【+添加数据库】,输入数据库名称"微博数据库"。
http://p1.pstatp.com/large/pgc-image/1860c12e721a40c8986f2b13c213c4bf
您已经有了自己的专属数据库后,
开始上传您的数据吧!
第一步 上传数据
完成数据库建立后,在"新闻数据库"操作框中点击【上传数据】,选择数据档上传。
http://p1.pstatp.com/large/pgc-image/657f22e7bf6f4e0c8ac17e4248ea5339
如果您的数据档格式是Excel、PDF、图片或第三方数据源等,均可以上传到平台上。选择对应格式,点击或将文件拖拽到上传区域。
http://p1.pstatp.com/large/pgc-image/49b7a5c504c84f919cc0a265105c4d7c
注意:EXCEl文档需要是xlsx格式,单个文档上限200M。
第二步 自定义您的数据字段类型
上传文件后,您可以预览上传的数据,并且给每一列数据的字段类型下定义。
http://p3.pstatp.com/large/pgc-image/76cdde31c18040e9b26288abac5ad59b
●文本:文本型数据,一般包括汉字、英文字母、拼音符号等,阿拉伯数字也可以作为文本型数据;
●数值:按数字尺度测量的数据;
●布尔值:又称为逻辑数据类型,又二进制数字组成,0和1,即真/假(True/ False);
●日期:日期时间类的数据;
咦?字段右上角的那些小红点是什么?
答案:字段上标有红点,意思是该字段是新上传字段,可修改字段名称,命名方式可以依据您的个人喜好和研究需求哟~。曾经上传过的字段不能够再次修改字段类型。如果是再次上传的字段,可"转化为已有字段"类型。
http://p1.pstatp.com/large/pgc-image/a0d93e23cb644845b055b7f4206a2e3e
第三步 配置数据
点击【下一步】
进入【配置数据】页面,这里配置的页面样式就是您在【编码库】查看数据和【内容编码】页面做人工编码时的呈现效果。您可以根据个人喜好和研究需求自定义数据呈现效果。
给您举个例子:
【标题】栏位选择"标题";
【信息】栏位选择日期、来源、版面等;
【正文】栏位中选择"正文"。
http://p1.pstatp.com/large/pgc-image/b0f78e1a049b4f17bd3b18788814287e
注意:机器编码仅处理【标题】和【正文】栏位的数据,可依据实际需求调整栏位数据。
点击【提交数据】完成数据上传。
http://p1.pstatp.com/large/pgc-image/7309e2bd0c404d2882cf073272fdba51
经历了三步走,您的数据已经成功上传至您的专属数据库中了,在哪里查看数据呢?
查看数据
进入【编码库】可以查看已上传的数据,核对一下您上传的数据量是否正确哟~点击任意一条数据,就可以查看数据的呈现效果了。
http://p1.pstatp.com/large/pgc-image/c6a08fc3458e42ebafe5e4ad57922cc0
如需清理数据,可在【编码库】中【移除】无关或垃圾数据即可。
如果在研究过程中,您想修改数据的呈现样式,怎么办呢?
修改页面样式
如后续需要修改数据查看页面样式(或需要变更机器编码的数据范围),可在【数据管理】-【总览】,对应数据库的【更多操作】-【显示设定】中进行修改。
http://p3.pstatp.com/large/pgc-image/30a06ef4a6764260888c995cf373e851
数据已经准备好了,开始您的研究吧!
进入me.divominer.cn快速注册账号,永久免费使用学习版!
更多精彩内容,请关注"文本数据挖掘与分析"(ID:divominer)
或登入官网www.divominer.cn。

加载中…