MROC海量定性资料的半自动化分析技术和应用——互联网人群在线旅游产品订购研究

标签:
市场研究数字100汤雪梅市场调查mroc |
分类: 市场研究 |
本文获第十一届 “中国市场研究‘宝洁’论文奖”专业组二等奖
北京数字一百市场咨询有限公司 王青竹/王青/汤雪梅/崔丽娜
摘要:
随着互联网的发展,尤其是SNS社交网络的发展,在线调研中定性研究的信息量迅猛增长,传统研究方法在应对这一情况时,三个核心问题一直困扰着我们:1.人工分析方法已经无法应对如此海量的信息,研究分析“效率低”;2.面对同一资料,仁者见仁智者见智,不同的人分析出的结论很可能是不同的,“不够客观”;3. 大量信息被掩埋在文字资料中,没有被挖掘,基于人脑做分析往往存在“大量信息损耗”。虽然存在一些词频统计的软件,但还没被真正系统地应用到定性研究资料的分析上,“有技术无应用”。
本文从以上三个方面入手,给出了MROC(在线调研社区)定性研究的半自动化全程解决方案,解决了传统定性研究资料采集和分析过程的的低效、低信度。该方案是以结构语义为理论基础,以定性资料分析软件为工具,将计算机技术地融入到了分析的各个环节。本文还结合互联网人群在线旅游产品订购动机和行为模式的研究案例,验证了这一解决方案所具有的强大优势和广泛应用价值。
在新的方法和应用下,定性研究将可以面对海量数据,实现数据的批量化处理,大大提升运作效率;研究结果不再见仁见智,而更加客观准确;同时,也降低了信息损耗。
关键词:MROC(在线调研社区)
Semi-automatic
Technology and Its Application in Qualitative Research for mass
data in MROCs
--A study on tourism product ordering on internet
[Abstract]
With the development of the Internet, especially SNS, the amount of information in qualitative research in online marketing research grows rapidly. Three issues have been plaguing us with traditional research methods.
1. The manual analysis methods fail to cope with such a flood of information efficiently. 2. Different researchers may come to different conclusion when analyzing the same quality data, which is not objective. 3. Much useful information underlying in the text would be omitted. A lot of valued information would be missed based with mental work. Although there are a number of word frequency statistics software, these tools have not practically been applied in the qualitative data analysis.
To solve the above problems, we proposal the semi-automatic solution in the MROC (Marketing research online community) qualitative research, utilizing semantic analysis software and based on structural semantic theory. Then the case of tourism product purchase motives and behavior patterns research is used to explain the great advantage and widely used value of the solution.
The new methods enable qualitative batch processing of data, and greatly enhance analysis efficiency. Conclusions would be more objective and accurate and the information missed is lowered.
[Key words] MROC (Marketing Research
Online Community)
Text Analysis
一、引言
定性座谈会由于可以帮助企业与消费者面对面沟通,进行大量探索性研究而得到大量应用。然而,传统的座谈会在资料采集和分析方面也存在严重局限性:
1)定性研究分析是一个“见仁见智”的过程,结果差异性大
主持人、研究人员通常依据个人兴趣,价值取向来对资料做初步判断,难以给出客观准确的研究结果。不同的人对同一内容做研究时,尤其在做市场细分时,得到的很可能是完全不同的结果。
2)当处理信息量增大时,研究员将无能为力
如果想在召开座谈会之后短时间内得到研究发现,研究员将面临非常大的压力,根本无法做深入全面地分析。当信息量不断增大时,人工分析将变得更无能为力。
3)存在信息损耗
即使是时间充裕的情况下,也难保研究员在分析时会忽略掉一些有价值的信息,研究员在参加座谈会的时候关注的是调研问题的答案,而且预先的研究假设难免会左右研究员对聊天话语的关注和对结论的提炼,可能还有一些对企业本次调查有价值的信息就被忽视掉了。
面对这一现状,我们亟需通过新的思路、方法、技术来进行变革,庆幸的是当前互联网的发展使这种变革成为可能,基于MROC(在线调研社区)的定性研究半自动化解决方案便是这一变革的产物。
二、基于MROC定性研究的半自动化解决方案
1、基于在线调研社区的定性研究及其特点
MROC(Market Research
Online
Community)以互联网为平台,将符合条件的消费者招募到一个独立的线上社区,在较长一段时间内参加特定主题的讨论活动。这一手段在国内越来越受到重视,不少企业使用后也充分体验到了其灵活多样的调查形式、与消费者的强互动、省时省力、省成本,MROC在国内的应用前景被众多市场研究公司和企业看好。Greenbook最新调查结果显示,MROC全球应用率高达16%,在线座谈会(基于文本的座谈会)更是达到了25%,这种新兴手段相对传统方法的优势不言自明。
1)信息多样性、真实性大大增强
在MROC的在线座谈会环境下,参会者互不见面,不大会受到社会赞许性的影响而掩饰自己的真实态度和行为(或从众作答),而是感到自由,会畅所欲言。一般来讲,在线座谈会得到的观点更加多元和真实。
2)信息反馈更快捷
在MROC的在线座谈会,参会者可同时发言,而不像在传统座谈会,参会者只能相继发言。同样一个问题抛出后,传统座谈会可能需要5分钟才能得到所有人的反馈,而在线座谈会则只需要3分钟。
3)信息以数十倍,甚至百倍的总量增长
一场传统座谈会大概有600余条信息,且以主持人的启发引导为主,真正与会者参与意见大致仅有300余条。而在MROC的定性研究中,单次座谈会信息近2000条,与会者意见更是占到其中绝大部分,有1600余条,5倍于传统座谈会的信息量,而这仅仅是一场座谈会的差异,如果是两场,则是600条与3200条的差异,如果是四场,则是1200条与6400条的差异……
传统分析方式在处理MROC在线座谈会资料时,无疑存在一些固有局限,再加上MROC的信息量巨大、反馈周期短,如果没有一种更高效、更准确客观的资料分析方法,MROC的高效就仅仅停留在执行层面,漫长的分析环节将会成为MROC的一大缺憾。
那么,应对于MROC信息的多、快、大,以及传统分析方式的局限,我们如何采用半自动化分析方法来解决这个问题呢?
2. 基于MROC定性研究的半自动化解决方案
首先我们需寻求一种客观深入的定性分析理论,而后借助计算机的自动化文本分析功能,得出全面的结构化信息,并利用语义关联网络对信息呈现的全面化、可视化,对不同类型群体的表现进行深入探析。
基于MROC的半自动化解决方案以语义学分析方法为基础。把软件工具和定性资料分析的理论有机结合,在相对短的时间内得到比较深入的分析结果,定性资料分析的时效和深入性得以平衡。
消费者分类研究中的语义学分析方法以逻辑结构为理论基础,将语义分为三个层次:表层语汇、语义类别和更深层次的逻辑联系。分析过程:通过各种研究方法获得一个消费者的语言描述,即表层语汇,从中找出其关键词语以及词频信息,并通过M-QDA软件进行自动化的预分类。然后通过分析关键词和结构,建立起彼此之间的联系和框架,根据与会者在各类语汇上的表现,对人群等进行分类,最终将与会者的行为特征等信息做语义关联网络图分析,找到每类群体从行为到态度的特征描述。
(1)变少为多:定性研究可以应对海量资料
(2)变主观为客观:定性研究结果更加客观准确,研究结果更加稳定
(3)变浅为深:分析理论与计算机技术相结合实现更深入的挖掘,以及逻辑背后深层含义的探索
三、研究成果—案例应用
1. 项目背景
旅游电子商务近几年增长迅速,发展潜力看好。某在线旅游网站欲改进自身的服务和产品,实现和消费者需求的准确对接,特委托进行本次调研,洞察在线旅游产品订购用户的消费动机和行为。
调研对象的网络参与度高,适合MROC在线座谈会的方式,本次调研的定性研究部分也采用了此方法。
2. 定性资料采集
采用MROC在线座谈会,2天共召开4组座谈会,每组20人,与会者均匀分布在北京、上海、广州、武汉4个城市。如下表所示,本次资料采集效率较常规方式有明显提升,时间少、信息量大、费用低:
在定性资料的加工处理中,如采用传统分析方法,至少需要7天,无法在短期内完成,且信息损耗大、也难保证分析结果的客观性。
因此,本项目采用了创新的MROC定性分析的半自动化解决方案,仅用了1天。过程如下:
1)表层语汇——计算机关键词抓取和词频统计
选取“在线旅游产品订购”这部分的访谈记录(整个座谈会包含开场、结束环节,涉及旅游经历、生活形态等子主题,但不属消费动机主题,暂不纳入),导入到MROC定性资料分析软件(定性资料分析即Qualitative
Data Analysis,
MROC定性资料分析软件以下简称M-QDA),软件自动过滤掉一些无意义词汇,研究员再滤掉一些与讨论主题无直接关联的高频词,比如“什么”“怎么样”“大家”“下一个”等等,M-QDA按词频排序,最终导出34个消费动机相关的关键词汇频率表如下:
上述关键词涵盖了价格、选择性、安全等,为还原关键词背后对应的核心关注点和主导动机,需用软件对其分类。首先利用M-QDA的近义词词库,对关键词进行预分类(precategorize),研究员再根据对这些词汇所在语境的理解,调整预分类的结果,最终形成的四个词群如下:
3)结构化细分标准——计算机关联词交叉统计
根据消费动机将用户分类,需分析各个与会者的发言内容与上述4个词群的相关性。
利用M-QDA的关联词设置功能,将35个关键词转换成4个核心词,比如:凡提到“优惠、促销、折扣、便宜、价钱、挑选”,都等同于提及的是“价格”这一核心词。再通过关联词交叉统计得出4个词群在各个与会者发言内容的频次分布,发现有14位与会者发言内容在四类词群上的表现无明显特征,不属于任何一种类型,效率型15人、价格型26人、品质型10人、评估型15人(由于样本量小,取样也是根据客户此次的调研目的而设计,因此这个人数分布不一定适用于现今所有的在线旅游订购用户)。
速战速决型一般会事先确定旅游目标,希望在订购这件事本身上尽量少花时间,打客服电话也嫌费事,喜欢网站操作简便,信息呈现一目了然,以便快速了解;无心插柳型不大有计划性,只会时不时在网站闲逛,一旦发现好的特价促销活动,只要条件允许,便会抓住时机,而不管事先是否有旅游计划。
精挑细选型会结合自己的行程远近(省内省外、国外国内),一起旅行的人(是否带小孩,是和朋友一起还是和父母),来选择合适的旅行产品,品牌、价格、服务都会做全方位的评估,在不同情况下评估的侧重点也有区别,比较理性;而体验至上型比较感性,关注自己在整个过程中的体验是否舒心、愉悦,会尽力避免破坏心情的可能,选择网站时看重信誉度、大品牌,主要是不想在后期有什么麻烦的因素,使用在线旅游网站时,也会比较关注网站页面设计。
4)各类人群特征描述——计算机语义关联网络分析
根据消费动机对在线旅游产品订购用户进行分类之后,需了解各类人群的背景特征和行为特点。将每类人群的典型与会者发言记录导入M-QDA,进行语义网络分析,得到的语义关联网络图能非常形象地展示词汇之间的关联,一次性地完整呈现与会者在背景、行为、价值观等多方面的信息,极为直观,大大突破了以往研究只能逐个分析单切面信息的局限。
在此以效率型人群特征描述为例,说明本步骤得到的结果。
1、本研究的意义
本文提出了MROC在线座谈会的新兴方法和半自动化的定性资料分析技术,不仅解决了传统定性资料采集手段的低效,还相应实现了MROC在线座谈会海量信息的高效分析。
定性资料采集到分析的全程高效,大大缩短了座谈会从执行到分析结果产出的周期,互联网、计算机的应用让调研可以更快地响应企业信息需求,达到分析效率和深度的平衡。
采集阶段
(1)高效:不受空间限制,可同时与分布在多个城市的与会者访谈
(2)大量:参会人数多,与会者发言次数多
(3)多样:与会者更能畅所欲言,表达真实想法,信息更丰富
分析阶段
(1)延展性:面对海量数据的分析能力大大提升。
(2)可靠性:资料分析的部分环节由软件来实现,更加客观,不受人为因素的影响,减少信息损耗,每次分析结果的一致性更高,结果的可靠性更强。
(3)深入性:在相对较短的时间内,得到价值层面的信息。
2、本研究的局限
定性资料采集阶段,所提出的MROC在线座谈会并不适用于所有的调研对象。比如老年人对网络使用不熟练,不宜采用网络座谈会,以及亲子配对座谈会也不宜采用。
定性资料分析阶段,目前的M-QDA(MROC定性资料分析软件)虽有无意义词和近义词的词库,在统计词频时可以过滤掉部分词,在词汇分类时作为预分类的依据,但处理方式仍然不够灵活,无法自动识别一些与主题无关的词汇、聚拢关联词,还需研究员来调整,词库需经足够时间的积累才能越来越有针对性。
参考文献
[1] Ellen Taylor-Powell Marcus Renner. Analyzing Qualitative Data, Program Development and Evaluation
[2]What is a market research online community (MROC) anyway?http://pluggedinco.com/blog/page/16/
3] GreenBook Research Industry Trends.http://www.greenbookblog.org/GRIT
[4]Will automated text analysis replace qualitative market researchers?http://pluggedinco.com/will-automated-text-analysis-replace-qualitative-market-researchers/
[5]曹培杰,尚俊杰,汪基德(2011). 基于词频分析的社会化软件教育应用特点[J].开放教育研究,(4)
[6]段宏毅. 焦点团体访谈的优缺点[J].北京工业职业技术学院学报 2009, (04)
[7]喻国明.跨界与整合:社会视野下2011年中国传媒业发展关键词——基于传媒业相关文本的词频分析[J].新闻与写作