(一)个性品格
开放式的大数据与已有的心理学理论和心理测量工具的结合,为进一步了解人类心理特征提供了新的方法。传统的心理特征的研究主要是基于实验法和问卷测量,但是这两种方法会因被试了解到研究目的后产生偏差,测量结果并不一定能够代表被试的真实行为和想法。而社交媒体中用户所产生的大数据为心理学特征的测量提供了一个具有生态效度的数据源,这些数据是个体日常的行为和思想表现,不会受到研究者的影响。个体心理特征主要是通过行为、词语或语言方式体现出来,比如一个性格外向的人会更多地表达积极的情感和社会性的话语,而在社交媒体中,主要是通过语言用词来体现个体的性格差异。
Fern等人通过开放式的语言分析法,利用大数据探索社交媒体中词语使用与个体人格特征之间的关系。相比传统的人格特征研究,Fern等人所收集的数据量更大,共有69792个脸书用户作为被试,这些被试在脸书上发布的状态词数均超过1000条,总状态数达到2000万条,包含了4.25亿个词语和短语。在社交媒体中,个体经常会使用一些非标准化的拼写方式,这在传统的封闭式语言分析方法中很难识别,但是在该研究中,一种新的分析方法,即开放语言分析法被用来识别包括表情符号、拼写错误、短语和长句等语言表达方式,然后将这些语言表达方式进行分类。人格特征则是通过一个嵌入在脸书中的大五人格量表所收集,参与者在填写问卷之前要求回答是否同意匿名使用测试成绩进行研究。
以发布状态总词数大于1000和至少完成一个方而人格测试为标准,该研究筛选出69792个被试。数据分析包括三个步骤:特征提取、相关分析和数据可视化。特征提取即通过开放式的语言分析将词语和短语从句子中分离出来,然后那些被1%的人群所使用的词语和短语被作为高频用语进行统计。之后相关分析用于分析高频词语和短语与人格特征之间的关系。而大数据分析的一个重要特征是使分析可视化,可视化的相关关系更适合人类思维理解方式。研究将100个与特定人格特征最相关的词语和短语整合成词云形式,词语和短语越大,表示与特定人格特征相关性越强,说明人格特征主要是通过这种词语和词组表现出来。比如在高神经质人格特征中,包括抑郁、孤独和自杀;而在高尽责性人格词云中,则是工作、成功和繁忙。
通过识别与个体人格特征相关的主要词语和短语,该研究探索了社交媒体中大五人格与语言表达之间的关系,表明人格特征可以通过日常语言表达出来。从另一个角度来说,通过观察个体在社交媒体中发表状态中常用的词语和短语,可以预测个体的人格特征。
(二)幸福感
幸福是人类的终极目标,幸福感也是积极心理学长期关注的主题。但是现有的关于幸福感研究还存在诸多不足,如幸福感的测量均采取自我回顾式报告,自我回顾式报告造成的记忆偏差目前还无法完全克服等。人和环境系统的互动会对个体幸福感产生影响,既往研究出于实操层而考虑,没有把外部环境因素广泛纳入到研究中去。而社交网站中用户衍生的海量个人状态数据为幸福感及与外部环境的互动研究提供了实证基础。大数据具有两个特点:一是代表着抽取数据是个体的实时幸福状态;二是可以将个体的实时幸福状态与外部环境进行匹配,比如实时的天气状态,从而可以预测外部环境因素对个体幸福感的影响。
Curini , Iacus和Canova通过对意大利110个省的3.6万个用户在近一年时间中发表的4300万条推特信息进行数学分析,发现了影响居民幸福感的重要因素。该研究在获取4300条推特信息后,利用推特内置的表示开心和不开心的表情符号作为训练样本,经过对这些数据训练后,使用Hopkins和开发的分析方法来识别其他特推信息所代表的个体幸福状态,然后构建幸福感指数,计算实时幸福感水平。将实时幸福感指数与外部环境匹配后,研究发现,季节、天气、气温及其交互作用对居民幸福感有重要影响。在冬天,气温的增高会显著增加居民的幸福感。而在夏天这一情况更加复杂,气温每增加1度,居民的幸福感就会增加0.5个单位,但是当气温增加到30度时,会出现“快乐水车”现象,即幸福感不会再提升。研究还发现,在下雨天的时候,居民的幸福感会显著降低,而下雪对居民幸福感影响不大。除了这些环境因素外,研究发现重大的节日会显著地提升居民的幸福感,比如圣诞节和父亲节。
除了分析文本信息外,研究者还开始使用移动设备获得个体的实时幸福感及其影响因素,例如sworth和Gilhert开发了一个手机应用程序,在一天内间隔一段时间向用户发送简短的问题来获取实时的情绪、思维和活动状态,发现个体在专注做一件事情时会感到更加幸福。美国心理学家塞利格曼等人通过对推特用户数据分析,建构了一张美国的幸福地图,能够有效预测幸福的自然集合事件。基于社交网站的大数据在不断重新建构幸福感的研究方式。