特大社会事件除了造成政治、经济等方面的影响外,社会情绪也会受到波动,这种余波持续时间长短不一,受到波及的个体可能会在短时间内恢复,也可能会持续相当长时间。过去也有学者试图论证它可能造成的社会情绪影响,如大量研究探讨911事件发生后美国社会民众反应。但是社会创伤事件的心理影响较难研究,研究者需要采用纵向设计进行十预测量事件发生后即刻反应以及长期心理反应,因而这类研究必然面临一系列挑战。首先数据收集只能在创伤事件发生以后,任何人都无法预测特大事件发生,这意味着没有办法获取事件发生前的前测数据。更重要的是,研究者很难在事件发生的第一时间收集信息,无法快速获取信息意味着某些重要数据可能会被遗漏,因为存在受害者可能会忘记的心理症状。此外,相关信息的收集也需要考虑到伦理影响.此类研究不易得到伦理委员会批准或者资金赞助,即使获得许可和资金支持,当地组织也会严格限制研究者接近潜在的受访者,而大数据为这类研究提供新的可能。
Jones , Wojcik , Sweeting和Silver的伊斯拉案例详尽说明如何利用大数据克服以往心理学研究挑战。在美国国家调查数据中,两个地区被选择作为研究对象,一是连环杀案发生的圣塔巴巴拉地区,一个是在人口经济特征相似的弗拉格斯塔夫。因为推特地理追踪只能搜索三天以内的信息,为了保证样本代表性,推特用户分为社区用户和校园用户,研究者列出当地机构账号,关注这些账号主要是当地居民,通过这种方式获得两个地区居民账号;其次直接从当地学校账号提取学生的推特用户名,为了进一步确保样本准确性,研究者对获取数据进行再次筛选,通过推特地理位置的检索删除非当地用户。采用这两种方式,当地的推特用户信息被全面覆盖收集。对数据的处理主要是采用文本分析,同汇库、语言辞典列出了负性情绪同汇,在事件发生后的第一天,推特信息出现的事件常用描述同汇22个。将含有负性情绪表达或者事件相关同汇的推特信息编码为1,否之编码为0。对数据分析主要是采用stata分段回归分析,结果显示,无论是社区还是校园用户,圣巴巴拉地区在事件发生后的6周内负性情绪的表达比例更高,负性情绪在1周之内表现最为显著,即6-7天之内波动是最剧烈的,两周以后基本回到基线水平。
我国也有学者进行类似研究,叶勇豪等人提取"7.23动车事故”后微博数据,分析网民对一系列衍生社会事件道德情绪特点以及在不同群体中表现的差异。研究者列出事件及衍生事件发生轴,并根据时间轴对微博数据进行持续爬取。事件热点维持时间为40天左右,研究截取数据时间段为2011年7月23号到2011年9月1号。为了将无关微博信息清洗,根据事件相关同汇提取有效微博信息。此外,为了对比性别对情绪表达影响,需要进一步追踪微博用户的基本信息,采用“结巴分同工具”对文本内容进行分析。值得注意的是,该研究从总数据中抽取十分之一数据作为测试数据集,用于测量模型预测能力。分析表3个事件分别与几种道德基础相对应,违反3种道德基础将分别诱发鄙视、同情和愤怒,这3种不同的道德情绪因性别产生差异,女性的情绪表达强度更大。