发布时间:2014-07-14 11:44 原文链接: 中科院心理所:大数据把脉社会心理态势

   信息科学技术的发展和互联网平台的出现,为及时有效感知社会心理态势提供了新的契机,使通过网络数据实现对用户心理要素的计算预测成为可能。

  目前,国内的微博用户数量已近3亿人。不可否认,微博在快速改变传统网络舆论格局力量的同时,也逐渐展现出其自身所具有的独特优势。用户在微博平台上可以真实、自发地表达或分享自己的情感、观点和社会态度,为社会心理研究提供了大量真实、可靠的潜在数据源。

  “我们团队提出利用微博大数据,开展社会心理态势感知研究,在对社会媒体大数据分析的基础上实现社会心理要素识别,并预测相关心理要素的发展趋势,建立快速准确的社会心理态势感知系统。”中国科学院心理研究所(以下简称心理所)研究员、社会与工程心理学研究室主任朱廷劭告诉《中国科学报》记者。

  构建“心理地图”

  描述群体的心理状态及其发展趋势,能够对群体和个体的行为取向进行预测,就是社会心理态势。朱廷劭介绍说,社会心理态势主要由社会群体中个体的心理态势组成,也同时影响着个体心理态势发展的方向和趋势。人们对涉及的社会事物,因其是否符合自身物质方面或理念方面的需要,会产生不同的体验和态度,这些都属于社会心理态势的范畴。

  一直以来,通过大范围的问卷测评方法是研究社会心理态势感知的主要手段。但是该方法受时效性、社会赞许性等因素影响;同时自陈方式的测评周期长、成本高,无法及时大规模获取用户的心理状态,而且纵向追踪研究不具有实施上的可行性。

  为此,该研究组开发的新浪微博应用“心理地图”在线问卷填写和调查平台,可以满足大规模用户调查的需求。“走”一圈“心理地图”大概需要花费15分钟,这样就能来一场集中的自我心理问答。其中不少问题都是我们某一时刻心情的写照。

  “心理地图”具有微博数据抓取的网络爬虫功能,其中数据量超过10TB,完全具备了微博大数据的获取和处理能力。

  科学计算识别各类要素

  朱廷劭说,社会心理态势要素包含人格、心理健康、主观幸福感以及社会态度等多方面的指标。通过网络数据对这些指标进行预测是社会心理态势感知的重要组成部分,他们得出了不少新的结论。

  首先是人格。人格的定义是代表人际之间存在个性化差异的重要原因与心智基础,个体的人格特征有助于身份识别。

  朱廷劭团队的研究中,在征求用户同意的情况下,随机选取547名微博用户作为被试者,下载其微博行为记录,并提取839个行为特征作为预测变量;同时,对全体被试施测大五人格问卷,获取其在各人格维度上的得分作为结果变量。

  他们利用支持向量机与Pace回归算法分别训练基于微博行为的人格计算模型。

  “研究结果表明,基于微博行为的人格计算模型拥有良好的测量属性。”朱廷劭说。利用支持向量机模型,微博行为对各人格维度高低得分组被试的分类精度达到84%~92%;利用微博行为建立的回归模型,基于微博行为的人格预测结果与基于自评问卷的人格测验结果之间的相关系数达到0.48~0.54。这表明,通过微博行为来预测用户的人格特征是完全可行的。

  再有,针对心理健康的问题,朱廷劭团队使用新浪微博数据建立心理健康(抑郁)预测模型。利用被试的微博数据,并用机器学习的方法建立模型,通过模型计算得出被试的抑郁状态评分。

  他们抽取1万个已签署知情同意书的新浪微博用户,并施测抑郁测评问卷;同时提取其内容与行为两方面建立特征,建立了心理健康的回归预测模型。结果表明,预测模型值与真实值的相关系数接近0.4,达到中等相关水平。

  其次是主观幸福感。指人们对其生活质量所作的情感性和认知性的整体评价。他们采集了1785名已签署知情同意书的用户作为被试者,其中649名男性、1136名女性;采用不同的特征集合建立了主观幸福感的预测模型。

  研究结果表明,使用行为特征、内容特征,同时加入年龄、性别、收入和受教育程度等统计信息特征,可以达到最优的预测效果。模型相关性可达到0.31~0.54,表明利用微博数据预测得到的用户幸福感是可行的。

  最后一个研究内容是社会态度。根据先前研究的经验,将社会态度分为四方面的指标,分别为社会状况评价、社会风险判断、经济发展信心和对政府执政的满意程度。

  该研究团队在广东省开展用户实验,并采集了2018个已签署知情同意书的合格样本,利用微博数据,采用多任务回归进行群体社会态度的预测。

  预测结果和标注结果的平均相关系数达0.41,平均预测误差率为15.5%。本研究利用网络数据的可回溯性,能够描述指定区域群体社会态度随时间的变化情况。

  在社会态度预测结果的基础上,利用微博数据计算预测出的区域社会态度与宏观经济指标高度相关,表明微博预测模型的有效性。具体来说,将结果与广东省各地市年度经济指标进行相关性分析。

  “结果显示,地方经济满意度和经济指标显著相关,而生活满意度、收入满意度、社会地位满意度以及国家经济满意度则为弱相关。社会消费品零售总额和批发零售贸易业零售额与社会公平满意度正相关。”朱廷劭解释道。

  社会心理发展趋势预测

  朱廷劭团队用时序分析技术预测社会心理发展趋势,并预判网络群体事件发生的风险指数,通过多种如新闻媒体等渠道,得到某地发生的群体事件。

  针对群体事件数量少的情况,朱廷劭团队综合采用多种机器学习方法,利用微博数据预测群体事件风险,实现对群体社会态度临界状态的预警,为及时化解可能的群体性事件提供数据支持,助力社会管理创新。

  综上所述,社会心理态势的感知变化,可设置特定场景,观察社会心理态势可能的变化趋势(事件刺激)。针对不同类型的网络用户,可以甄别其社会心理态势。

  “我们研究分析社会心理态势,可以发现并监测社会不稳定因素,提请国家有关部门及时采取措施,化社会不稳定因素于未然。研究表明,开展社会心理纵向研究,可作为数据智囊为社会管理提供更科学、更客观的发展报告。”朱廷劭说。

相关文章

数据流通市场的基础理论与治理方法项目指南

2024年度国家自然科学基金指南引导类原创探索计划项目“数据流通市场的基础理论与治理方法”项目指南以数据要素为核心引擎推动数字经济深化发展,有利于构建新发展格局、建设现代化经济体系、构筑国家竞争新优势......

国家计量科学数据中心“计量与数字化”学术会议在恩施市顺利召开

10月21日下午和10月22日上午,国家计量科学数据中心在恩施市接续2024年度工作会召开了“计量与数字化”学术会议。本次会议共安排了13场精彩的学术报告,展出了系列学术墙报,并为学术墙报获奖者颁奖。......

国家计量科学数据中心2024年度工作会暨“计量与数字化”学术会议恩施州开幕

金秋十月,丹桂飘香。2024年10月21日,国家计量科学数据中心2024年度工作会暨“计量与数字化”学术会议在湖北省恩施州顺利召开。本届大会由中国计量科学研究院主办,湖北省计量测试技术研究院和恩施州计......

持续改善!玛伐凯泰治疗梗阻性肥厚型心肌病迄今最长疗效和安全性数据公布

百时美施贵宝近日公布了MAVA长期扩展研究(MAVA-LTE)中EXPLORER-LTE队列的最新长期随访结果。该研究旨在评估迈凡妥®(玛伐凯泰胶囊)治疗纽约心脏协会(NYHA)心功能分级II-III......

数据已成为当今企业发展的关键要素

8月28日,2024中国国际大数据产业博览会在贵阳开幕。会议期间,国家数据局局长刘烈宏主持召开企业家座谈会。他表示,企业家提供的情况为分析当前数字领域发展形势、研究制定政策举措提供了重要参考。“数据已......

天平新品专栏|如何应对多通道数据传输

我需要把称量数据传到到电脑里做后续的分析;我需要把称量数据传输到我们的LIMS系统里;我需要将称量数据传输到我们的MES系统里;手工记录麻烦且容易出错,随着智能自动化的发展,越来越多的用户对天平有数据......

天平新品专栏|如何应对批量样品称量数据

不惧繁琐,轻松数据管理批量样品称量数据如何管理?手工抄录,费时费力,容易出错;纸质打印,誊抄录写,繁琐至极;梅特勒托利多新一代高级天平新增称量结果记事本功能,助您简化批量称量工作!称量结果记事本,针对......

用AI数据训练AI可能最终导致崩溃

《自然》7月24日发表的一篇论文指出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”(modelcollapse)。该研究显示,原始内容会在数代内......

《自然》封面:以AI生成数据训练AI,模型变傻?

大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝......

新型超材料打造数据“高速公路”

科技日报北京7月18日电(记者张梦然)德国亥姆霍兹-德累斯顿-罗森多夫中心、开姆尼茨工业大学、德累斯顿工业大学和于利希工业中心联合团队合作开发出一种超材料,材料中的圆柱域不仅可存储单个比特,还可存储整......