网络社交媒体的情感认知与计算
清华大学电子工程系 清华大学信息科学技术国家实验室 黄永峰
情感计算的概念
情感计算(affectivecomputing)的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。情感计算:情感识别、情感表示、情感建模、情感交互等四个方面。
情感计算的概念
语言是人类思维直接现实、思想的传播载体、情感的表达媒介,因此也是情感计算的重要对象。
Plutchik’s 情绪心理模型 情绪3维度模型:强度、两极性和相似性
网络媒体的情感倾向性计算概念
利用自然语言处理、文本分析和计算语言学的方法从文本中分析人们的观点、情感、评价、态度和情绪等信息,也称观点挖掘(Opinion Mining)。
网络社交媒体的大数据特征
由Web2.0平台产生,一般在200个字符以内的网络文本。
- 微博博文:新浪微博和Twitter博文
- 社交网络:人人网和Facebook状态消息
- 即时通信:QQ和微信消息
- 网络评论:京东和携程评论
网络社交媒体是一种典型的网络大数据
- 大量(Volume)
- 快速(Velocity)
- 多样(Variety)
- 不确定(Veracity)
网络社交媒体的大数据特征
腾讯每日同时在线QQ用户1.6亿,每天300G存储量。新浪微博每天有数十亿访问需求。高峰期每秒要接受100万以上响应请求。
数据更新快
- 新浪微博每秒发帖量在2500条以上
- Twitter每秒发帖量甚至达到过14300条
多样性
不确定性
词的情感不确定性
- 噪声更多,网络非正式语言
- 社交话题的多样性
- 情感分析的话题依赖性
- 句子的情感不确定性
- 上下文语境的多样性
- 情感分析的上下文依赖性
网络社交媒体中蕴含情感信息
网络社交媒体中蕴含丰富的网络用户情感信息,已成为国家和企业了解网民情感和观点的最佳资源。
网络媒体情感计算的应用价值
典型的应用案例
印 第安纳大学学者利用Google提供的心情分析工具,从用户970万条留言,预测道琼斯工业指数,准确率达到87%。沃尔玛基于每月4500万网络购物数 据并结合在社交网络上挖掘出的对产品的大众评论,开发机器学习语义搜索引擎“北极星”,使得在线购物者增加10%~15%,增加销售十多亿美元。华尔街 “德温特资本市场”公司分析全球3.4亿微博账户留言,判断民众情绪,人们高兴时会买股票,而焦虑时会抛售股票,依此决定公司股票的买入或卖出。该公司今 年第一季度获得7%的收益率。
网络媒体情感计算的学术意义
情感计算对相关学科的促进
网络媒体情感计算的今天
网络媒体独特的特点给传统文本情感计算方法的精准度带来了巨大的挑战
情感词的语义不确定性
面临挑战
如果需要免费下载完整版《网络社交媒体的情感认知与计算》pdf文档,请进入今日报告网https://www.imxdata.com/(国内唯一免费的行业报告下载网站)下载。
我来说两句排行榜