情感分析是这些年计算机学中的一个新研究方向,说白了它就是试图将人们的情绪和情感数据化,手段会包括自然语言处理、统计学、信号处理等。最适合情感分析的平台也是在最近几年兴起的微博类(Microblogging)社交平台,在美国就是Twitter。
佛蒙特大学计算实验室的项目Hedonometer在过去的五年中每天都会对 Twitter 上面的千万条Tweet进行情感分析,并将其结果记录了下来。Hedonometer主要是通过自然语言处理来分析情感,比如它会在人们的Tweet中寻找一些反映正面情绪或者负面情绪的关键词。
我们能从图中看出每一年的幸福度最高点都是 12 月 25 号,也就是圣诞节。其它幸福度高的日子包括元旦、感恩节、情人节等。从每周来看,人们平均幸福度最高的一天是星期六,而最低的一天是星期二。
但是自 2008 年之后,Twitter上面总体的幸福度一直呈下降趋势。这或许是因为2008年的美国金融危机,以及之后导致的持续经济不景气。我们能看到幸福度最低的一天就是上月的15号,也就是波士顿马拉松爆炸发生的那一天。
但是 Hedonometer的算法明显是不完美的,因为 2011 年5月2号是美国宣布奥萨马本拉登被击毙的那一天,但是 Hedonometer错误地认为这一天的幸福度很低,因为“死亡”、“杀死”等负面词汇在 Twitter 上面的频繁出现。完全理解人类的自然语言是一个AI Complete的算法难题。
如果用同样的手段对微博进行情感分析,每年的最高点应该是会在春节。但是还会有哪些其它的区别?
IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。
小何
小何
小何
小何