据《大西洋月刊》网站报道,研究人员编写出了一种新算法,该算法仅凭借140字内微博就可以预测Twitter用户的性别。用户性别的判定算法可为Twitter带去经济收益,语言学家德利普·劳(Delip Rao)表示:“营销是一个主要刺激因素,我听说Twitter也在内部进行类似人口统计并确认算法。”

新算法不但可以预测用户性别,它还可以识别假冒身份。比如,一位年长的大叔假冒成女同性恋博主,该算法就可以识别出来。

该算法之所以可以预测用户性别,其中的关键在于女人使用语言的差异性。如果微博中包含感叹号或者笑脸,那么这个用户可能就是一名女性。其它研究这证明了这种推测,调查发现女性更喜欢使用表情符号、缩写词、重复字母表达情绪。语言学家甚至可以根据用户“我的”(My)词汇使用方式判断用户的真正身份。

女人喜欢谈论购物、巧克力等话题,如果相关词汇出现在Twitter微博中,基本可以判定这名用户是位女士,据称这种算法的准确率在75.8%。

互联网用户身份的确定可以给予营销者更加明确的目标,该算法的另一个功能就是确认用户的假冒身份。

google日前一直也在研究搜索引擎人工智能,可以通过算法识别用户的年龄,性别,兴趣喜好等,然后可以进行精准的光狗投放。

搜索引擎中seo(搜索引擎优化),也是研究这个领域,用模拟真实的用户行为,来完成网站的UI设计,内容撰写等,从而吸引搜索引擎的蜘蛛(spider),进而获得好的排名的过程。

未来谁能分析透彻用户行为,谁能更懂用户,谁的商业价值就更大。