我们该用社交资料做研究吗?

2015-01-21

我们该用社交资料做研究吗? | 文章内置图片
（图／取自网路)

快速和低廉是利用社交媒体来研究人们的想法和行为的巨大优势，因此许多行为科学家们都急切地希望通过它来开展研究。而当下日益壮大的社交媒体群，也因此成为了行为科学研究者的资讯「宝库」。但卡内基梅隆大学和迈吉尔大学的电脑科学家们，对这种想法提出了质疑：这些来自社交媒体的大量资料，可能会误导行为学的研究。

卡内基梅隆大学的于尔根•菲费尔（Juergen Pfeffer）与迈吉尔大学的德里克•鲁茨（Derek Ruths）认为，来自推特（Twitter）和其它社交媒体的资讯中存在固有的偏见，行为科学家们需要寻找到一个可以纠正这些偏见的方法，或他们至少要承认这些通过社交媒体资讯所得的资料是存在缺陷的。

这不是一个微不足道的问题。卡内基梅隆大学软体研究所助理研究教授菲费尔和迈吉尔大学电脑科学系助理教授鲁茨指出：在5年前，我们还几乎没有社交媒体这个资料来源，但目前，每年会有成千上万篇的研究论文是基于社交媒体所提供的资料的。

「并非所有的大资料都可以作为很好的研究基础。」菲费尔说。很多研究者认为通过收集一个足够巨大的资料库，就可以克服资讯中可能存在的偏见或者曲解的缺陷。虽然，研究者很难抗拒使用社交媒体作为研究资料来源的欲望。「人们想要说一些关于世界上正在发生的事情，那么，社交媒体就是一个很好的管道。」菲费尔说道。例如，在2013年的波士顿马拉松爆炸事件后，菲费尔在短短两周内收集到了2500万条与事件相关的微博。尽管这样可以免费得到数以万人的行为学资料，但仍需强调：「行为学研究中还是那句老话—瞭解你的资料。」

研究者会利用社交媒体研究一些很令人瞩目的问题—比如想知道人们怎么看待电子烟，人们是如何交流表达自己对于糖尿病的焦虑的，或者阿拉伯之春的抗议行动是否可以预测。现在，社交媒体已经可以作为这些问题的资讯源。

社交媒体常常使用专利化的演算法来生成或过滤他们的资料流程，同时，他们在改变这些演算法时也不会提示其它人。所以在使用社交媒体的资讯进行研究时，资料样品採集的缺陷也就无法得到解决。虽然某些研究者与个别社交网站有特殊关係，因此可以瞭解到网站内部的工作情况；但大部分研究者对网站这些演算法的操作是一无所知的。鲁茨和菲费尔认为，随着这些「嵌入研究者」的增多，会逐渐导致研究社会媒体的群体发生两极分化。

每一位使用社交媒体的人都知道，这些网站里的每一个帐号，并非都是由现实中的某人在使用。还有些帐号是专业作家或者公共关係代表的，他们使用社交媒体是为了代表名人或者公司。有些帐号仅仅是「僵尸」帐号，还有时「关注数」还是可以用钱买到的。社交媒体网站试图锁定和消除这些虚假帐户，那些在2013年註册的Twitter帐号，有一半已经被删除。但是对于形单影只的研究者来说，从一个资料库中发现这些无效帐户是十分困难的。

「进行现实社会科学研究的人，大多可以意识到这些问题。」菲费尔说。他认为，通过使用如流行病学、统计学和机器学习等已经存在的技术，可能可以帮助解决这些难题。当然，在其它的一些情况下，为了处理和分析资讯中的偏见问题，科学家们还需要开发一些新的技术。

【101创业大小事／整理报导】

免责声明：

部分图片、观点，来源于网际网路及其他网路平台，主要目的在于分享讯息，让更多人获得需要的资讯，其版权归原作者所有。如涉及侵权请告知，我们会在24小时内删除相关内容。

北市府举办交流会提供新鲜人在创业及就业交叉口决择

台北为国际重要的都市，也是台湾首都，在产业上有着不可忽视的地位，台北市政府为了打造良好的产…<<more>>

101创业大小事