北京时间 5 月 15 日音讯,特斯拉 CEO 埃隆・马斯克 (Elon Musk) 称,为了弄清楚推特上的虚伪 / 垃圾账号是否像该公司长时间宣称的那样低于 5%,他将随机抽取 100 名粉丝作为研讨样本。然而,社交媒体、虚伪信息和统计剖析方面的专家表明,马斯克的剖析办法存在严峻缺陷。
“为了找到答案,我的团队将随机抽取 100 名 @twitter 粉丝。我会约请其他人重复相同的过程,看看他们会发现什么,”马斯克在推特中阐明晰自己的办法,并补充说,“挑选任何有很多粉丝的账户,疏忽前 1000 个粉丝,然后每 10 个挑选一个。我乐意承受更好的想法。”
马斯克要抽取 100 名粉丝做样本
Facebook 联合创始人达斯汀・莫斯科维茨 (Dustin Moskovitz) 通过自己的推特账号对这个问题进行了谈论。他指出,马斯克的办法实际上不是随机的,运用的样本太少,存在巨大的错误空间。“我觉得‘不信任推特团队会帮忙提取样本’本身便是个风险信号。”他表明。
华盛顿大学教授卡尔・T・伯格斯特罗姆 (Carl T. Bergstrom) 与人合写了一本书,帮助人们了解数据,防止被网络上的虚伪言论所欺骗。他表明,对任何一个推特账户的 100 名粉丝进行抽样查询,都不应该成为进行一笔 440 亿美元收购的“尽职查询”。
他说,100 人的样本规划比社交媒体研讨人员研讨这类工作的规范小了几个数量级。马斯克运用这种办法面对的最大问题将是挑选偏差。“没有理由信任推特官方账户的粉丝是该平台账户的代表性样本。也许机器人不太或许重视这个账户以防止被发现,也许他们更有或许重视以便看起来像是正常账号。谁知道呢?但我仅仅无法了解,马斯克除了用这个愚笨的抽样计划来欺骗咱们之外,他还做了什么。”