实时统计:在“askreddit”评论中提及特朗普的次数对比提及克林顿的次数

 

rtstatistics.com提供真正实时的海量数据统计平台,它将海量数据的实时统计与快速的查询响应相结合,可以应用于不同行业的多种场景之中,从而给最终用户带来真正实时而且响应迅速的体验。

Reddit是一个著名的娱乐、社交、及新闻网站。网站上的内容分类被称为“subreddit”,“askreddit”就是其中之一。

特朗普(Trump)与克林顿(Clinton)是两位美国总统候选人。通过对比在“askreddit”中发表的评论里这两人名字被提及的次数,可以从侧面了解到民众对他们的关注程度。

在“askreddit”中发表的评论被一台服务器收集并通过REST API(POST https://api.rtstatistics.com/dataset/{id}/items)发送到实时统计平台rtstatistics.com。在这个实时统计平台里相关数据被汇总以生成统计结果。这个演示页面通过另一个REST API(GET https://api.rtstatistics.com/statistics/{id}/detail)对统计结果进行查询。从评论被rtstatistics.com接收到,到更新后的统计结果可以被查询到,这期间的延时一般来说小于1秒。

这个演示页面上的图表是利用开源的c3.jsd3.js绘制的,c3.js所需的数据是利用开源的cjtsd-js墙内repo)对服务器返回的查询结果数据进行格式转换得到的。

本演示的源代码是公开的,可以在这里GitHub上找到。

本页面上图表的刷新间隔是可以调节的,只要拖动下面这个滑块就可以了。在刷新图表的时候,如果服务器返回了更新的统计结果,它就会在图表中得到体现。如果你不动这个滑块,刷新间隔会自动地从每1秒逐渐放慢到每1分钟。

刷新间隔(秒):  

 

特朗普对克林顿:在评论中被提及的次数(按UTC时间每小时汇总)

最近一小时:

这张图表显示了在最近72小时内,每小时有多少条评论提及了“Trump”,多少条评论提及了“Clinton”,以及多少条评论同时提及了他们两位。图中还显示了这些提及他们的评论占所有评论的百分比。

图表绘制采用了c3.js,显示的时间为UTC时间。

 

评论总数(按UTC时间每小时汇总)

最近一小时:

这张图表显示了在最近72小时内,每小时总共有多少条评论。

图表绘制采用了c3.js,显示的时间为UTC时间。

 

互不相同的评论内容的总数(按UTC时间每小时汇总)

最近一小时:

这张图表显示了在最近72小时内,每小时共有多少条互不相同的评论内容。由于难免有相同的评论内容被多次发表,所以互不相同的评论内容数通常会小于评论总数。

图表绘制采用了c3.js,显示的时间为UTC时间。

 

其他相关资源