题' '&' ' 目: BrowseRank : Letting Web users Vote for Page Importance
汇报人:何书元教授,北京大学数学科学学院概率统计系
时' '&' ' 间:5月11日(周一)下午2:00-3:00
地' '&' ' 点:拉斯维加斯9888新楼217教室
Abstract:
PageRank 利用离散马氏链作为统计模型,是用网络链接图推算网站沉要性的一种算法,但是遇到了很多不易克服的问题, 其中最沉要的原因是一些 spam 的网络治理员通过造作大量的指向自己网站的超链接, 或通过搜索引擎技术的不良技巧去提高自己的排名,以获得更多的经济利益.
此刻介绍的是利用网民的浏览行为推算网站沉要性的排序新步骤, 称为BrowseRank. 本步骤以Q过程作为统计模型,较好地克服了上述问题. 我们还利用30亿个上网纪录,对于500多万个网站进行了统计分析,选出了全球最沉要的20个网站.