0-6babyLee.cn|www|CNAME|0-6babyLee.cn|默认

加入收藏  设为首页

服务热线:4001000000



北京赛车官网

使实时Web相关


m.alisogou.cndigg_url ='http://digg.com/tech_news/Making_the_real_time_Web_relevant';如果有一个关于网络的普遍真理,那就是人们现在想要它。 在过去的15年中,我们对通过互联网向我们提供信息的速度的期望已发生变化。现在,突发新闻故事延迟几分钟是不可接受的,正如迈克尔杰克逊去年去世后几个小时疯狂搜索信息时所看到的那样。 输入实时搜索。搜索一直是我们访问网络的门户,只要它已经存在,当时的大型搜索引擎正准备应对新的挑战:新闻机构,博客和社交媒体如何制作即时内容的爆炸式增长 - 媒体用户是否以相关的方式组织,对现代通信中最差的信噪比进行排序?哦,顺便说一句,这些结果必须立即显示。 “如果信息是在几秒钟之前产生的,那与我正在寻找的相关,那么我应该可以在一个地方找到它,”Amit Singhal说道,他是Google研究员和搜索行业的传奇人物,负责Google的实时搜索项目。 “这太难了。” 自谷歌将实时结果整合到其网页以来已经过去了大约四个月,而谷歌和微软与Twitter达成交易以将该服务的“火炬”直接提供给这些公司则需要更长的时间。今天的实时搜索还处于起步阶段,但它是互联网搜索发展的下一个阶段。 是时候变得真实了 那么,什么是“实时”内容?有几乎同样多的定义,因为有些公司争先恐后地将他们的名字与互联网出版中更为大肆宣传的发展联系起来。 大多数人都认为它的中心是微博的概念,或者从社交媒体服务即时向开放网络发布内容。但在实践中,“实时搜索仍然主要是Twitter搜索,”搜索引擎土地的编辑Danny Sullivan说。 Bing的领先实时搜索专家之一微软的Paul Yiu表示同意。 Bing在其Bing.com/twitter页面上集中了几乎所有的实时搜索工作。 140个角色的服务是“现在正在发生什么”状态更新无可争议的王者,并且在伊朗起义和哈德逊河喷气式客机着陆等引www.ynfyLt.cn人注目的轶事中继续增长。 然而,在Twitter之外,Yiu认为实时信息有两个组成部分:状态更新或发布的实际内容,以及在该更新中共享的链接。 Yiu说,这两个部分都与搜索者的查询相关。 初创公司OneRiot的总裁Tobias Peggs建立了一家公司,前提是在状态更新中共享的链接比消息本身更具相关性。当你搜索一个主题,目的是找出上周在莫斯科发生的爆炸事件时,OneRiot会分析在状态更新和Digg等用户控制的网站中共享的链接,以确定最相关的内容是在特定时刻分享。 “我们过滤掉那些实时的社交噪音,并提取有用的信号,”Peggs说道,“洛杉矶时报”的最新故事讲述了成千上万用户转发的爆炸事件,而不是一则推文说“OMG,那些莫斯科爆炸事件是特别糟糕。” 与我的兴趣有关 实时搜索首先要确定重要的事情是在实时中发生的。 主要的搜索引擎可以将搜索查询日志中的峰值与某些主题中的峰值进行比较,这些主题来自他们从Twitter等实时信息源收到的提要。当围绕同一主题的活动对搜索查询流量和实时发布平台产生影响时,搜索公司就会知道正在发生的事情。 “地震”是硅谷的典型例子,震惊圣地亚哥和墨西哥北部的7.2级地震使该系统受到考验。 Singhal说,但是名人死亡,卫生保健法案通过等政治事件以及重大体育赛事将引发谷歌滚动的实时结果框。 此时,Google开始评估其实时内容来源的相关性,以确定该框中要显示的内容。有三件事:质量,或垃圾邮件或真实问题;内容作者的权威,由类似PageRank的算法确定,超越了仅仅是追随者的数量来评估一个人的追随者的质量;和语义评估,使用谷歌的语言数据来过滤可能共享字符但不相关的状态更新(“gm cars”与“gm食品”不同)。 在这一点上,这不是一门精确的科学。任何在突发新闻事件期间观看实时搜索结果流的人(今晚在Duke-Butler NCAA冠军赛期间尝试)将会看到很多来自Twitter用户的非主题喋喋不休www.hongshengjy1.cn
版权所有©0-6babyLee.cn|www|CNAME|0-6babyLee.cn|默认 0-6babyLee.cn|www|CNAME|0-6babyLee.cn|默认 0 网站地图