彬Go

关注前端开发/网页设计/网站可用性/用户体验,暴风彬彬的趣味互联网生活…

Google’ 分类下的所有文章

Google推出404页面工具

据Google中文网站管理员博客报道Google在其网站管理员工具中新增了一个“增强型 404 页面” 工具,登录Google网站管理员后,点“工具”-“增强型 404 页面”即可获取相关代码。

404 网页是用户尝试访问网站不存在的网页(由于用户点击了损坏的链接、网页已被删除或用户输入了错误的网址)时看到的页面。之所以称为 404 网页,是因为针对丢失网页的请求,网络服务器会返回 404 HTTP 状态代码,表明该网页未找到。

通常用户最好创建一个自定义的 404 网页,以便获得这部分用户流量。一个好的自定义 404 网页可以帮助用户找到所需信息、提供其他实用内容及吸引用户进一步浏览您的网站。

Google提供的404页面工具,可以在页面错误发生时给出一个智能搜索框和一个最相关的链接地址。这项工具提供的是基于Javascript的网 页,当出现404错误时,Google将在网页上列出一个内容和一个与“失踪”网页的最相关的其它地址,并提供一个基于Google的站内搜索框。

目前发现这个404工具目前还不支持中文(尽管Google声称支持中文),生成的404页面提示语言全是英文的,希望Google能尽快修复这个问题。


  从今天开始本博客将为大家详细介绍从Google Earth上能够看到的各种有趣的地标,也许有很多地标大家都看过,但暴风彬彬在这里将详细介绍不同高度俯视的样子,并尽可能搜集相关的文字介绍。让您坐在电脑前就能一睹世界各地标的风采。

注:所有截图均为上北下南
先从中国的标语开始,共有六大标语,分别是:
Google-Earth-毛主席万万岁
毛主席万万岁,长400米,宽50米(Google Erath坐标:42°39′17.88″,94°10′0.50″)

本文未完,点这儿看完整内容 » »

据Google LatLong博客报道,在北京奥运会的女子公路自行车比赛中获取金牌的美国选手克莉斯.阿姆斯特朗(Kristin Armstrong)在Google Earth/Maps团队博客(Google LatLong)上发表文章说,她的这枚金牌是在谷歌地球(Google Earth)软件的帮助下获得的。

本文未完,点这儿看完整内容 » »

Google 评价 blog 的指标

读了一下 Google 关于 Blog Ranking 的 Patent,总结如下。

正面的指标:

  1. [0038] 订阅数
    统计 blog 在各种 reader 中被订阅的数量。被订阅的越多,ranking 越高。但同时会使用一些方法处理“subscriptions spam”,诸如验证订制人和 IP 的唯一性。
  2. [0039] 搜索点击数
    统计 blog 作为搜索结果时被点击的次数。点击次数越多,ranking 越高。
  3. [0040] 在其他 blogger 的 blogroll 里的出现次数
    blogger 通常会使用 blogroll 来整理指到其他 blogger 的链接集合。统计所有 blogroll 中,指向某个 blog 的链接越多,ranking 越高。
  4. [0041] 来自高质量的 blogroll 的链接数
    高质量的 blogroll 的链接大多都指向著名的或值得信任的 blog。
  5. [0042] 来自高质量的 blog 的 blogroll 的链接数
    这里的假定是著名的或值得信任的 blogger 不会放指向 spam blog 的链接。
  6. [0043] 有Tag
    blog 作者如果分析了 blog 内容,归类并打上了 tag,起码可以说明作者的态度比较认真。
  7. [0044] 来自邮件和聊天记录的链接数
    如果在 Email 正文里或者聊天记录里出现了指向 blog 的链接,会加分。GEmail 和 Gtalk 被用在了这里。
  8. [0045] PageRank
    PageRank 越高对应的 blog 也就越重要。考虑到blog的更新比较频繁,最新的 blog post 可能还没有PR。这时可以用对应的 blog 的 PR 来代替。

其中 [0040-0042],其实是类似于传统网页间 PageRank 计算的一套模式,只不过这里把它限制在了 blog 之间。

负面的指标:

  1. [0047] 更新频率异常
    更新过于频繁或者非常有规律,会被认为是在 spam,ranking 会降低。这里提醒喜欢在每天的固定时间更新 blog 的朋友注意一下了。
  2. [0048] feed 内容和 blog 内容的不一致
    spammer 有可能会为了提升自己的 ranking 而把有价值的内容放到 feed 里面,同时在 blog 内容里面放一些指向不相关内容的广告链接。为了惩罚这种情况,对于 feed 内容和 blog 内容不一致的情况,要降低 ranking。
  3. [0049] 出现重复内容
    有些 spammer 为了让某些内容能够多次长时间的出现在 feed 里面,会重复发布同样的内容。这样的情况会被惩罚。
  4. [0050] 垃圾词过多
    通过词频统计(bi-gram 或者 tri-gram 等),如果 blog 内容里垃圾词的比较过高,会降低 ranking。
  5. [0051] 多数 blog 长度相近
    这个主要是针对使用机器自动生成 blog 的情况。
  6. [0052] 链接异常
    当 blog 里的链接多为指向单一网页,或者单一的外站,会被认为是在 spam,ranking 会降低。
  7. [0053] 广告太多
    如果一个 blog 页面内含有过多的广告,会降低 ranking。
  8. [0054] 广告出现在正文里
    一般 blog 页面会包括三方面的内容:最近发表的 blog,blogroll 和 metadata。如果广告出现在正文里,会降低 ranking。不知道 adsense 的广告有没有特殊待遇?


转自beyond search

  • 3 条评论了已经
  • 分类: Google, SEO
  • 浏览:999
  • Google 网页排名背后的技术

    搜索排名的核心技术源自已有50年历史的学术课题 Information Retrieval (IR),IR 技术使用统计学原理对文字的使用频率等属性进行研究并对结果进行排名。建立在 IR 理论上的 Google 搜索同时借助链接,网页结构等等技术形成独特的搜索技术。

    理解网页多年来在网络爬虫与索引系统上投入巨资,因此,Google 拥有非常庞大并且是最新的网页索引,除此之外,Google 还使用一些最新技术提高索引质量,比如,他们开发了一种技术,可以在字面意思之外理解一个网页所表达的重要概念,人们使用意大利语言搜索 “galleria sprovieri londra”,会找到伦敦的 Sprovieri Gallery,尽管 Sprovieri Gallery 主页上既没有 London,也没有 Londra 字样。其它技术包括,区分一个网页中的重要或非重要文字,以及网页内容的新鲜度。

    理解语义可以通过用户提供的几个搜索关键词,理解用户的真实意图。他们在拼写纠正,词义,以及概念分析方面处于非常领先的位置。很多人都或多或少体验过 Google 的拼写纠正功能,比如搜索 “kofee annan”,Google 会问你搜索的是否 “kofi annan”,然而,当有人搜索 “kofee beans”,Google 会纠正成 “coffee beans”。(Google 事实上已经在尝试语义技术 – 译者)词义是 Google 尝试理解查询语义的基础,也是 Google 遇到的最大难题。一些在人看来显而易见的东西,机器却很难自动处理。用户并不想对使用什么词汇进行查询而费神,人们甚至压根不知道该使用什么进行查询。在这种时候,Google 的词义系统便可以发挥作用,词义系统可以对查询语句进行非常复杂的修正,比如,查询 “Dr Zhivago” 的时候,Google 知道 Dr 代表 Doctor ,而查询 “Rodeo Dr” 的时候,Dr 代表 Drive。用户搜索 “back bumper repair” 的时候,结果是 rear bumper repair,而搜索 “Ramstein ab”,Google 能够将 ab 理解成 Air Base,”b&b ab” 会理解为 Alberta 的 Bed and Breakfasts 。Google 将这种词义理解系统发展到上百种不同语言。

    在搜索排名中使用的另一项技术是概念识别,该技术可以对查询的内容进行概念识别,比如,我们查询 “new york times square church”,Google 知道我们实际上查询的是纽约时代广场上的那座著名教堂,而不是纽约时报中的某篇文章。概念识别技术并不止这些,Google 还对其进行加强以正确地识别语义,比如,搜索 “PC and its impact on people”,事实上是搜索计算机对社会的影响。Google 的搜索分析算法中这类技术比比皆是,而且面向几乎所有语言。

    理解用户尝试理解用户的目的是为用户返回他们真正需要的结果,而不是他们在搜索语句中所说的东西。该技术基于一个世界级的本地化系统,外加先进的个性化技术,以及各种用户意图识别技术。

    对本地结果的重视体现在他们的本地化工作中。同样一个查询语句在不同国家会返回不同结果,比如,查询 “bank”,在美国返回的是银行,而英国则可能是 Bank Fashion 的服装连锁店,或者英国的银行,而在其它英语国家,如澳大利亚,加拿大,新西兰,南非,返回的则应仍旧是当地的银行。如果你在一些非英语国家查询这个词,象埃及,以色列,日本,俄罗斯,沙特,瑞士,返回的结果将更有趣。就象 Football 在美国和英国表示不同的运动项目一样,同一个词在不同国家查询的结果可能截然不同。

    个性化查询是 Google 另一项先进搜索技术,一个已经登录的用户,如果开通了 Web History 服务,随着他查询时间的增长,Google 会根据他的查询历史,自动调整返回的结果,比如,一个经常查询 Football 相关话题的人,会逐渐从 Google 得到更多足球相关的结果。如果你青睐某个购物站返回的结果,在以后的查询中,会从那个购物站得到更多结果。

    在返回用户真正想要的结果方面的另一个例子是,假如你搜索 “chevrolet magnum”,我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会自动返回 dodge magnum 的结果。还有一个例子,有人搜索 “bangalore”,不仅返回 Bangalore 这个城市的主页,而且返回 Bangalore 的地图,以及一些与 Bangalore 市景,交通相关的视频,这些视频会让你有身临其境的感觉。

  • 5 条评论了已经
  • 分类: Google, SEO
  • 浏览:1,049
  • 最权威的Google排名算法解密

      说它最权威是因为是Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子。下面捡主要内容翻译一下,想看完整原文的请参考Google官方博客Google 搜索质量简介。

      搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询,Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些,以及以哪样的顺序显示。

      Google对排名算法一直都比较保密,主要原因有两条:竞争及防止被滥用。

      Google排名算法的细节是Google皇冠上的珍珠,我们以它为傲,并且非常注意保护。但是完全保密有时候也不是理想状况,所以Udi Manber等人决定与站长多沟通,谈一谈有什么新鲜事,解释一些老的内容,给点建议,参与对话等。这篇帖子是第一篇,以后还会有其他内容。

      这个部门的心脏是核心排名小组。排名是相当困难的,比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的,文件也没有任何规则,怎样理解信息没有标准。所以我们需要理解任何人,因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询,再将查询投射到我们所理解的文件上。更不要说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。

      Google排名算法最出名的部分就是PageRank。PR现在还在使用中,不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块(处理短语,同义词,方言,拼写错误等的能力),查询模块(不仅仅是语言,还包括人们怎样使用语言),时间模块(有的查询返回一个30分钟前刚创作的网页最合适,有的时候返回已经存在很长时间的网页更合适),个性化模块(不是每个人都需要相同的东西)。

      另外一个组负责评估我们做的怎样。目标是改善用户体验,这不是主要目标,而是唯一的目标。有每分钟进行的自动评估,阶段性整体质量评估,更重要的还有个别算法调整的评估。当某个工程师有个好主意,开发一个新算法后,我们对这个主意进行测试。一组统计学家会检查数据,确定这个新主意的价值。

      2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的方法,有时我们也致力于简化算法,简单就是好的。(Zac的注释:关于简化算法这句话,是紧接着PR算法调整之后说的,不确认他是讲简化了PR算法,还是说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是,基本上给我们看的工具条PR是不准的,尤其很多该有PR值得内页显示PR为零。也许这就是Udi Manber所说的算法简化造成的。)

      在过去两年中,国际搜索是我们的主要焦点之一,包括所有的语言,而不仅限于主要语言。

      另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单,当我们增加新功能时,尽量确保对用户来说是简单易用的。在过去一年中,主要的改变包括通用搜索,Google Notebooks,自定义搜索引擎以及iGoogle的改进。用户界面小组有一组易用性专家,在辅助研究用户及评估新功能。

      还有一个小组专注于反垃圾和其他各种被滥用的技巧,这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术,并且以可扩展的方式克服这些垃圾。和其他组一样,这个组也是要处理国际多语种。反垃圾组与Google站长工具组紧密配合。

      还有其他专门的项目组。整体来说我们的组织结构相当非正式,人员调动频繁,新项目也随时开始。

    10个不为人知的Google失败作品

      毫无疑问,Google是当今世界上最成功的互联网公司之一,但是Google也曾推出过一些失败的实验品。还记得Google Accelerator,那个号称能够加速网页浏览的免费工具吗?,Google Answer也因为它的付费模式而不得不退出了产品线。其实Google Video本可能成为这个清单中的一员,不过财大气粗的Google对Youtube的成功收购应证了这样一句话:“如果你竞争不过一个公司,那就买下它”。以下的10个Google失败作品中,有些仅仅出现了一天就消失在公众的视线之中了,幸运的是,某些有心人把他们存在的记录保留了下来。

      也许在Google Labs里面,还存在着更多的昙花一现的的实验品。废话不多说,一起来看看吧。

    本文未完,点这儿看完整内容 » »

    谷歌战胜雅虎 美国用户满意度第一

      在美国密歇根大学开展的“美国客户满意度指数”调查中,谷歌扩大了其网络领先优势,从雅虎手中夺回了业界满意度指数最高的荣誉。

      该项调查的参与人数为3000人。根据感知质量、期待和抱怨分级,由受访对象对企业进行打分,企业获得的满分是100分。

      咨询厂商ForeSee Results的首席执行官拉瑞·福雷德说,调查显示,越来越多的人不再仅仅是使用谷歌的搜索服务,而开始转向使用谷歌的电子邮件、网络地图和新闻服务 了。“谷歌的创新不仅表现在公司的运营方式上,还表现在应用软件上。人们很喜欢谷歌提供的优于雅虎等公司的一些服务。”

      在这项调查中,谷歌得86分;雅虎得77分;微软得76分;Ask.com得74分,AOL得69分。

      谷歌得分还高于如迪斯尼的ABCNews.com和时代华纳的CNN.com等新闻站点的得分。

      福雷德说,谷歌在“美国客户满意度指数”调查中获得最高分证明了用户对谷歌的持续满意。他说,从企业角度出发,最重要的是让客户满意,因为只有客户满意了,企业才会获得更高的客户忠诚度,在客户之间树立起良好的口碑。

    最新评论

    • 请问你的那些个图片是某个IDE还是截图还... »
    • LZ的BLOG真的很精彩,很多内容是我想... »
    • 太酷了!!! »
    • 950,960都是一个形式而已,不过能够... »
    • 受教了,我前段时间把网格系统下下来以为是... »
    • 正在学习中,网页的图片一张一张的显示,实... »
    • 这些世界著名的网站十年的变迁,给我们留下... »
    • 学习了。 »