2009年5月26日星期二

挑战者:Wolfram|Alpha搜索――杨琳桦

  雄心勃勃的Wolfram|Alpha来了,带着一个笨重的名字。
  美国中部时间5月18日下午3时,披着橘红色页面的Wolfram|Alpha正式向公众开放。
  等待最初始于3月。其时,Wolfram|Alpha的创始人、美国计算机科学家史蒂芬・沃尔弗拉姆撰文透露,他正着手开发一款新型互联网搜索引擎;之后的4月28日,Wolfram|Alpha开通博客;5月1日,前沿科技博客SearchEngineLand刊登内部测后感《让人印象深刻:Wolfram|Alpha的"事实引擎"》。至此,硅谷进入躁动。
  "Something big is about to happen!"正如一位密切关注此事的雅虎工程师所说──硅谷对Wolfram|Alpha的热望,不仅因沃尔弗拉姆的影响力,更在于该引擎技术本身。
  通过这种新型搜索引擎,人们获得的将不再是网上已有的现成信息,而是经服务器计算生成的新信息。
  通过引入强大的"计算"能力,Wolfram|Alpha能帮助用户实现基于其输入的关键词或问题的统计学工作。这是否意味着,继以Google为代表的搜索引擎之后,人类与知识的关系将再一次被根本性改变?
  "5年前我们开始实施这一项目,经反复试验后,决定于今年推出,"Wolfram Research公司人士向本报记者表示,Wolfram|Alpha在Wolfram Research的内部代号为"计算型知识引擎"("Computational Knowledge Engine"),参与开发人员超过100名。
  "就像一个对答如流的婴儿"
  不少科技人士认为,Wolfram|Alpha将向全球互联网搜索巨头Google发起直接挑战。不过测试后,更准确的说法或许应该是──Wolfram|Alpha与Google同样重要,只不过,双方的目的截然不同。
  本报记者此前受邀获得Wolfram|Alpha内部测试密码。让我们先来做一个测试。
  在Google或雅虎中搜索输入"China GDP",正如你所料,看到的是一系列与中国GDP有关的网页──它们可能是来自BBC的最新报道,也可能是一篇有关中国经济增长情况的长篇大论,但这些不一定是我们最想要的。
  如果将"China GDP"输入Wolfram|Alpha,将出现什么?
  ──不是一大堆网页,而是直观的数据和图表。
  这包括:中国GDP的最新情况、从1970年至今的中国GDP增长情况(图表)、中国通货膨胀率、失业人口率等。
  看上去的确很聪明。
  本报记者再做了进一步测试,在Wolfram|Alpha中输入"How many people in China",结果看到的是目前中国的总人口数、人口密度、平均每年人口增长率、预期寿命和平均年龄等数据。
  据介绍,Wolfram|Alpha引擎能应对的问题还包括:"某年某月某日某旅游胜地的日出是什么时间"、"地球和月球的距离"、"吃一个苹果我将获得多少蛋白质"等。
  有一个例子,将有助于理解Wolfram|Alpha与Google等搜索引擎的区别。
  比如,当你不知道"叔叔的叔叔的兄弟的儿子"与自己是什么关系时,将"uncle's uncle's brother's son"输入Wolfram|Alpha,你将获得一份类似家谱的东西,当中包括血缘关系的具体数据。而如果用户将同样的指令输入Google,获得的则只是一些网页的清单。
  这也正是Wolfram|Alpha的最大噱头所在──给出一个直接明确的答案,从而超越Google、雅虎赋予人类有关搜索引擎的经验。
  "目前全球搜索引擎模式大致可分三类,"美国搜索引擎研究专家诺瓦・斯皮万克(Nova Spivack)在测试完Wolfram|Alpha后说,一类是以Google为代表的网页搜索,即用户键入关键词,搜索引擎返回不同的网页链接;第二类是维基百科(Wikipedia)搜索,搜索引擎返回至所查询词条的详细信息;第三类则是美国语义搜索服务商Powerset模式,返回至与查询要求相关的文档。
  "与这三种模式不同, Wolfram|Alpha利用其独有的专利性算法建起了一个庞大的信息资料库。"斯皮万克说,新型引擎能针对广泛的问题提供详尽的答案,即使这些问题以不同的方式询问,它也能应对自如:"这让人惊讶。"
  最特别的是,Wolfram|Alpha不是从一个庞大数据库中抄答案,而是能针对答案进行计算。这一方面它比Google聪明,因为后者只是通过关键词搜索来发现文件,而并不理解所谓的答案或问题,也不是基于人类对不同领域的知识进行的计算。
  "让外行人也能拥有专家的知识库,是引擎新技术的初衷所在。"Wolfram Research公司人士表示,Wolfram|Alpha的目标用户为所有人。除科学领域外,它还提供包括金融、技术、地理、天气、烹调、商业、旅行、人类、音乐等领域的知识和计算结果。
  当然,Wolfram|Alpha还有其它一些独特之处。比如向外部开发者开放API应用程序接口。这意味着,外部开发者可以在Wolfram|Alpha基础上组建更有针对性的搜索服务;又比如大量人工力量的干预,所有数据都有相应人员的专门验证和比较,以确保质量和更新。
  "关于信息更新,的确是一个挑战,"位于美国伊利诺伊州的Wolfram Research公司的人士对前来访问的本报记者说,"目前,Wolfram|Alpha会视具体的信息性质来确定更新频率,比如股票是实时更新,而各国的GDP,则根据确切资料的发布每年更新一次。"
  在未来一段时间内,Wolfram|Alpha仍将主要服务于英文语种。
  "Wolfram|Alpha之父":21岁就是"天才"
  "Wolfram|Alpha之父" ,是现年49岁的史蒂芬・沃尔弗拉姆(Stephen Wolfram)。他出生于英国,一直以推动计算机基础科学的突破闻名。
  在20岁那年,沃尔弗拉姆获得美国加州理工大学的物理学博士学位,21岁时获得麦克阿瑟基金会颁布的"天才"称号。之后他长期致力于对计算机复杂系统的研究。
  1988年,沃尔弗拉姆推出强大的计算机软件Mathematica。这是世界上通用计算系统中最强大的一个,对如何在科技和其它领域运用计算机产生了深刻影响,被称为是"现代科技计算的开始"。
  沃尔弗拉姆由此闻名于世。2002年时,他出版了一本厚达1280页的书《一种新科学》(〈A New Kind of Science〉),探讨"细胞自动控制器"(Cellular Automata)和复杂计算机系统,引发计算机科学界的热烈讨论。
  为使自己研发的软件能够有组织地制造和销售,沃尔弗拉姆还组建了沃尔夫勒姆集团,并亲任董事长和首席执行官。
  Wolfram Research即是集团旗下四家公司之一,多年来一直保持私营体制,主要通过旗下产品盈利。
  如何盈利,是Wolfram|Alpha一个至关重要的问题。
  Wolfram Research的人士透露,赞助商将成为挑大梁者。目前,其已确定的名单有联想、戴尔等,而类似潜在的商业机会也包括与各公司合作开发定向广告;其次,是开放API后带来的潜在商业模式;公司还希望 Wolfram|Alpha的免费推出能推动它的科学计算软件Mathematica在全球的使用和销售。事实上,这种软件很早即已进入中国市场。
  "我们正在启动向中国高校学生开放Mathematica免费使用一年的项目," Wolfram Research中国区商务经理王翔说,已确定或即将确定的中国高校名单包括中科大、南开等9所大学。
  终结Google还是卖给Google?
  但,Wolfram|Alpha远远称不上是完美的。
  这不仅仅在于有着两个类似"F"的发音可能会阻碍它成为一个家喻户晓的名字,更在于Wolfram|Alpha暴露出的部分缺点。
  至少在眼下,这种新型引擎还像一个刚出生的婴儿一样,对一些很简单的自然语言尚不能辨认。比如输入"WolframAlpha location"和"WolframAlpha address"时,前者能顺利抵达图片和数据,但后者却显示"Wolfram|Alpha不能确定输入的内容"。
  对此,沃尔弗拉姆声称,作为一个长远项目,Wolfram|Alpha已经有了一个谦卑的开始,类似漏洞将会在以后的日子中逐步改进。
  不过科普作家、《大英百科全书》编委尼古拉斯・卡尔(Nicholas Carr)仍然警告说:网民不会容忍不能按他们期望工作的网站,"一旦让网民产生挫败感,他们从此便不会再回来。"
  此外,Wolfram|Alpha也不可能代替Google。
  "用户可能不会使用它购买新车,也不会用它来寻找有关论题的博客或度蜜月的胜地,"斯皮万克说,"Wolfram|Alpha不是一个你认为懂得一切事情的系统。对人脑主导的搜索来说,目前仍没有任何东西可以替代。"
  与此同时, Google已于近日发布数据可视化工具,一旦完全设计完毕,Google在搜索市场的优势可能会进一步扩大。而微软也刚刚宣布,未来几天内他们将发布搜索引擎"Kumo"。几个月前,微软获得了前雅虎搜索重将陆奇的加盟。
  现在有一些问题,我们仍无法知晓,比如,Wolfram|Alpha最终会出售给Google、微软或雅虎吗?但至少,Wolfram|Alpha已经被认为有了一个伟大开端,它使人类在一个新层面受益的同时,也进一步增强了互联网搜索领域的竞争。
  正如不少社会学家所指出的,这种不断出现的新技术,是真正能够分散现有垄断权力的力量。或许在不久的未来,我们将不用再担心一个问题──谁来监管Google?

没有评论: