业界媒体the Information发表文章,讲述了为何苹果推出Siri七年之后,却在某些方面被谷歌和亚马逊的智能助理赶超。乔布斯曾说Siri属于人工智能领域,而不属于搜索,但他的去世标志着Siri远大愿景的终结。以下原文内容:
2011年,苹果公司在库比蒂诺总部举办了一个“让我们谈论iPhone”活动,这是一个重要时刻,因为这是新任CEO蒂姆·库克做的第一个大型演示,他试图续写乔布斯的传奇。但是这个活动有点令人失望,因为该公司新的iPhone 4s升级有限,大家想要看的是iPhone 5。
但Siri令人眼前一亮。评论家对Siri的潜力惊叹不已,认为它可能会是一种革命性功能。用户们似乎也同意这个看法,iPhone 4s推出刚三天就卖出了400万台,创下了当时iPhone销售势头最猛的纪录。
时间过去差不多七年了,但Siri的一些问题依然存在。分析师认为,这可能就是苹果新推出的一款智能扬声器遭到差评的主要原因。这款扬声器名为HomePod,售价349美元(约合人民币2200元)。尽管HomePod的时尚外观和音质赢得了赞誉,但测评报告中出现了“蠢笨”“烦人”和“令人尴尬的不足之处”这样的字眼,它的Siri功能颇受诟病。
Siri曾经被认为是苹果公司的下一个重大创新。但是在推出七年后,它却成为了让苹果公司最新产品遭受拖累的主要原因。本文讲述的就是这其中的前因后果。
辩论不绝
相对于竞争对手亚马逊和谷歌,苹果在数字助理上拥有先发优势,为了了解苹果怎样从领先者沦为落后者,本文采访了苹果公司的十几名前员工,他们负责创建Siri或将其整合到苹果的生态系统中。其中大多数人都不愿具名,有些人是因为签署了保密协议,另外一些人则是担心遭到苹果高管的报复。
苹果公司想要重塑自己,成为创新而卓越的在线服务公司,而不仅仅是硬件设计公司,但在这条道路上,苹果走得并不顺畅。它在建立在线服务业务方面曾经犯过一些错误——尤其是在iCloud服务中。随着iPhone销售的继续放缓,在线服务方面的问题不解决可能会给公司带来大麻烦。
在接受采访的这些前员工中,很多人都承认,苹果是在Siri的技术尚未完全成型之前将它匆匆添加到iPhone 4s上的,这就在苹果公司内部引发了一场辩论,有些人主张继续修补Siri的缺陷,另外一些人则认为应该把它推翻重来。随着Siri的各个团队进入一场地盘争夺战,关于 “Siri的理想版本应该是什么”的辩论也越来越多。Siri应该是一个快速准确的信息获取工具,还是一个可以执行复杂任务的精巧助理呢?
对于团队领导者和中层管理人员来说,这个问题一直无法解决,他们缺乏乔布斯那种远见或影响力。接受采访的前员工表示,缺乏这种领导力和人员的不断变化让Siri在一些关键问题上止步不前,其中最主要的一条就是死守苹果的封闭文化,没有给外部开发人员提供更多机会来创建更多有用的Siri应用。
Siri团队有很长一段时间是由比尔·斯达西亚(Bill Stasior)在负责,他是一位安静而低调的工程师,在2012年末加入苹果,之前是亚马逊的搜索专家。 斯达西亚负责Siri的核心技术 ——语音识别系统、自然语言处理系统和苹果的各种搜索功能。 Siri的前员工表示,这些单元为了争夺注意力和资源,经常发生冲突。
苹果的发言人拒绝让记者采访斯达西亚。在一份书面声明中,苹果发言人称Siri为“全球最受欢迎的语音助理”,并对Siri在苹果设备上的能力做了介绍。
“我们在Siri的性能、可扩展性和可靠性方面取得了重大进展,采用最新的机器学习技术来创造更自然的声音和更主动的功能,”苹果在这份声明中写道。 “我们将继续深入研究机器学习和人工智能,以不断提高Siri回应的质量以及Siri可以回答的问题的广度。”
与亚马逊和谷歌产品相比
可以肯定的是,那种完美的数字助理目前还只能在科幻电影中看到,没有哪家公司真正拥有它,苹果的产品在某些领域领先于亚马逊和谷歌。 Siri支持21种语言,而亚马逊的Alexa只支持三种语言,谷歌智能助理支持八种语言(谷歌上个月表示其助理即将支持超过30种语言)。 Siri每月在5亿多台设备上使用,每周处理20亿次请求。
Siri现在的响应速度比最初推出的时候快,并且因为它驻留在iPhone中,而iPhone又是有史以来最畅销的电子产品之一,那么苹果公司确实可以说,与其他任何数字助理相比,Siri的用户更多。
但与竞争对手相比,Siri的能力仍然很有限。苹果在2016年推出了SiriKit工具,让外部开发人员有机会为Siri创造新功能。然而,它在开发人员中引发的兴趣远不如苹果的设想。
相比之下,亚马逊的Alexa拥有2.5万个由第三方开发人员创建的“技能”。谷歌发言人表示,谷歌智能助理有100多万个“技能”,其中包括谷歌自己写的数字助理命令,比如通过谷歌地图进行导航,但也有第三方开发人员创建的功能(谷歌拒绝透露这类功能的数量)。而且对手们的平台也在迅速扩张:谷歌1月份宣称已经有4亿台设备搭载其智能助理,而亚马逊表示,他们在去年圣诞节期间销售了“数千万台”支持Alexa功能的设备。
“Alexa出货时,它从第一天开始就非常稳定,”一位前Siri团队成员说。 “要让Siri变得这么稳定,员工需要抛下几乎现有一切,从头开始。”
改变世界的梦想
Siri Inc.成立于2007年,它的基础是非盈利研究组织SRI International创建的技术。 Siri最初的愿景是成为智能数字助理,响应用户的请求,并进行交互,以获得理想的回答。例如,Siri的理想版本不会直接提供一家餐厅的电话号码,而是会先跟用户反复确认细节,如日期,时间和就餐人数,然后自己去帮用户定好餐位。
Siri的创始人认为,达到这一效果的唯一途径就是创建一个开放平台,允许外部开发人员为Siri贡献功能,让这个智能助理的能力远远超出内部团队能够创建的水平。
“这相当于是在搞‘人工智能商店’,”Siri初始团队的一名高管说。 “它应该是通过对话来协调互联网的一种方式。”
参与创建Siri Inc.的诺曼·维纳斯基(Norman Winarsky)说,乔布斯是Siri潜力的忠实信徒。 2010年的一天,乔布斯打电话给Siri首席执行官道格·基特劳斯(Dag Kittlaus),邀请该公司的三位联合创始人到他的家中会面。这个会面持续了数个小时,乔布斯最终说服了他们拒绝求购者,投入苹果的怀抱,因为乔布斯表示,苹果有能力以更大的规模实现Siri的目标。
乔布斯极大地激励了Siri的联合创始人,让他们相信自己可以改变世界,“他让我们都相信了这一点。” 维纳斯基说。
苹果于2010年4月斥资2亿多美元收购了Siri。当时Siri只有24名员工,但苹果很快聘请了更多人组成Siri核心团队。 18个月后 Siri在iPhone 4s上推出时,该团队已发展到近100人。
在收购Siri之后,乔布斯仍然密切关注着Siri保持。该团队的前任成员表示,他时常出现在该团队的每周例会上,并对将要推出的功能发表意见。当时担任苹果高级副总裁的斯科特·福斯泰尔也很支持Siri。福斯泰尔做事的方式有比较强的对抗性,但他对这个产品能够做什么有着强烈的愿景,而且非常愿意亲自参与。他每天都会尝试一下这个技术,并且经常参加他们的会议,还会说:“昨晚上我发现了10件事。”一位前Siri员工回忆说。
为确保Siri按时发布,团队对初始设想做出了一些妥协。将产品开放给外部开发人员(也就是 “人工智能应用商店”) 的计划不得不放在一边。乔布斯希望Siri专注于做一些只有苹果公司才能完全控制的事情,但早期的Siri团队成员表示,乔布斯承诺他们会在晚些时候开始构建第三方生态系统。
在2011年10月4日苹果推出Siri之后的第二天,乔布斯因癌症与世长辞。 Siri团队的成员说,他的去世基本上标志着Siri初始团队愿景的终结。
混乱的开始
Siri团队仍然拥有福斯泰尔的支持,但他的注意力被其他大项目分散了了,包括即将推出的苹果地图。福斯泰尔安排了理查德·威廉姆森(Richard Williamson)来领导Siri的工作,负责让事情回到正轨上。
几名前员工表示,威廉姆森做了很多其他人不同意的决定,其中包括每年只更新一次Siri的能力。苹果通常对iOS就是每年更新一次。而且威廉姆森的工作背景是让软件在从后端服务器接收更新的手机上运行。团队成员表示,他们认为这种模式对于Siri来说不合适,他们认为Siri应该是一个不断改进的在线服务,而不是每年更新一次。一名前员工说,在第一年里,虽然服务器软件进行了多次稳定性和性能上的更新,但Siri在架构上没有任何变化。
威廉姆森通过电子邮件回应了采访要求,他写道,关于他认为Siri不应该持续改进的说法“完全不属实”。他说,有关“软件和服务器基础设施的技术领导力”方面的决定,是由级别低于他的员工做出的,他的责任是让团队走上正轨。
“Siri发布后简直是一场灾难,”威廉姆森写道。 “它要么速度很慢,要么就用不了。软件里充满了严重的错误。问题完全在Siri初始团队的身上。”
这篇电邮发表后,基特劳斯在推特上做出了回应:“这个声明完全不属实……事实上,Siri在刚推出时表现非常出色,任何新平台如果遇到了意外的大规模负载,都需要进行规模调整和24小时维护。”
Siri最初推出时,用户数量超过预期,软件开始崩溃。工程师忙于保持后端正常运行,但基础架构根本就不是为了处理这么大流量建立的。一名来支援后台基础设施改进的员工回忆说,有一项Siri任务最初需要使用500台服务器,在改进代码之后,只需要五台服务器就够了。
卢克·朱力亚(Luc Julia)1990年代曾在SRI与Siri联合创始人亚当·切尔(Adam Cheyer)共过事。这时朱力亚被找到管理Siri团队。几位前Siri员工表示,他们很喜欢朱力亚来当领导,但威廉姆森写道,朱力亚与苹果公司的一些人发生了冲突,其中包括福斯泰尔。当福斯泰尔要让朱力亚走人时,威廉姆森同意了。所以朱力亚在Siri团队待了不到一年之后就离开了那里。
威廉姆森写道,他试图让团队制作SiriKit工具包,以便让外部开发人员改进Siri的功能,但遭到团队反对,因为Siri“初始的软件非常脆弱和僵化”。
威廉姆森和团队之间的分歧导致了2012年6月Siri联合创始人切尔的辞职。接下来,Siri初始团队又有几名成员走了。而在那一年之前,Siri的另一名联合创始人基特劳斯就已经离开。
2012年年底之前,福斯泰尔和威廉姆森也离开了。因为iOS 6苹果地图功能发布时错误百出,十分糟糕,他们被苹果解雇了。福斯泰尔的离开让前Siri员工感到惋惜,因为他们失去了一位支持Siri的高级管理人员。
转向搜索
在苹果收购Siri后不久,乔布斯向公众解释了他的一些想法。
在2010年6月《华尔街日报》技术大会All Things Digital上,乔布斯表示:“Siri不属于搜索领域,而是属于AI领域……我们没有计划进入搜索领域,我们对该领域不熟悉,它也不是我们关心的事情,其他公司在搜索上做得很好。”
不过,高质量的搜索功能是数字助理的关键组成部分。当用户提出问题时,AI需要搜索知识来源,快速找出正确的答案。
但是,乔布斯要表达的正是Siri初始团队中许多成员坚持的观点:Siri比搜索的覆盖面更大。Siri一位团队成员表示,理想的Siri版本应该是2013年电影《她》中的操作系统Samantha那样。这部电影讲的是孤独的男主角爱上了操作系统Samantha。
坚持这一愿景的团队成员表示,当他们获悉像斯达西亚这样的搜索专家被指派来领导Siri团队时,他们感到很怀疑。斯达西亚拥有麻省理工学院的计算机科学博士学位,还帮助创建了亚马逊搜索部门A9.com,从2006年至2012年担任A9.com的总裁兼首席执行官。
一些在斯达西亚领导时期的Siri团队成员认为,他在语音和自然语言处理方面的背景不强,无法成功领导这个团队。
“我觉得,尽管他到苹果的时候对Siri非常感兴趣,但长期目标始终是创建一个搜索引擎,”斯达西亚领导时期的一名前员工说道。 “Siri对他只是一个跳板。”
斯达西亚跳槽到苹果时,苹果的搜索工程资源分散在各个部门,出现了大量重复。当时的说法是,斯达西亚的职责包括将Siri和苹果现有搜索功能中所有不同的资源集中在一起,以改善Siri的核心性能。苹果公司想增强在搜索技术领域的存在,斯达西亚也负责主持这项工作。
“他的工作是把搜索作为一项核心资产,使其成为苹果公司的拳头产品,”一个在斯达西亚领导时期在搜索团队工作的人说。
收购和整合
斯达西亚领导了一系列收购活动,为苹果公司引入搜索人才和技术。据TechCrunch报道,2013年10月,他们斥资4000多万美元的价格收购了Cue。这家初创公司创建了一款个人助理app,在用户的电子邮件中搜索出个人日程。
斯达西亚还领导了2013年2亿美元对Topsy的收购案。 Topsy的技术被用在了Spotlight上。Spotlight是MacOS和iOS操作系统内置的搜索功能,最初是在2004年推出的。
“如果斯达西亚发现了什么好东西值得收购,他就可以做主。”一位负责收购尽职调查工作的苹果员工说,“这么做的目标是尽可能多地收购并整合搜索人才。”
一位前员工表示,Topsy团队最终发展为斯达西亚手下的一个庞大的组织,现在几乎与Siri团队的员工数量差不多。Topsy首席执行官普拉卡西(Vipul Ved Prakash)继续领导着那个搜索团队,直接向斯达西亚汇报工作。
事实证明,将现有的Siri团队与斯达西亚的搜索部门结合在一起很麻烦。 Topsy团队的成员不愿意与Siri团队合作,因为觉得他们觉得Siri很慢,基础设施经过修修补补,但自从发布以来就没有彻底换过新的。
“当时搜索团队有一种感觉,‘为什么我们不从头开始,创建我们需要创建的东西,然后再来协调两边?’”搜索团队的一名前成员说。“他们现在还在进行协调。”
Core Siri和Spotlight是由Topsy的技术和Siri数据服务组合而成的;该服务的基础是从iTunes搜索移植过来的旧版搜索技术,但是针对Siri进行了修改,在2013年的时候推出。 Siri数据服务处理维基百科、股票和电影放映时间等事项,Topsy则处理Twitter、新闻和web搜索结果。 Siri数据服务团队最终被并入了Topsy团队。但是它们使用的是两种不同的编程语言,很难协调。
对搜索团队的整合导致了一些令人尴尬的结果。用户使用Siri和Spotlight时可能会获得完全不同的回答,这些回答是由两个不同团队构建的两种不同的搜索技术提供的。
“宫斗”和篮球
Siri最初的技术涉及自然语言处理,它的用处是理解用户的意图。语音处理是用来检测用户讲的话,苹果最初将这项技术外包给了位于波士顿的Nuance。斯达西亚到来后,苹果公司开始致力于构建自己的语音识别软件。
2013年,该公司聘请了微软经验丰富的语音识别专家阿历克斯·阿西洛(Alex Acero)来领导一个新的语音识别团队。苹果还在2013年收购了语音创业公司诺瓦瑞斯技术公司,希望将其新的语音识别技术与核心Siri技术相结合,以改善Siri的语音交互能力。 Siri团队认为,将这些技术结合起来很有意义,可能会为Siri带来重大改善。
但在2014年年底,这种团队联合开始仅仅6个月后就结束了。阿西洛继续领导语音识别团队,而自然语言团队则由曾在咨询公司麦肯锡工作的管理顾问安诺普·辛哈(Anoop Sinha)来领导。
接受采访的前员工表示,从来没有人向他们解释过联合为什么要终结,但这件事给人的感觉是辛哈在搞“宫斗”。
辛哈没有自然语言处理领域的背景,Siri团队有几名成员从一开始就不喜欢他。一名前员工说,辛哈做决定的出发点似乎是办公室政治而不是科学。
辛哈和阿西洛不对盘是公开的,有一名前员工谈到了两人参加会议的情景:两个人会都让斯达西亚澄清他们中谁负责哪一个项目。这种“宫斗”引发了另一批员工离职,其中包括几名经验丰富的语音科学家。
辛哈的LinkedIn个人资料显示,他于2016年离职,现在是Facebook的工程经理。
基特劳斯和切尔又联手组建了一家名为Viv Labs的新公司,继续打造更好的数字助理,一些离开Siri团队的员工也投奔了他们。 斯达西亚对这样的情况很不爽。当得知基特劳斯和切尔仍然会去苹果园区和老同事打篮球时,斯达西亚担心他们挖走更多人。很快,两人就被禁止进入苹果园区了。
对手涌现
斯达西亚继续开展雄心勃勃的收购活动,试图改善Siri。 2015年10月,他牵头收购了VocalIQ,这是一家英国AI初创公司,致力于动态学习系统,而不是提供程式化的响应。
VocalIQ的一名员工说,VocalIQ团队将Siri视为“手工制作的系统”,认为他们的技术有助于改善之。他说,VocalIQ的技术旨在通过吸收和分析语音交互的数据,不断地调整准确性。知情人士透露,苹果已成功将VocalIQ技术整合到Siri的日历功能中。
苹果还在自然语言处理系统中引入了更多自动化机器学习技术。前Siri员工拉辛·萨阿(Rushin Shah)领导了将更多自动化机器学习集成到域选择中的工作—— 例如Siri需要弄清某个请求是要发短信,还是要打专车。萨阿在LinkedIn上的个人资料显示,他在2017年离开苹果公司,去了Facebook担任自然语言理解团队的高级经理。
与此同时,苹果公司在数字助理领域的优势地位已经不保。 2017年6月,《华尔街日报》的一篇报道预测,HomePod最好也就是排在家庭智能扬声器市场的第三位。
苹果公司似乎并未料到会面对这样的竞争。Siri团队的两个成员告诉记者,该团队直到2015年才知道苹果有HomePod项目。亚马逊推出Echo是在2014年底。据消息人士透露,苹果最初的计划之一是将在没有Siri的情况下推出扬声器。
苹果决定将Siri加入扬声器项目后,Siri语音识别单元开始与苹果以30亿美元的价格收购的Beats音频产品公司每周举行一次会议,一开始大约有25人参加这些会议。
Beats团队负责开发麦克风上的降噪和波束形成算法,以便更好地提取用户的语音命令。苹果公司在湾区周围的一些公寓安装了麦克风,用来收集数据并复制家庭环境。
但Siri发展过程中最明显的失败在于它仍然缺乏第三方开发人员生态系统,而这被认为是Siri最初愿景的关键元素。根据前员工的说法,在多年搁置该项目并将资源转移到其他领域之后,苹果终于在2016年推出了SiriKit。多名消息人士称,自2012年以来,苹果一直在断断续续地制作这个开发工具包。
苹果最终任命Siri老员工文尼特·科斯拉(Vineet Khosla)来领导SiriKit项目,让开发者能够把自己的应用与Siri连接起来。苹果看上去是想提升这个数字助理的功能,而不是依靠有限的本机应用来提供拨打电话或发送短信等少量功能。
但SiriKit的承诺尚未兑现。到目前为止,它仅包含10个 “意向域” —— 例如付款、订车、设置待办事项列表和查看照片等。SiriKit项目的一些高级工程师已经离开了苹果,或是离开了这个项目。据知情人士透露,科斯拉也不再是SiriKit的领导,尽管他仍然受雇于苹果。现任Siri负责人罗比·沃克(Robby Walker)已经接管了SiriKit项目。
前Siri成员指出,虽然苹果公司想要把自己重新打造为一家服务公司,但其核心仍然是产品设计。相对于创建完美的在线服务,苹果更重视的是设计变革性的硬件,对于一些复杂的项目来说,这可能会引发问题。
“苹果公司的结构与这些努力背道而驰。”一位前Siri员工表示, “我认为要在那样的整体心态下开展工作,斯达西亚肯定是步履维艰。”