专家解读人机大战：超级电脑沃森已有学习能力

http://www.sciencehuman.com 科学人 网站 2011-02-27

IBM超级电脑沃森的中国团队专家、IBM中国研究院资深经理潘越

　　新浪科技讯今天上午11:30，IBM超级电脑沃森的中国团队专家、IBM中国研究院资深经理潘越做客新浪《微访谈·微观科技》，与网友交流在上周人机大战中战胜人类的超级电脑沃森(Watson)的背后故事。

　　潘越表示，IBM中国研究院前后有六位同事参与沃森项目，由他们组成中国团队负责为沃森系统采集、分析和使用各种结构化的知识，利用结构化和高可靠的知识提供问题解答，排除让系统显得”愚蠢“的答案，以及帮助沃森系统提高其学习能力。

　　对于网友有关超级电脑超越人类智慧的担心，潘越表示，目前机器只是在某些特定领域表现出和人类可比的智力水平，还有很多领域机器还差得很远，因此不必担心。潘越还表示，目前沃森使用了机器学习的技术，已经具有一定的学习能力；不过这个学习还是有指导的，完全的自学习能力还有待进一步研究和开发。

　　潘越还特别介绍了沃森在医疗领域的应用。他表示：“医生们需要研究大量的数据来提高诊断和治疗效果，但是现在医学数据的数量之多已经超出了人类能够有效处理的能力范围。为了了解病人的情况，他们还需要提出复杂的问题并且做出高度结构化的推论。因此，大约15%的诊断都是不准确的或者不全面的。沃森可以为医生提供帮助，把问答集成到日常决策流程中。”

　　对于超级电脑在商业领域的前景，潘越表示沃森计划能在电子、能源与电力、政府、卫生保健、保险、石油天然气、零售、通信、交通、银行与金融市场等行业领域有所应用。

　　上周，IBM超级电脑“沃森”(Watson)在美国最受欢迎的智力竞猜电视节目《危险边缘》中以绝对优势击败了两名人类选手。沃森最终答题总成绩高达 77147分，远高于两位人类选手21600分和 24000分的成绩。这也成为继1997年超级电脑深蓝战胜国际象棋大师卡斯帕罗夫后的又一次人机大战。

　　以下为今天微博访谈问答实录：

　　徐英钟：CRL(IBM的中国研究院)有多少人参与这个项目

　　潘越：CRL(IBM的中国研究院)前后有六位同事参与Watson项目

　　Naiyin_Tan ：请问沃森是用什么计算机语言开发的？其中中国团队都做了哪些贡献？沃森将来的发展方向是什么？

　　潘越：沃森用Java, C/C++, Prolog语言开发，中国团队对用结构化数据回答问题、排除“愚蠢”的答案，以及两阶段学习方面做出了贡献。沃森将来会在各个行业应用。

　　张结魁：项目涉及的关键技术有哪些？会对这些研究领域产生怎样的影响？

　　潘越：项目用到的关键技术包括自然语言处理、搜索、机器学习等。

　　dogstar ：看到很多媒体说沃森的技术可用于医疗方面，他到底可以怎样在医疗方面服务于人？

　　潘越：医生们需要研究大量的数据来提高诊断和治疗效果，但是现在医学数据的数量之多已经超出了人类能够有效处理的能力范围。为了了解病人的情况，他们还需要提出复杂的问题并且做出高度结构化的推论。因此，大约15%的诊断都是不准确的或者不全面的。沃森可以为医生提供帮助，把问答集成到日常决策流程中。

　　郭晓光：每次有电脑战胜人脑的事发生，都会有担忧“终结者”之类的问题，您怎么看这种反应？

　　潘越：沃森的技术和个人电脑、互联网、搜索引擎的技术一样，对人类更多的是帮助。实际上，我们人工智能研究做的越深入，对于人类大脑的能力就越感到敬畏。

　　李波Energy ：电脑沃森在今后何去何从？是否在商业领域有很好的前景？

　　潘越：目前看来，沃森计划能在以下行业领域有所应用：电子、能源与电力、政府、卫生保健、保险、石油天然气、零售、通信、交通、银行与金融市场。

　　四正：请问关于沃森的系统结构，比如架构、指令集之类的资料，哪里能查到？

　　潘越：沃森系统使用了 UIMA 为基本框架，系统为松散的Cluster，使用的是Power7芯片。我们后续会在IBM R&D Journal上发表关于软件架构的论文。谢谢张雷帮忙解答。

　　飞象网陈翔：看到人机智力问答的结果，内心感觉其实很复杂，机器肯定在很多方面比人类强，但人类的某些方面也是机器无法超越的，发展人机对抗究竟是希望发展人类能力强的那部分还是希望利用机器来替代某些机器更擅长的工作呢？真担心有一天因为机器，人的感官，思维越来越局限～

　　潘越：随着社会的进步也包括技术的进步，人类自身的发展也很快啊 ~~ 我的女儿学的东西比我小时候就多很多阿。还是那句话，我们对人工智能越了解，对人类大脑就越敬畏。

　　祎祎：沃森以后是否会具有自主学习成长的能力？

　　潘越：目前沃森使用了机器学习的技术，已经具有一定的学习能力。不过这个学习还是有指导的，完全的自学习能力还有待进一步研究和开发。谢谢张雷帮助回答。

　　撇VV ：潘总好，请问Watson的功耗(功率)大概是多少？和人类相比呢？

　　潘越：沃森需要 2880 个处理器内核(体积与 10 台冰箱相当)，需要 80 千瓦的能量。只需一个大小与鞋盒相当的大脑，可以由金枪鱼三明治提供能量，并且只需使用手中的纸扇散热。谢谢晓菲帮忙回答。

　　小口香糖：听说沃森在比赛期间当机，让2小时的录制变成了4小时，真的吗？

　　潘越：我没听说过。

　　萧不遥：跟中国的银河相比，沃森有什么特点，双方的适用范围有啥不同？

　　潘越：和银河相比，沃森的计算能力还较弱。沃森可能进入不了超级计算机的计算能力前100名。但是沃森是一个我们称之为“为特定负荷进行优化的系统” (workload optimized　system). 它能把一件事情(智力问答)干到最好。而像银河这类的通用型超级计算机则被设计用来完成各种各样不同的应用。通用性较好。张雷。

　　weiruanruan ：请问潘工，沃森解答问题是通过自己的数据库给出答案还是其他方式？

　　潘越：沃森不与网络连接，但并不意味着只是简单的数据库查询。问题和知识库都是自然语言表述的，中间要经过复杂的计算。

　　zr27 ：虽然危险边缘需要分析语言中微妙含义、讽刺口吻、谜语等，但对如今的技术来说并不太难。危险边缘本质在于庞大的知识量和思考速度，这些恰是电脑的强项；而对于国际象棋来说战略战术中的阴险狡诈才是人脑的强项。这次IBM是否有意利用该优势？沃森下国际象棋又有几分胜率？

　　潘越：多年前深蓝系统战胜了国际象棋前世界冠军。沃森的强项并不在于国际象棋，但日常知识类的问题的挑战不在国际象棋之下，甚至有过之而无不及。

　　Lyonszhang ：请问沃森的硬件设备主要是什么配置。

　　潘越：沃森使用的是IBM Power750服务器。每个服务器有4块P7 CPU芯片，每个芯片8个CPU核。整个系统由90台服务器构成，总共2880个CPU核，15TB内存。片上带宽为每秒500GB。计算能力为80 Teraflops。谢谢张雷帮助回答。

　　我的钢铁：所提问题是从题库中随机抽取的吗？

　　潘越：不是， Jeopardy!的问题都是只用一次的，而且所有选手都未曾见过。

　　中国围观：请问IBM此活动是表明Power处理器的硬件性能很强大呢？还是说IBM的软件很“智能”？谢谢

　　潘越：沃森系统是软硬件能力的一种很好的结合

　　木白羽：我觉得与其说是人工智能的胜利不如说是搜索引擎的胜利，您怎么看待这个问题？

　　潘越：搜索技术只是沃森问答系统中用到的技术之一，其它包括自然语言处理、机器学习等等。

　　Mouri_劳累：沃森如何解决语言的歧义性？如何解决语音、语调对语义的影响？

　　潘越：沃森的一种做法是将问题的不同的解读都进行探索，将决定留到最后。目前沃森不涉及语音和语调的问题。

　　wildgun ：沃森这算是通过图灵测试了吗？谢谢。

　　潘越：不算。目前好像还没有机器能通过图灵测试。

　　judecan ：由于人类语言有模糊性和二义性，想知道Watson在自然语言识别中对双关语二义性语句这一块上是怎么解决的？

　　潘越：我们更多的依赖上下文来去歧义。比如，考察上下文中提到的人、事件、地点等其它相关对象。同时，我们从多个证据的角度去解释这一问题。即使在一个算法中的去歧义失败了，其它上百个算法会从其它方面给出答案是否正确的证据。这就削弱了对单个算法去歧义能力的依赖。谢谢张雷回答。

　　小考拉2012 ：潘总，请问watson在抢答速度上是否有优势？感觉最后两天问题全部被watson抢到了

　　潘越：呵呵我们的统计是第一场Jeopardy一轮中沃森抢到了约2/3的问题。但是另一方面，仅仅速度上优势并不一定等价于结果上的优势。因为答错了要扣分。沃森实际上也要判断自己是否要抢答。

　　dogstar ：您作为沃森项目中国团队之一，中国团队此次主要做了哪方面工作，以确保沃森能够顺利的与人对决？

　　潘越：在研制Watson系统的全球团队中，作为来自IBM中国研究院的团队，我们负责为Watson系统采集、分析和使用各种结构化的知识，利用结构化和高可靠的知识提供问题解答，排除让系统显得”愚蠢“的答案，以及帮助Watson系统提高其学习能力。

　　海豚大熊猫：潘总您好，我很好奇，参加那个问答竞赛，沃森的知识储备完全就是靠事先录入的？让我更好奇的是，后来在网上看到过沃森参加一个脱口秀节目，在节目里沃森能正常聊天，能听懂笑话并“笑出声”，自己还能讲笑话，这是真的么？还有，沃森与人的交流有局限性么？谢谢！

　　潘越：脱口秀估计超过了Watson的能力，应该是娱乐一下吧。

　　看世界的紫紫：请问身为设计战胜人类计算机系统科学家的一份子会否存在身为设计者以及身为人类的一种矛盾呢？或者说一种尴尬呢？是否希望它能超越人类的同时又希望它始终under自己？

　　潘越：目前机器只是在某些特定领域表现出和人类可比的智力水平，还有很多领域机器还差得很远，因此不必为此担心。

　　老有腔调额侬：沃森是否是基于power处理器架构，运行AIX操作系统的通用计算机，还是像当年深蓝用了很多协处理板，这样的架构适合高性能计算还是适合商业环境？谢谢！

　　潘越：沃森采用的Power750。 “为特定负荷进行优化的系统”(workload optimized system). 它能把一件事情(智力问答)干到最好。是高性能计算还是适合商业环境是可配置的。

　　QLUQ ：Watson目前能够回答任何人类提出的问题吗？它背后的逻辑是基于统计建立的吗？

　　潘越：沃森现在擅长回答有唯一正确答案的事实型问题。它背后同时使用了逻辑推理和统计推理。谢谢张雷帮助解答。

　　王向东：人机大战什么时候能延伸到动手能力？

　　潘越：看看这个 http://sinaurl.cn/h5hy21

　　张结魁：Watson的领域知识库是怎样建立起来的？现在已建立的领域知识库有哪些？建立在不同领域上的知识库及其推理规则一般来说是不一样的，Watson的学习/推理机制具有多大程度的通用性？

　　潘越：沃森的领域知识库包括百科全书、字典、地理类娱乐类的专题数据库、新闻报道、经典著作等约70GB。几个知识库的来源举例：世界图书百科全书、维基百科、纽约时报的大部分过刊以及圣经。谢谢张雷帮助回答

　　Bill歐：虽然中国人有份参与研发，但中国人有使用的权力吗？

　　潘越：IBM技术是服务全球市场的，欢迎中国的客户与IBM合作。中国对IBM全球是非常重要的一部分。

　　抢书狂人：沃森主要擅长的方面是什么？

　　潘越：对自然语言的理解。

　　潘越：时间的原因，今天的交流就先到这里，欢迎大家继续关注沃森和IBM。

[新浪网]

相关报道

IBM超级计算机能力有限不会威胁人类

　　美国东部时间16日晚，IBM的智能计算机“华生”击败两位人类选手，获得了电视竞赛节目《危机边缘》的总冠军，赢得77,147美元的奖金。

　　《危机边缘》是一项问答赛事，参赛者需要就历史、文学、艺术、流行文化、科学、体育、地理、文字游戏等领域的问题进行抢答。比赛开始后，先由主持人读出一段文字提示，再由选手推断文字所描述的人或事，比如题目是“我们国家的国父，他没有真的砍倒樱桃树”，那么正确答案就是“乔治·华盛顿”。

　　三天苦战之后，两位前冠军肯·詹宁斯和布拉德·鲁特被“华生”打得溃不成军。曾经连胜47场的詹宁斯在眼看大势已去之后向对手认输，并引用《辛普森家族》中的台词说道：“我在此欢迎我们的电脑新主人。”但是他也表示自己很享受这场比赛，并且想尽快再比试一回：“输赢不重要，重要的是能亲身参与未来。”

　　IBM方面没有公布在“华生”的制造中投入了多少经费，但是据公司最近一次会议中向分析人士披露的信息，这个数字约为3,000万美元。

　　重大突破，前景看好

　　电脑在数字运算等方面早就超过了人脑，但在理解自然语言方面一直表现不佳，这是因为自然语言中存在大量的模糊、双关、俚语，捉摸不透，难以界定。比如，“我穿着睡衣射死了一头大象”(I shot an elephant in my pajamas)，这句句子对我们而言很好理解，机器却容易理解成“我射死了一头穿着我睡衣的大象”。

　　正因如此，“华生”的获胜标志着人工智能领域的重大进展，代表机器对自然语言的理解能力提升到了一个崭新的境界。为了制造这样一台机器，人工智能领域的研究者已经辛苦了几十年。对IBM而言，这场比赛不仅是为自己做了广告、赢了奖金，还打开了一扇通向未来的大门。在未来世界里，智能机器将能理解人类的语言，做出相应的回答，或许还会接管一部分人的工作。

　　“华生”是IBM的25名科学家花了4年时间研发成功的。许多专家都认为，它可不仅仅是精通百科知识那么简单。眼下，“华生”的程序员正在制定下一步攻关计划，那就是将“华生”在竞赛中积累的经验投入医学。在医疗中，同样的症状可能是由不同的疾病造成的。在病因不明的情况下，“华生”能比人类更快地扫描海量的医学文献，找出可能的病因。当然，最终诊断还是会由人类医生做出。

　　IBM管理层表示，这个前景很快就会实现。本月17日，IBM宣布携手哥伦比亚大学和马里兰大学，三方将共同开发一套医疗辅助系统，让医生得以在网上向智能助手咨询。公司还计划和语音识别巨擘Nuance 公司合作，给这位智能助手配备语音识别能力。据估算，这项服务只需18个月就能上线。

　　哥伦比亚大学的临床医学教授赫伯特·蔡斯是这个项目的成员之一，他表示在过去的医学教育中，记忆一直是重点，可“一旦有了‘华生’这样的工具，就得重新考虑对学生的要求了”。

　　而在未来学家保罗·萨福看来，问答竞赛只是小试牛刀，“华生”的最终归宿将是搜索引擎——它能改变网上搜索信息的方式，让现在的“输入－点击”式搜索变成一场对话。“在未来，人类将直接和机器对话。在5到10年的时间里，我们的搜索行为就会演变成一场场对话。到那时，我们就会对现在这种返回字符的搜索方式不屑一顾。” 萨福说道。

　　IBM的管理层还透露，他们正在和一家著名的电子产品零售商洽谈合作，准备为对方开发一套类似“华生”的系统，并以IBM的创始人托马斯·华生的名字命名。这套系统将和顾客开展一系列互动，比如帮助他们决定购买什么产品，并在购买后提供技术支持。

　　“华生”项目的首席科学家大卫·费鲁奇表示，新技术将惠及众多行业：技术支持中心、医院、对冲基金公司等。凡是需要运用大量数据、做出大量决策的单位，都将从中获益。

　　能力有限，人类无忧

　　“华生”的获胜引出了一个问题：面对进步神速的计算机科学，人类还有什么机器不能做到的绝活吗？

　　卡内基梅隆大学工程系主任帕拉帕拉迪普·柯斯拉说：“这个问题可以换一种问法：‘华生’能够做出制造‘华生’的决定吗？我看还远远不能。而我们人类的创造力正是发现新知识、创造新技术的关键。”

　　人工智能领域的其他专家也表示，人类不仅比自己创造的机器多了一份创造力，而且创造后会觉得自豪，目睹别人的成败时会感同身受，在危险时会觉得恐惧。换言之，人类有情感，机器没有，而正是因为有了情感，我们才有了音乐、文学、微笑、悲伤。我们迄今还不知道情感是如何运作的，当然也谈不上在机器中复制。　

　　即便以纯智能而论，电脑也未必能全面赶超人类。“华生”的创造者大卫·费鲁奇是这样评价自己的作品的：“在我看来，这表明人类智能吸收了机器智能，而不是相反。人类的智能和机器是不同的。我们的智能是互相连接的：人脑和自身之间有着复杂的连接，和身体的所有细胞之间也有着复杂的连接，它是和语言、社会以及周围的一切共同进化的结果。人是一台会学习的机器，我们随时都在从外界输入的信息中学习，而在我们的创造物中，还没有一个往那个方向尝试过。”

　　他还表示，“华生”不是《2001太空漫游》中杀死人类的计算机“哈尔”，它更像是《星际迷航》中的那台电脑，会和人类对话、帮助人类梳理信息，担心它会从人类手中夺权完全是杞人忧天的想法。

　　卡内基梅隆大学的埃里克·奈伯格自2007年起就参与了“华生”项目，他表示自己研究人工智能已经15年，无论取得过什么成果，终点都似乎遥不可及：“计算机和人类智能之间似乎永远有差距，我甚至不能肯定最后能否成功。”在他看来，认为“华生”有损人类尊严的想法是可笑的：“‘华生’只会做一件事，那就是回答问题。”

　　波特兰州立大学的计算机科学教授巴特·马赛说得更有趣：“我知道有个法子能造出能像人类一样思考的东西；时间只要九个月，而且很有意思。”他表示，计算机虽然也能进化，但那只会“让你体会到人类思维的独一无二”。

[外滩画报]

诚信为本

经商做人

北京鼎正环保技术开发有限公司