【2017年9月4日,北京】9月2日,由IBM和CSDN共同主办的第三季PowerAI人工智能黑客松编程大赛,在北京成功举办。此次赛季以《挖掘制造工艺和流程的金矿》为主题,旨在破解人工智能应用难题,推动人工智能在传统制造业的落地。20个团队历经疯狂、兴奋的12个小时AI编程比拼,最终来自中科院声学所的4位博士组成的团队获得冠军,第二名由来自腾讯公司(北京)、中科院自动化所的团队和来自微软亚洲研究院、北京大学的团队分别获得,来自中科院计算所、北京大学、北京邮电大学的团队和来自Kavout公司、中科院自动化所、中国科学院大学、华通设计顾问工程有限公司的团队,以及来自北京希嘉创智教育科技有限公司、上海远洲核信、中科院计算所、中国科学院大学的团队分获第三名。
参赛团队现场大合影
“当下,人工智能正处于深耕行业应用的关键点,中国也将人工智能上升为国家战略。但把新技术应用到实践中,不是一蹴而就的。比如,开发者学了模型、训练数据后,并不一定能真地用在生产线。相信一天的比赛下来,选手们遇到不少挑战,而赛题的设计就是一步一步地带领大家解决这些难题,在其中体验、学习人工智能最新的技术,学会用人工智能解决行业中的实际问题。IBM希望通过举办这样的活动,发掘、培养更多人工智能创新人才和团队,共同引领人工智能在行业实现新的突破、新的繁荣。” IBM全球副总裁、IBM中国系统开发中心总经理谢东博士表示。
IBM全球副总裁、IBM中国系统开发中心总经理谢东博士
探秘制造业如何用好AI
制造业是传统的企业。根据IBM这大半年与包括金融、电信、制造业、医疗在内的众多行业的沟通来看,制造业使用AI的意愿非常强。在质量控制、流程控制、IOT等方面的数据准备工作已经相对成熟,希望进行数据分析,直接用到AI技术。此外,从人工智能应用的角度来说,真正能产生价值,能够改变大家生活的,离不开制造业这种与人们息息相关的行业。基于这一背景,此次大赛围绕人工智能在制造业的应用展开。
“AI能为制造业在质量控制、良品率分析、工艺流程的描述这三块带来重要价值,我们针对工艺流程方向设计了赛题,并将比赛的具体形式设计为问答系统。” IBM中国系统实验室高性能计算部门开发部经理宋煜进一步解释了赛题的设计。
具体而言,现场比赛包含训练环节和比赛环节。在训练环节,选手通过设计模型对给定的语料进行分析理解其中语义,最终实现一个针对训练语料内容的自动问答系统。在比赛环节,选手根据预先提供的接口在比赛时收到以文本形式呈现的题目,然后使用训练好的自动问答模型回答并通过提供的接口发送答案至裁判端。其难点在于准确判断问题意图、精准定位问题所在文档位置以及自动抽取并精确组成答案。
为了真正考验选手的能力,题目也做了精心设计。IBM花费了一个多月的时间,收集了医疗、制造、重工业、轻工业等各行各业的文本资料,还专门设计了三个大坑:
第一,数据没有清洗。数据大部分都是来自于标准的PDF、word文档等,涉及到中文常见的繁体、简体问题,编码问题,全角、半角的问题,为训练过程设置了障碍。
第二:特意规避了一些字词。这样选手无法用关键字、词和短语来搜索问题的答案。在数据没有清洗的情况下,如何把Attention模型在12个小时内做出来,这是最难的考验。
第三:设置了一些细节考核。考察的时候用了一套AI系统来评判,只有最贴近主题的答案才能较高的分数。比如葡萄酒的甜度或酸度,AI系统会判定用百分比就比要用小数点更贴近答案主题,也因此能获得较高分数。
不难看出,比赛形式的设计和问题题目的设置,非常贴近AI在制造业中的实际应用,但难度确实增大。对此,中科院声学所4位博士组成的冠军团队在赛后表示:“比赛中遇到的最难解决的就是数据处理的问题,没有有效的标注数据,几乎崩溃!但最大的收获是我们坚持了下来,并实现了完美的团队合作!”
他们凭什么赢比赛?
IBM中国系统实验室高性能计算部门开发部经理宋煜
赛后,IBM中国系统实验室高性能计算部门开发部经理宋煜表示:“就技术而言,大赛看重模型的设计能力,不只是复制和使用既有的模型,更重要的是能够有模型设计上的创新。来自中科院声学所的冠军团队使用了两种方案。在最后的方案中使用了Bi-direction LSTM+Attention-LSTM。由于标签数据量有限,他们用R-Net的Attention机制对问题和篇章进行表示,然后再次使用Attention-RNN在篇章上进行Auto Encoder最后使用带Attention的Decoder生成答案,替换掉原来R-Net的输出层,巧妙降低了标签数据不足的影响。同时,在比赛中,该团队有着良好的项目分工,在转码,异常字符处理,词和字的特征提取以及匹配算法上都做了相应的调整和优化,最后达到一个良好的效果,从而赢得了比赛。”
PowerAI人工智能黑客松备受开发者青睐
事实上,IBM在技术、产品化以及跟客户对接和项目管理方面都很成熟,而如何用新兴的人工智能技术解决行业的实际问题,这是IBM关注的重点,也是大赛考核的重点。或许这能解释为何PowerAI人工智能黑客松备受开发者的青睐。
PoweAI是IBM专门为人工智能所建,被称为“世界上最快的商用深度学习软件”,有助于缩短等待时间、提高生产效率,让AI开发过程变得更轻松、更直观、更高效。
PowerAI人工智能黑客松自今年启动以来,已经举办过三季。在前两季大赛中,开发者给予了大赛热烈的支持。在大赛第一季中,有113人报名,58人参赛;而在第二季中,大赛招募参赛人员298人,现场有16支团队参赛,共计63人,分别来自浦发银行,交通银行,兴业数金,蚂蚁金服等金融行业以及其他服务于金融行业的相关行业等。
大赛不仅在国内人工智能算法领域引起广泛关注,而参赛选手的阵容也堪称豪华。这一季的选手来自北大、清华、中科院、北邮、北师大、北航、腾讯、微软亚洲研究院、搜狗、今日头条等知名院校及科技公司。这些选手有机会接触非常先进的PowerAI人工智能平台,并基于此创建新的计算机模型以高效地对数据进行分析,类似模型可以在制造业的新产品设计、工艺和流程改进等方面帮助设计和研究人员更快速借鉴既有经验,从而加速产品设计、工艺和流程改进的过程。
IBM认知系统助力人工智能全面落地
事实上,在认知时代,IBM以PowerAI加速构建人工智能生态。基于此,IBM认知系统提供一体化的认知基础架构平台解决方案,帮助客户实现认知和人工智能技术的落地。
IBM认知系统借助唯一拥有CPU:GPU NVLink的面向高性能计算的IBM Power Systems架构,提供人工智能相关工作负载所需的高性能计算力。此外,认知系统集成了PowerAI深度学习框架,提供预编译的主流深度学习软件工具包,同时简化安装、部署,并针对NVIDIA GPU及NVLink优化性能。
基于如此强大的软硬件一体化解决方案,IBM认知系统已在金融、医疗、制造等多个行业建立了成熟的应用场景。在银行领域,IBM的智能影像识别系统可以实时检测出各种类型的遮挡并进行预警,这对ATM机防诈骗有显著的价值。在医疗行业,IBM的认知技术可以帮助医生分析医学影像找出病变,提高效率避免遗漏,预测和分析肿瘤病例的识别正确率可达80%以上。在制造行业,深度学习技术可以辅助零部件与材料缺陷检测,利用机器学习解决工业监测/智能制造的应用场景。
一个应用案例是石油勘探领域的应用公司Stone Ridge采用了30台IBM OpenPOWER服务器、120片GPU,体积大概有会议桌的一半那么大,在90分钟时间内就完成了计算。如果用传统计算平台,使用的机器的规模就需要半个足球场那么大,要跑20个小时。
未来,IBM将持续提升IBM认知系统的架构能力,为人工智能领域的生态环境,提供强有力的技术支持,加速推动人工智能技术的商业应用。
关于IBM公司
若想了解关于IBM公司的更多信息,请访问公司网址:http://www.ibm.com/cn-zh/,或扫描下方二维码,关注IBM官方微信公众号。