随着智能手机的飞速发展,单纯芯片性能提升已经无法满足用户日益进步的需求。随着iPhone X和华为Mate 10发布和宣传,一个新的概念——AI芯片已经在手机圈悄然发酵。如今,鲁大师也正式宣布进军AI评测,为手机AI提供一个可评判的新标准。
鲁大师AI性能评测是什么
要知道鲁大师发布的手机AI性能评测是什么,首先要知道AI是什么。
我们这里所说的AI,实际指的是加入了AI(人工智能)模块的手机芯片。AI芯片的作用,正是在于提高用户体验、增强音频、图像和语音处理能力、人类活动的预测、语言处理、加速数据库搜索结果和增强数据加密等功能。
需要注意的是,AI芯片虽整合于SoC当中,实际是手机芯片的一个协处理器。与CPU、CPU没有太大关系。因此CPU性能的高低,几乎不会对AI芯片造成多少影响。可以这么说,一个新发布的旗舰芯片的AI能力,取决于这个芯片有没有对AI模块进行优化,如果没有,那么这个芯片性能再强,AI性能也不怎么样。
目前华为麒麟970的NPU,以及苹果A11,都已加入AI模块。据了解,三星的Bixby人工智能助手也即将上线中文版。除此之外,高通在其最新的骁龙旗舰处理器中,也开放了六核DSP(数字信号处理器),并且在几代之前就已经将其使用到异构计算和神经网络的开发。而英特尔、NVIDIA和其它公司都在开发自己的人工智能处理器产品。
也许你才刚刚开始留意到,但AI已经以最快的速度攻占手机领域。
另一方面,AI芯片虽然已经进入市场,但目前已应用的场景并不多。比较出名的仅有iPhone X的Face ID,以及华为Mate 10的图像识别功能。
即便如此,AI芯片的发展趋势也是指日可待。因此,作为评测行业的领导者,鲁大师率先发布了AI性能评测,可以说,为手机AI性能制定了一个较为可靠的标准。
鲁大师AI评测使用目前较为常用的三种神经网络Inception V3、ResNet34、VGG16的特定算法,机器识别图片内容,按照概率高低输出可能的结果列表。最终,通过识别效率来判断手机AI性能,进而给出行测试评分。
*科普:
ResNet34(残差网络)微软的残差网络(ResNet)与传统的顺序网络架构(如AlexNet、OverFeat和VGG)不同,其加入了y=x层(恒等映射层),可以让网络在深度增加情况下却不退化。ResNet架构已经成为一项有意义的模型,其可以通过使用残差模块和常规SGD来训练非常深的网络。鲁大师AI测试设置了34层的深度。 Inception V3 Inception V3是Google开发的一个开源神经网络模型。这种架构先前叫GoogLeNet,现在简单地被称为Inception vN,Keras库中的Inception V3架构提出了对Inception模块的更新,进一步提高了ImageNet分类效果。用了Inception之后整个网络结构的宽度和深度都可扩大,能够带来2-3倍的性能提升 VGG16 VGGNet由牛津大学的视觉几何组(Visual Geometry Group)提出,VGG模型结构简单有效,前几层仅使用3×3卷积核来增加网络深度,增加网络深度可以有效提升模型的效果。比较起ALEXNET, VGG对图片有更精确的估值以及更省空间,而且VGGNet对其他数据集具有很好的泛化能力。
这三种神经网络的作用,简单来说就是判别AI在识别图像中的能力。举例来说:该测试项目会提供一系列被测试的图片,华为Mate10的麒麟970当中的AI协处理器将发挥其作用在测试中对其进行识别(被测试图片右侧为对应的识别结果)。最后三项神经网络都会给出各自的评判分数,其中Inception V3测试成绩为 61分,ResNet34测试成绩为94分,VGG16测试成绩为57分。最后得出总分为212分。
另外,目前鲁大师暂未发布针对AI性能评测的排行榜。预计要等到发布一周左右,有了更有说服力的用户跑分,再公布一个相对公正的排行榜。
鲁大师发布AI评测的战略意义
手机市场在短短一年时间,先后经历了“双摄像头之争”,以及“全面屏之争”。这无疑是各大手机厂商为寻求占领市场而追逐的卖点。然而这些卖点仅仅停留在手机外形的表面,对市场并未起到根本型的推动作用。手机市场消费力已见疲软。甚至在第一手机界研究院发布的《2017年Q3中国畅销手机市场分析报告》中已经指出,预计2017年第四季度中国智能手机市场将继续呈现负增长。
手机市场急需一个突破的风口,而由苹果、华为、三星等掀起的手机“AI化”或将从软件体验角度带来新一轮变革。鲁大师发布AI性能评测,正是为了迎接这样一场新的变革。
AI在手机行业的快速发展已经是不可逆转的,即使现在应用场景非常有限,技术也不够成熟(否则不会出现iPhone X Face ID解锁的诸多问题)。但相信随着AI技术的进一步发展,AI芯片的普遍使用是毋庸置疑的。
当一个行业的某个项目百花齐放的时候,对于大多数用户来说都是迷茫的。不排除很多厂商利用AI技术制造噱头,夸大其作用。而用户并非个个都是专家,怎样通过简单高效的办法识破手机厂商的“烟雾弹”成为将来用户共同面临的问题。
这时候,一个可靠的标准就非常有必要了。它的出现正是为了解决用户无法评判手机AI能力的问题。
另一方面,对于鲁大师来说,从PC的验机跑分霸主,深入到手机性能跑分,手机体验评测跑分(主要负责测试ROM系统流畅度),手机VR评测(主要负责测试手机VR性能),再到现在的AI性能评测。不仅丰富了测试项目,更是拓展了评测的宽度。
这就好比,学生时代的考试,需要测试学生在不同领域的成绩,就需要不同的科目。而在评测世界,“手机”就等同于“学生”,而各个测试项目,就等同于不同的“科目”。随着手机智能化的越来越快的发展,每个领域有其专业的测试项目是非常有必要的。
总结
针对手机智能化的提升需求日益增强,目前各个手机厂商对AI追捧也无疑随之变强。手机需要AI专供于复杂数据排序算法,从而增强音频、图像和语音处理能力,提升人类活动的预测,加速数据库各项功能。随之衍生出测试产品,是必然趋势。
行业不断变化,对用户来说日新月异,一个崭新的卖点到底是不是噱头,它对于手机来说是否是真的提升?这些都需要依靠第三方评测的力量。不能说做到百分百公正,但绝不失为一个有力的参考。它甚至会督促更多的厂商,以更真实高效的办法,为用户服务,提供真正有价值的AI技术。