导语:算法正在深刻影响人们的生活
每一年,《哈佛商业评论》都会评选出未来一年在数字媒体领域最重要的正在显现的趋势。他们所罗列的2015年趋势中有一个是关于算法的:“一套算法说白了就是一套守则或流程,必须遵循它才能找出解决问题之道。在新的一年里,我们也不禁要提出这样的问题:究竟要如何使用算法才不会触及道德底线?我们还要仔细审查某些算法出错的倾向。程序员们在算法中加入主观判断以便得出答案,这样做导致在大数据空间里,越来越多的物件、数据甚至是人员也被错误地归类。”
简而言之,算法,这个计算机行业内的术语正在深刻影响人们的生活——因为人们与互联网几乎24小时捆绑在了一起。在这种情况下,算法出错造成的后果几乎是灾难性的:在多个机场发生过多次错误辩认恐怖主义嫌疑人的事件;高频交易算法曾经把股市逼上绝境;亚马逊网站的一个算法错误导致一本书的单价飙升到2669.86万美元。
算法对于品友互动所在的这个网络广告程序化购买市场来说,更是格外重要。品友互动创始人兼CEO黄晓南定义品友的业务时说,“品友就是一个用算法解决怎么能够让广告越来越智能化地找到相应的人的DSP公司”。
它在互联网广告界的作用和“嘀嘀打车”类似:广告主和广告公司一起制作出精良的广告,然后接入品友的DSP需求方平台,品友则提前接入了例如谷歌、阿里巴巴、腾讯、百度、新浪、优酷、爱奇艺等开放的数字化广告交易平台。品友在广告主和广告交易平台中间,通过不断优化算法,如同引擎般加快和提高将广告分发到各个终端上去的速度和准确度。
“我们的目的是让广告主的需求跟用户的兴趣越来越匹配。”品友CTO沈学华说。匹配的好坏直接影响到广告主的利益,也关系到品友的生存。“所以,匹配算法是品友非常核心的竞争力之一。我们自己的算法工程师天天在琢磨如何优化它。”
品友作为业内市场上提供程序化购买服务最大的公司之一,拥有绝对核心的算法团队。“这个团队真正搞算法研究的有十人左右,全部是来自清华、北大、牛津等知名高校的硕士以上学历,之前服务过微软研究院、IBM、阿里等知名企业”沈学华说:“加上边缘的一些搞数据研究的大概20个人左右,是一个小而精的团队。”
正是这个团队,利用业余时间,在2013年到2014年之间成功地举办了首届全球实时竞价(RTB)广告算法大赛。从2013年4月开始第一轮比赛,一共三个赛季,品友邀请了世界优异大数据及计算广告学专家如哈佛大学教授郭健、美国著名数据挖掘大师JamesShanahan博士等作为评委。到2014年所有比赛结束,一共有600余名来自中国、英国、美国、法国、印度、捷克等全球选手参赛。
“这个比赛之所以非常有意思,是因为它不是简单的出题,而有开放测试算法的部分,”负责算法大赛的品友数据架构师表示。品友的算法大赛每一赛季都有冠军:第一赛季的优胜者是中科院的一个参赛队;第二赛季的赢家是北大的一个学统计的学生;第三赛季的冠军是来自伦敦UCL大学的两人团队。这些获得优胜的算法最终会嵌入到品友的系统,得到真正的运用,让广告主的需求通过参赛者的算法实时在交易平台上进行竞价。
“比赛的这个部分特别吸引人,”沈学华说:“也特别具有挑战性。”Netflix举办算法大赛的做法是发布一个数据集,让世界各地的参赛者利用这个数据集测试他们的算法,而不是把外人的算法嵌入到Netflix的系统里。谷歌也曾经有过类似品友的这种“嵌入”型比赛想法,但最终还是放弃了。理由很简单,一个公司一旦大到一定程度,就会过多考虑这种做法所带来的风险,大公司的业务是牵一发而动全身,因此一考虑是否“值得”的问题,多半就偃旗息鼓了。
而采用这种有些冒险的方法来举办一个算法比赛,恰好符合品友这样一个具有活力和创新精神的公司的“性格”——品友从一开始就想把自己的平台变成一个开放平台,能让第三方插入自己的工具。“比如说我们现在跟第三方广告监测公司做交互,我们认为监测就是一个工具,帮助广告主监测他的广告投放在哪儿,这个业务我们是不做的,第三方可以把自己的应用集成到我们的平台上,”沈学华说:“所以做算法大赛,不但对我们的系统提出了更高的要求,也符合品友未来的战略。”
“对于品友来说,当时它需要做到两点,一方面要保证系统的健全,如果跑的这个嵌入程序出问题了,不要影响其他的广告主,这个就需要做很多类似防火墙的安全措施。另外一方面,要求品友系统的API(应用程序编程接口)设计得特别合理,一旦跟外面的程序对接好,如果发现出了问题,就能立即把它停下来。”
“当时,我们这些组织比赛的人还是很辛苦的。对方提交了程序以后有什么问题都必须跟踪,比赛期间,品友的算法团队成员和支持部门的同事几乎都没有正常休息过。这一切都还是利用业余时间完成的。”
事实上,由于他们的责任心、系统的稳健与合理的参赛规则设计,三届算法比赛都顺利进行了。而且由于他们将优胜者提交的算法“嵌入”品友系统运行的这个特别部分,产生了很多很有价值的数据,在国内外各个大学的计算广告学研究领域都引起了轰动与重视。
“基本上,现在你问一下中科院和各个大学在计算广告学圈子里的人,大家都知道品友的这个比赛。”
由于这个行业本身规模不大,品友的比赛激活了其中的活跃分子。沈学华表示,“我们组织算法大赛有一个初衷,就是计算广告学在美国工业界已经非常火了,在国内我们还需要推一推,让更多有能力的人对这个领域感兴趣。”
基于这三次比赛,品友已经建立起一个计算广告学的社区,“大家经常在线上和线下组织讨论、沙龙和活动”,品友也从中受益匪浅。
事实证明,计算广告学方面的人才供不应求——“第二赛季的冠军就已经被百度挖走了。”
“我们没有想过说是所有参赛的那些很棒的人都会被品友所用,”沈学华说:“我们想的更多的还是希望对这个行当感兴趣的人越来越多。
所以这个结果挺好,符合互联网的开放和分享精神。”
如今,如果问谁知道推荐系统、CTR预测等等,中国可能有几千人、几万人知道。但在计算广告学这个新兴的行业中真正有兴趣和有研究的人,也就几百个。这个行业有趣就有趣在,工程师面对的是开放的问题,而不是封闭的问题。
“这个行业包含了博弈论、机器学习等很多层面的东西,”沈学华说:“在这个行业里,还没有出现一个绝对好的算法,大家都在不断地研究和分享,这也是品友推崇的精神。”