传统的数字版权保护行业费时、费力、成本高,海量内容难以全量保护,内容分发难以掌控传播的安全问题。区块链技术具有不可篡改、追根溯源、分布式共识等特点,和数字版权保护具有天然契合之处。数字版权保护技术是从数字版权内容的产生、分发、确权、使用的各个方面对数字资产进行保护。利用区块链技术的特点,将区块链技术与AI多媒体侵权检测技术相结合,可以节省版权登记费用,缩短登记周期,加快确权和取证时间,极大降低了版权维权成本,提升版权保护效率,增强对版权所有人的权利保障。引入AI+区块链技术,虽然有很多优点,为网络版权的存证、交易、维权提供了新的途径,但是在版权登记和版权交易过程中,仍然存在一些问题,包括大规模节点与系统平衡问题、数字作品存储中心化问题、由于区块链共识特点造成的系统性能瓶颈问题、以及版权所有者的真实IP泄露和其身份信息泄露的隐私保护问题。
基于人工智能技术的图像版权保护专家:王文昊
为了改善区块链技术引入数字版权保护领域后,大规模节点与系统平衡问题和区块链共识特点造成的系统性能瓶颈问题,中国杰出的基于人工智能技术的图像版权保护专家王文昊提出了一种基于主从编程模式和K-Medoids优化的Message Passing Interface-K-Medoids-PBFT(MPI_K_PBFT)共识算法。算法改进思想是分层共识,化整为零。王文昊利用K-Medoids算法进行节点分层时,首先抽样个体进行初始化聚心,其次,在利用主从模式优化聚类过程中,利用K-Medoids算法自身特性,将达到稳态的聚簇部分提取出,不参与下一代迭代,减少重复计算。最后,采用分层共识的思想,将共识压力分摊,减少共识过程通信开销。王文昊提出的K-Medoids算法在处理较大规模节点的情况下,在共识时延、吞吐量和通信开销三个方面均有不错的表现。
王文昊改进PBFT共识机制流程图
对于在数字版权登记中存在的数字作品存储中心化问题,对于数字版权交易中,版权所有者的真实IP地址泄露和其个人身份信息泄露的隐私信息保护问题,王文昊提出了一种基于匿名通信与用户数据分步处理的隐私保护方案。在匿名通信系统中,王文昊提出一种基于分组转发的重路由路径选择算法,首先,对系统内节点进行分组,每个分组至多选择一个节点,避免了路径建设过程中可能会出现环的情况,提升系统的匿名度。同时,由于转发机制原因,这样就会大概率的缩短由S到R的重路由路径。通过实践证明,王文昊提出的算法在匿名度和算法性能等方面有着优越的成绩,他同时提出了一种用户数据分步处理的隐私保护方法,利用InterPlanetary File System(IPFS)技术存储优势,弥补区块链技术的区块容量不足。
王文昊提出的K-Medoids算法进行时延实验的数据对比
在数字版权保护中,图像侵权检测能力是极为重要的一部分。现如今,盗版图片的猖獗不仅让图片网站损失惨重,同时给内容创作者带来经济和精神上的损失更是不可估量。近些年,包括二次创作、图像剪辑在内的侵权手段层出不穷,盗版图片的侵权样例也不仅局限在简单的剪辑或者加水印等容易被识别的方式。因此面向版权保护的图像侵权检测方法就变得尤为重要,针对这一系列问题,基于AI的多媒体比对算法技术,能够显著地节省人工审核的成本,提高侵权取证的效率,实现在大范围检索情况下做出精确的识别,是解决图像侵权问题的有效方案。
但是目前针对版权侵权检测,尤其是图像侵权这一领域在学术界和产业界都存在着一些瓶颈问题,主要体现在下面三点:
第一,数据集,目前学术界已经开源的数据集大部分都是只有图像级别的标注,即图像对之间只标注了是否侵权,而并未标注两个图像之间实际侵权的时间片段(即侵权起始时间位置和结束时间位置)。目前开源的拥有片段级别标注的数据集仅有2014年ECCV上开源的VCDB 数据集,但这个数据集规模比较小,仅有6k对实际侵权的图像对。
第二,算法评价指标,在学术界中,图像级别的拷贝检测评价指标比较成熟,但是片段粒度的拷贝检测准确度的评价指标仍然存在着比较多的问题。之前VCDB论文中提出的评价指标在实际的实验测试中出现了一系列指标上的偏差以及应用上的问题。
第三,侵权定位算法,侵权定位算法,在这里侵权定位(Temporal Alignment)算法指的是在提取出两张图像的时序特征后,需要输出两张图像侵权的时间片段。大部分侵权定位的算法都是不开源的,因此学术界也无法形成一个完善的benchmark,图像拷贝检测和侵权定位这个领域也相对较为停滞。
针对以上三个主要问题,王文昊做了大量的图像拷贝检测和侵权定位相关的研究工作,包括了:
一、王文昊提出了目前最大规模(超过现有其他数据集2个数量级规模)的图像侵权定位数据集,包括了超过16万对侵权图像对,28万对侵权片段,并且涵盖了大量的图像领域和图像尺寸。
二、提出了全新的图像片段拷贝检测的评价指标,该评价指标充分考虑到了图像拷贝检测这个任务的特殊性,并且在实际场景下体现出了更好的适应性。
三、提出了侵权定位端到端的模型SSAN并达到了现阶段最高指标,并且将现阶段学术界的常见侵权定位算法进行复现并且开源,形成了完善全面的图像侵权定位benchmark。
数字版权保护技术作为版权保护的主要手段,从基于加密技术、水印技术到现在的基于人工智能的区块链技术,数字版权保护技术手段日渐丰富和完善。采用基于人工智能的区块链技术的数字版权保护技术具有版权登记、注册周期短、价格便宜、流程透明、效率高、取证、存证、确权等各方面速度快等优点。为了改善大规模节点与系统平衡问题和区块链共识特点造成的系统性能瓶颈问题,王文昊提出了基于MPI-K-Medoids的改进PBFT共识机制,利用聚类算法将参与共识的节点进行分层,将大规模问题,转变成处理多个小规模问题,然后再进行结果汇总,在分层的过程中,是从减少通信开销的角度,利用主从编程模式对K-Medoids算法进行优化,经过对比实验分析,王文昊提出的MPI_K_PBFT算法在处理较多节点的情况下,在共识时延、吞吐量、通信开销方面均有明显的优势。
为了解决区块链区块大小受限带来的版权作品材料存储中心化问题、版权所有者的真实IP地址泄露和其个人身份信息泄露的隐私信息保护问题,王文昊提出了一种基于匿名通信与用户数据分步处理的隐私保护方案,通过隐藏版权交易过程的通信关系,防止攻击者根据网络拓扑追踪到版权所有人的真实IP地址信息,对版权所有者人身安全造成伤害。在匿名通信系统中,王文昊提出一种基于分组转发的重路由路径选择算法。通过商用落地实践证明,王文昊提出的算法在匿名度、算法性能、抗前驱攻击方面都有不错的成绩。同时,在版权登记过程中,王文昊提出了一种用户数据分步处理的隐私保护方法,利用IPFS技术存储优势,来弥补区块链容量不足和链上信息过于透明的缺陷,经过实验证明,IPFS系统在上行和下载速度方面均可达到常规的使用要求。
王文昊在基于区块链的数字版权保护关键技术的研究取得重要突破,进一步推动计算机视觉技术在生物特征识别领域的进步,鼓励面向真实场景的技术创新,为数字版权保护行业作出了积极的贡献。(文/陈立成)