浅析NFL定理对机器学习算法专利的创造性判断的影响
作者 | 杨凯诏 一个懒得想头衔的法律工作者
编辑 | 布鲁斯
一、关于NFL定理
NFL(no free lunch,没有免费的午餐)定理,由美国斯坦福大学的Wolpert和Macready教授提出,其采用数学方法证明,在没有限定一个具体的学习问题的情况下,所有学习算法的预测效果是一样好的。在提出该定理的论文中,两位作者假设所有的问题出现的机会相同(也即不考虑学习问题之间的差异),通过数学方法证明任何算法在训练集以外的整个样本空间的预测误差的期望是相同的(也即预测效果是相同的)。
从技术的角度而言,该定理的意义在于告诉机器学习算法的研究者,脱离实际的学习问题去讨论算法模型的优劣是没有意义的,也不存在一个能够等效地解决所有学习问题的机器学习模型,而笔者认为,从专利的角度而言,其与专利法律体系中创造性判断方法里的技术问题或技术启示,形成了很好的相互印照,提示着专利处理人员在讨论机器学习算法专利的技术效果时,同样要考虑技术问题或技术启示的影响。
1973年颁布的《欧洲专利公约》第56条已经明确提出了发明要具备“创造性步骤”的要求,并通过案例逐步确立起“问题-解决”的创造性判断方法,虽然这一定理是1996年才提出,但这一定理的提出也毫无疑问地证明,在机器学习算法领域的专利,同样要考虑,甚至要着重考虑技术问题或技术启示对于专利方案的创造性的影响。
二、NFL定理对于技术问题或技术启示在创造性判断中的作用的影响
我国的专利审查规定中,判断发明是否具备创造性时通常采用的“三步法”,基本上采用了欧洲专利局的“问题-解决”方法,强调对技术问题的认定,但同时,我国《审查指南》强调依据是否存在技术启示来判断是否显而易见,这一点其实也与美国的“教导-启示-动机”检验法相似。综合来看,我国的专利审查过程中在判断创造性时,技术问题的差异或技术启示的存在,都是非常重要的考虑因素。
而在机器学习算法专利的审查过程中,代理人在进行创造性答辩时,也应当注意结合NFL定理,来突出算法方案所欲解决的学习问题所带来的创造性贡献,以下通过两个案例来阐述:
案例1
一种用于预测XX的机器学习算法模型
审查员在审查该专利方案时,引用的对比文件中同样公开了一种机器学习算法,其模型结构、训练方法和数据预处理步骤都与专利方案相似,但该算法所用来预测的是另外一种参数,暂称YY。审查员基于该对比文件,指出专利方案和对比文件的区别技术特征仅在于所解决的技术问题不同,一个是用于预测XX,另一个是用于预测YY,而本领域技术人员在遇到了预测XX的技术需求的情况下,很容易想到用机器学习算法去解决这一问题,这对于本领域技术人员来说是显而易见的。
代理人在处理该案件的审查意见答复时,首先指出了审查员的该意见暗含了一个前提,就是同一种算法可以用于解决多个学习预测问题,且效果无法达到显著的差异,但这一前提是违反NFL定理的,在讨论算法的效果时必须结合其所解决的学习问题,其次,代理人指出,该专利申请的公开文本中充分证明了,该算法在解决预测XX的问题上达到出色的预测效果,因此,利用机器学习算法预测XX这一技术问题的提出,其本身就具备创造性,且该专利方案在解决这一技术问题上进一步达到了意想不到的效果,在现有技术不存在技术启示的情况下,更应该被认定具备创造性。
案例2
一种用于预测AA的机器学习算法模型,其为了预测AA,在数据预处理阶段对数据做出了相应的处理手段。
这一案例与案例1不同之处在于,审查员在审查该专利方案时引用了两篇对比文件,一篇公开了用于预测BB的学习算法,另一篇公开了用机器学习算法预测AA的技术启示。审查员基于该对比文件,指出专利方案和对比文件1的区别技术特征仅在于所解决的技术问题是预测AA,而对比文件2中已经存在这一技术启示,因此本领域技术人员很容易想到用对比文件1中的机器学习算法去解决预测AA这一问题,这对于本领域技术人员来说是显而易见的。
代理人在处理该案件的审查意见答复时,同样首先指出了审查员的该意见中忽视了算法方案要解决的技术问题对于其技术效果的影响,而这是违反NFL定理的,其次,代理人进一步指出,该专利申请为了预测AA,在数据预处理阶段对数据做出了相应的处理手段,这一手段成功地使得算法在预测AA时相对于其他算法达到了出色的预测效果,因此该算法在解决预测AA的问题上达到出色的预测效果,应该被认定具备创造性。
上面两个案例可以看出,代理人在解决机器学习算法专利的创造性问题时,应当有效结合NFL定理,一方面,强调专利申请所具体解决的学习问题的重要性,提醒审查员不应该忽视该学习问题的影响,另一方面,要注重结合专利申请中与该技术问题相关的区别技术特征来综合论述专利的创造性,以达到更好的说理效果。
三、NFL定理对于智力活动规则或商业模式在创造性判断中的启示
机器学习算法专利的创造性审查中,有时候会因为其算法方案与智力活动规则或商业模式的结合,而被质疑其创造性。例如,当机器学习算法是用于解决一个社会学问题时,或是用于实现一种商业模式时,有时候会被审查员指出,其本质上与现有技术的区别是一种智力活动规则或是一种商业模式,不具备技术性,因此其整体方案不具备创造性。在面对这些情况时,代理人也应当注意结合NFL定理的启示,充分论述技术问题对技术效果以及整体创造性的贡献,以下通过一个案例来说明:
案例3
一种用于预测金融产品盈利率的机器学习算法模型。
审查员在审查过程中引用了两篇对比文件,一篇公开了一种结构类似的算法模型,而另一篇公开了将机器学习算法应用在金融领域的技术启示,基于这些对比文件,审查员认为,专利申请与对比文件在整体上的区别是将机器学习算法具体应用在了特定金融产品的盈利率预测上,而这一区别,属于人类智力活动制定的规则,其遵循的是商业规律,并不遵循自然规律,因此并不是技术上的创新,不具备创造性。
代理人在处理该审查意见时指出,首先审查员同样是忽视了预测金融产品盈利率这一特定技术问题对于技术效果的影响,这本身是错误的,其次利用算法进行商业行为的预测,本身在整体上便是一种技术上的方案,而在讨论该专利申请的技术效果时不应忽视其所解决的预测金融产品盈利率的技术问题,特别是该专利申请为解决这一问题,在算法模型的参数选择和结构设计上均作出了相应的改进,从而达到了非常出色的预测效果,其通过算法改进以解决特定的技术问题并达到出色的预测效果,是符合NFL定理的,也是遵循自然规律的,因此不应当割裂地看待其技术特征,忽视其技术效果和技术问题之间的关系,而是应该从整体上评判其相对于现有技术所做出的具备创造性的改进。
同理,在面对与案例3类似的,审查员认为专利申请与现有技术的区别或是要解决的技术问题仅是实现一种商业模式时,代理人同样应当充分考虑围绕这一技术问题的技术特征和技术效果来论述其创造性,并强调其技术问题对于技术效果的贡献是技术性的,不应当忽视其存在。
四、NFL定理对于算法相关企业在专利挖掘布局中的启示
笔者想要指出,由于目前许多机器学习算法模型缺乏可解释性,特别是一些深度神经网络模型,本质上仍然是一种对人类神经突触结构的模拟,其模型参数和运行原理实质还是一个黑箱。在这种情况下,许多机器学习算法专利在专利申请时,都会面临上面几部分中提到的,对于其创造性的质疑。
而NFL定理的提出,其本质上是揭示了,即便是缺乏可解释性的算法模型,其为了解决特定的学习问题而被搭建和训练,并在解决该学习问题上实现的出色的预测效果,也应当被认为是一种遵循了自然规律(技术定理)的技术改进,而不应当因为该学习问题本身不属于技术上的问题,或是所达到的技术效果或预测效果不属于技术上的效果,而忽视其在技术上的改进效果,或是认为其不过是将算法运用在了非技术领域而不具备创造性。
因此,算法相关企业在专利挖掘布局时,在筛选技术方案的时候,特别是对于一些可解释性差的算法模型,更应该关注其模型设计、训练设计和预测效果,与特定的学习问题之间的联系,并优先地将与这些联系相关的技术特征作为专利申请的重点。进一步的,还可以针对围绕特定的技术问题的多个算法方案,例如为解决特定的学习预测问题而设计的多种预测模型,来做相应的专利布局,以达到对特定学习预测问题的算法产品的全面保护。
此外,笔者认为,可解释性较差的机器学习算法模型在专利申请时,还可以考虑借鉴一些生化领域的申请,通过附上实验数据的方式,来证明该算法模型的整体设计或是训练方案,在解决对应的技术问题上达到了出色的效果。这是因为生化领域的一些方案由于化学作用的具体机制无法直观地推理或被毫无疑义地证明,需要通过实验证明其意想不到的化合效果,而这与一些可解释性低的算法模型的情况是相似的。在这一情况下,笔者认为,采用实验数据来辅助证明经过设计的算法模型可以在特定预测问题上达到优秀的效果,是站得住脚的,也是遵循NFL定理的,相应的,专利审查机构也应当对这类算法相关的实验数据的审查及早做出相应的规范制定,以明确审查标准。
(本文仅代表作者观点,不代表知产力立场)
图片来源 | 网络