康信视点 | 人工智能技术深入发展对法律与知识产权行业的影响及对策
作者 | 余刚 李慧 北京康信知识产权代理有限责任公司
编辑 | 布鲁斯
随着2022年底生成式人工智能(AIGC)产品ChatGPT的问世,AI的进化速度令人目不暇接。不到一年时间,我们从Chat GPT3.5的聊天和文本生成功能,迈进到性能更加强大的GPT4,一直到两个月前,仅需一个指令就能自动生成视频的SORA诞生。同时,AI对法律服务行业的影响正迅速深化和扩展,如何应对成为法律行业共同面临的问题。已经有行业先锋,如著名的律师事务所Allen & Overy,他们与美国的Harvey公司合作开发的律师智能助手已投入应用,而更多人则正在考虑采取何种应对策略。
AIGC对法律与知识产权行业冲击篇
PART.01
不是数字化、信息化
AIGC的革命性质在于它本质上是一个生成式模型,即利用机器学习模型,尤其是深度学习技术,来创造新的内容(如文本、图像、音乐、代码、3D模型等)。与传统的数字化和信息化不同,后者主要将现实世界的信息转换成易于管理和分析的数字形式。相较之下,AIGC不仅仅是对现实世界的简单“转换”或“翻译”,它已经初步拥有了人类的学习、理解、概括和创造的能力,并利用这些能力来进一步创作出新的内容。
比如,ChatGPT4 已经具备了解读图片,并生成文字说明的能力,以下分别为某专利申请流程图和ChatGPT4对其自动解读动图。
PART.02
AIGC与人类特质
AIGC的基础是大型语言模型和海量数据训练,它具备迅速处理和分析大量数据的能力,并能快速生成丰富的内容。同时,AIGC也展现了类似人类的特质,包括学习、总结、概括以及进行分析推理等能力,并且作为硅基智能可在算力支持下7*24小时不间断工作。与之相比,人类作为碳基智能在时间、精力和数据处理能力上可能无法与AIGC竞争,但人类的创造性思维更加深刻和复杂。人类能够理解、表达和沟通丰富的情绪,进行深度推理分析,并综合考虑包括伦理道德在内的各种因素,做出复杂而综合的决策,并提供建议。
PART.03
法律行业适合进行AI的深度垂直应用
在法律行业中,为客户提供法律咨询、撰写法律文件、参与案件庭审以及进行沟通谈判等服务都是常见的职责。在这一行业的几乎所有服务环节中,都会产生诸如法律文书、案件分析、合同、法律意见书和研究报告等各类文件,这些文件是重要的参考或成果物。因此,从某种意义上说,法律行业可以被视为一个近似内容生成行业,尽管它由于各案例情境的不同而涉及大量的人工实践环节。AIGC通过训练各种数据,如果能够接入足够的法律法规和案例数据,就能通过学习这些数据来生成各类与法律相关的文件。因此,法律行业也已成为AI应用中最典型的垂直场景之一。
专利领域兼具法律和技术属性,AI工具在该领域应用潜力巨大,比如下面两幅动图是某AI大模型对上传的最高院(2010)民提字第 158 号专利侵权判决书内容的概括以及对其中是否提起无效、侵权成立事实等细节解读,以及对专利对比文件AU2009270482内容和技术创新点解读的示例(尤其是创新点细节准确地从说明书某个位置被读取出)。
PART.04
传统律所的AI革新和飞速发展的初创智能法律服务者
在认识到生成式人工智能对法律行业的重大影响之后,ChatGPT问世仅几个月,著名律所安理就率先与美国Harvey公司合作。Harvey公司利用其专有的法律数据进行预训练和微调,为安理律师提供了深度定制的ChatGPT助手。这不仅包括起草法律文件、辅助法律研究、审核法律合同以及解释法律术语等专业工作,还能基于数据生成相关建议。3月底,另一家国际大型律所宣布与Harvey达成合作,部署生成式人工智能产品。
同时,这一趋势催生了新型的法律AI公司。这些公司大致分为两类:一类是直接在线提供人工智能法律服务的公司,典型的如EVEN UP,专注于个人伤害索赔,市值达到数十亿美元;另一类是基于不同大语言模型,为企业或律所开发定制模型的公司,比如基于ChatGPT的Harvey和基于ANTROPIC的Claude技术的Robin AI。这些公司在融资规模、客户数量和营业额方面都呈现出惊人的增长速度。例如,Harvey公司的年度经常性收入从2023年4月的一两百万美元,跃升至2023年12月的千万美元级别。
PART.05
AI平台和工具的快速发展大大拓展了实践应用的空间
作为一种大型语言模型,ChatGPT 3.5版本已能够非常出色地完成信函起草、翻译和文本语法修改等任务。这些工作通常由律师助理负责,而ChatGPT 3.5则可以轻松一键完成。它生成的商务信函周到且礼貌,基本无需进一步修改。在翻译方面,它也能够达到相当准确的水平。通过将生硬的文件输入ChatGPT,它可以即刻完成语句调整和语法修正,转化为完美的文稿。
除了律师助理的日常任务外,大型语言模型在法律文书和研究报告的编制方面也取得了长足的进步。ChatGPT在一年内从3.5版本迭代升级到了4.0版本,GPT-4.0拥有广泛的法律理论知识,并能够直接生成各类法律文书(如警告函、诉状、合同)的框架模板。通过专业律师的持续提问和引导,它能够生成更为详细的法律文档(详见下面的动图示例)。在此基础上,专业律师可以进一步根据具体案件的情景完成最终的法律文书。在技术相关的法律工作领域,如专利法,由于与科技界和产业界的交叉,各种大型模型不仅训练数据充足,而且在获取技术文献、摘录重要内容、回答技术问题、预测技术趋势方面表现出色,能够出具一定程度的技术研究报告。同时,也出现了一些通过技术交底书产出专利申请文件或者是通过权利要求书产出说明书的产品(如Patentpal等,效果尚需改进)。
例如,以下分别为GPT4生成专利许可合同的支付条款动图,以及经律师持续提问后进一步生成强化许可收益监督的条款动图。
在商用大模型方面,近一年的发展见证了ChatGPT不断迭代至GPT-4。此外,还涌现出了包括Google、ANTROPIC等公司开发的大模型在内的各具特色的商业人工智能平台,这些平台在某些方面超越了GPT-4,例如某大模型在一些技术问题回答上比较准确,以下动图示出其较为准确地说岀了PAO催化剂制备现状及较为有前景的催化剂类型。两个月前,GPT Store上线,目前已有超过300万应用,涵盖了众多办公通用工具和法律专业工具。Midjourney、Sora等平台进一步推动了大语言模型向图像、音频、视频生成的多模态发展。同时,纷繁复杂的开源大模型也为众多开发者提供了进一步在AI上开发私有大模型的机会。
PART.06
AI拉平专业知识差距、工具差距,突显个性化特质
无论是闭源还是开源,AIGC在知识范围的广泛性方面,促使在相同AI应用技能水平下不同专业人士之间的知识差距逐渐缩小。同时,AIGC的大型模型平台及其应用提供的工具功能能够赋能于不同的专业人士,进一步减少知识差异。当然,这种差距缩小的可能性,并非必然发生。此外,知识差距缩小的程度和方式也会因企业或个人的特性而异。
通过使用GPTs在法律领域提供的工具,可以快速获取大量专业法律知识,以下分别为GPTs中和法律相关各个GPT应用,以及通过其中一个GPT应用分别回答美国的专利法、IDS(信息批露声明)以及IPR(双方复审)等动图。
PART.07
什么性质的法律工作会被AI替代?
从当前的应用来看,法律工作中那些仅仅涉及提供知识类的工作是必然会被取代的,背诵记忆复现这些知识本身会被完全替代,而法律工作中涉及知识选择的能力不会被完全替代。法律中涉及经验仅涉及可复制知识的法律服务会被从赋能开始而逐步取代,涉及创造性和个性化法律服务的,比较难被取代。
AIGC下法律服务企业的应对篇
面对人工智能时代的到来,通用法律以及知识产权等各专业领域法律服务的企业,都应当积极思考、适应变化,并采取行动应对人工智能带来的变革。
PART.08
制定企业发展AI应对战略
随着AIGC爆发式发展,应用范围和深度的拓展及应用产品层出不穷,给包括法律服务行业业务模式、技能要求带来了深远的影响,也必然对服务内容、岗位设置、团队建设模式等相关领域形成不同程度的冲击。从法律服务企业的角度来看,法律咨询服务可能被机器人取代,甚至传统的产业链将被颠覆,AI公司将成为法律服务企业的重要合作伙伴和供应商,从业人员需要AI技术赋能进行更新迭代。
面对如上种种变化,企业在传统的经营发展战略以外,还需要制定AI应对战略,围绕AI技术、AI产品的应用设定发展目标,对相关的AI技术基础构建、服务项目创新和流程优化、人员能力建设内容、伦理道德要求、风险管控等事项的具体工作内容、安排进行规划,并给予上述安排足够的资金、人力资源保障。
PART.09
构建企业私有化大模型
随着大模型开源项目的出现,企业构建私有化的定制大模型(LLM)在技术层面上日臻成熟。法律服务行业企业应综合考虑数据治理要求、企业自身竞争力以及成本开展构建企业私有化大模型工作。法律服务行业企业构建私有化大模型一是可以提升AI工具的使用质量,结合通用模型缺乏专业知识和行业数据积累的问题,提高输出成果的针对性和精准度。二是可以满足数据治理的要求,包括防止敏感数据和涉密数据外泄,符合客户、政府等第三方的数据合规要求。企业可对私有大模型进行本地部署,将相关数据在大模型上训练,产出保密的且为企业自己所用的成果。私有化大模型包括四个关键要素:
私有大模型要素一:数据建设
私有化大模型的要义在于个性化,能够形成个性化的基础就在于训练模型所用的数据。这里所说的数据既包括行业数据,行业数据例如包括常法律领域的法律法规数据、诉讼文书数据、知识产权领域的专利数据等,也包括企业自身数据,包括企业内部案例数据、内部知识库等。企业首先需要完成信息化数字化,将自身拥有的数据转变为大模型训练所需要的数据。法律服务领域已经做好IT和数字化建设的企业将在这一轮私有大模型的训练中占上数据优势。
私有大模型要素二:模型选择
各类开源大模型已不断涌现,这些大模型的主要区别在于架构和算法不同。以开源大模型为基础,企业可以通过构建自身的大模型,训练数据,进行微调实现私有大模型构建。不同模型在架构、参数数量、训练数据量、能力特点等各方面都存在差异,法律服务行业企业应综合模型可靠性、安全性、许可合规性等根据预期目标适当选择。
私有大模型要素三:算力支持
大型模型需要更多的计算资源进行训练和部署,这可能导致技术基础建设方面更高的成本。AI为算力之躯,对于AI芯片等需求正如人类对于粮食需求一样,消耗极大。无论是云服务提供商还是本地服务器,都是需要比较大的算力成本。这种算力的要求非常惊人,例如,由于AI GPU的海量规模需求, “AI芯片之王”的英伟达公司NVIDIA的市值在2024年2月达到了2万亿美元的水平。GPU卡国内时常面临一卡难求的情况。因此,企业需要根据应用需求在一定算力和资金支持下建设企业私有大模型。
私有大模型要素四:团队建设
建设私有化大模型需要AI专业人员和法律服务企业专业人员两类人员参与。AI专业技人员主要负责大模型的构建(如个性化参数设定)、预训练、运行维护等工作,企业可以自建团队,也可以与外部机构合作。专业人员主要负责提供专业知识支持,比如筛选训练数据、构建提示词、参与训练AI等,需要从专业员工中进行选拔和培养。
PART.10
加强商用AI平台和软件的应用
商用AI 平台和软件的应用在一定时间内占据非常重要的位置。商用AI 平台软件通常属于闭源软件,目前相对于开源大模型处于比较先进的位置。商用AI平台和软件应用时需要注意避免将涉及保密事项输入商用AI平台和软件。
多平台互相补充互相验证
除了ChatGPT外,Google、ANTROPIC开发的大模型等各具特色的商业人工智能平台也相继出现,初步形成了由多个商用大模型主导的市场局面。随着竞争的多元化,这些AI平台展现出了较为鲜明的特点,例如有的大模型在长文本处理和多模态能力上突出,有的大模型在对话能力上更强,而另外一些大模型则显示出更为综合的能力。不同模型由于其先天的技术基础和后天的训练过程不同,已经逐渐显示出能力上的差异,可以在应用过程中进行多平台的相互补充和验证。
挖掘应用通用和专业AI工具
商用大模型作为平台的应用发展,为法律应用的进一步发展奠定了良好的基础。例如,商用大模型ChatGPT不仅在线直接提供服务,同时也充当一个平台,提供了类似于App Store的功能。两个月前,随着GPT Store应用商店的上线,GPTs(Generative Pre-trained Transformers)展现了其强大的平台功能。目前,首批应用已经达到了300万个,集成了包括图像生成(DALL-E)、写作(Writing)、办公工具(Productivity)、研究分析(Research & Analysis)、编程/软件开发(Programming)、教育(Education)、生活(Lifestyle)等七大类工具。可以预见,得益于GPTs的自定义功能和庞大的用户群,衍生应用的数量将持续增加,这为法律行业应用的深度和广度提供了坚实的基础。
这些工具中,多项可以应用于法律服务。例如,写作类(Writing)工具中的All around Writer(全能作家)、Human GPT(人性化GPT)、Copywriter GPT(文案GPT)可以用于生成各种专业文件和宣传文案;办公工具类(Productivity)中的Slide Maker(幻灯片生成器)、Canva;编程/软件开发类(Programming)工具可以用于开发个性化软件。
多模态大模型的应用
SORA的一条指令便能生成东京街头女子的视频,这令无数人感到震撼。在法律行业中,文本应用的广泛性无可置疑,而图片、音频、视频的应用则相对较少。然而,每个律所不仅是法律服务的提供者,也是一个运营实体,需要进行品牌推广、制作图片音视频文案等相关工作。因此,在这些领域中,加强对多模态大模型的应用显得尤为重要。
PART.11
开发“智能数字员工”-AI agent
随着AIGC对于人工智能技术的突破,能够替代人类自动进行智力劳动的“智能数字员工”AI agent日渐可行。AI agent将基于大语言模型(LLM),自动进行任务分解规划并自动完成任务,实现对于人类的工作任务的替代(agent)。AI agent与传统的实现流程自动化的软件机器人、虚拟人不同,其是依据AIGC技术达到对于需求的理解、规划以及任务实施。通过开发AI agent,可以将工作中流程、事务性任务交给agent,而将需要人类特质能完成的任务留给人类律师,包括建立客户关系,深入理解客户的特殊需求,综合情势做出判断以及创新型任务。
设定AI agent员工的岗位和能力需求
法律服务企业根据自身的业务流程、岗位设置,选择需要AI agent的岗位,并设定数字员工的能力需求。例如,可以开发客服AI agent,完成客户的常见询问;可以开发文秘书类AI agent,进行案件流程管理等;可以为律师或者专利代理人开发AI agent助手,协助完成包括信函起草、账单开具、法律查询等工作;也可以考虑开发用于品牌推广的文案类、音视频等的AI agent。
探索对AI agent员工的管理模式
由于AI agent的加入,人类员工与智能数字员工的职能如何分配,如何发挥协同作用将是首要问题;而在未来对智能数字员工如何进行有效管理可能将成为最受关注的问题,包括对使用中不可预知的问题和风险如何及时发现和应对等等。
PART.12
服务项目创新和流程优化
随着AI工具、私有化大模型、智能数字员工的引入,法律企业传统的服务项目在操作流程、技术要求方面必然会发生变化,而且很可能会有一些的新的服务项目产生。
服务项目创新
在私有大模型的加持下,法律服务机构未来的服务项目会包括直接利用自有的大模型作为向客户提供服务,不同服务机构的竞争可能主要区分在其大模型的准确性和效率方面,尤其是在一些个性化要求较低的法律服务中。针对复杂的法律服务项目中,法律服务机构彼此之间的竞争在高价值内容提供和低价值工作成本的剥离,如何应用人工智能辅助工作将律师从低价值工作中剥离出来集中高价值方面的工作,提高质量并降低成本,可能是法律服务机构竞争焦点。法律服务机构应用AI工具提供更好的成果输出展示也是可能创新项目之一,例如利用AI工具形成可读性更强的图表、音视频给客户等。
服务流程优化
法律服务机构的服务流程创新主要体现在任务自动化、沟通与协作、质量控制和效率评估等多方面。任务自动化主要体现在许多重复性和标准化的任务,如合同审核、信函起草、文件翻译信函翻译、数据整理,都可以通过AI自动化技术来完成,此外法律文档(警告函、起诉书、合同、专利领域的申请文件等)、法律或技术研究报告(法律进展报告、科技文献综述报告)的初稿也可以通过AI自动化技术生成。沟通与协作主要体现在与AI Agent或者AI平台与客户沟通实现信息及时响应和信息同步,以及内部AI Agent与人类员工的协作。质量控制和效率评估体现在通过AI进行数据评估来评估作业进度和质量,比较实际表现与预期目标,并分析效率和生产力问题。
PART.13
人员团队组织和能力建设
人工智能时代,法律服务企业需要不断加强人员团队组织和能力建设,不仅要提高团队人员的AI意识,而且要综合提高其专业知识素养和AI技术应用能力。
团队人员要具备对AI及相关技术的基本理解和应用能力,如ChatGPT、Gemini、Claude 等的使用,探索AI在企业各经营环节的应用方式,主动将AI工具有效整合到工作实践中。团队人员需要有终身学习能力,AI技术日新月异,需要能够不断跟进,熟悉最新技术发展和应用。同时,能够甄别AI系统提供的成果的真实可靠性、逻辑符合性,并能够在此基础上进一步进行分析和解读,提取有价值的专业角度的洞察和策略。随着AI技术在法律实践中的应用,需要人类员工具备更强的伦理和法律责任意识,准确辨析、判断哪些工作可以借助AI系统完成,AI系统提供的哪些成果会存在伦理和法律问题。
岗位设计方面,企业需要突破传统模式,增设如法律知识工程师、提示工程师等负责数据和大模型训练的岗位,负责AI工具使用的推广和私有化大模型的建设,并全面跟进律师、咨询师、流程人员的日常业务,以便根据AI工具的使用提出服务模式、内容、流程的创新优化建议。
AIGC下法律服务企业的风险管理篇
企业在拥抱人工智能技术的同时,需要加强对人工智能所伴生的相关风险的管理。从法律服务企业的视角来看,主要包括以下几种风险:
PART.14
有害输出风险
当前人工智能系统所使用的大型语言模型并不能像人类一样理解词语和语言,而是基于海量数据的训练,进而发现人们常用的语言模式,预测下一个最有可能的词语。从本质上讲这不是对词语的理解,而是对词语排列组合方式或习惯的了解。因此,一旦训练数据出现偏差,那么极有可能产生放大偏见的结果。在企业使用非私有化模型时,如果模型训练数据集不透明,那么出现有害输出的风险将大大提高。
PART.15
数据安全风险
在使用商业AI工具和非私有化模型时,任何输入到模型中的信息都可能会被存储下来或通过互联网传播,这就意味着企业的敏感数据、保密信息可能泄露给竞争对手,甚至被恶意行为者获取。泄露的信息还可能被用于训练新版本的模型,这相当于企业辛苦积累的知识、诀窍成为了他人可以免费获取的经验。同时,将信息在企业的管控范围以外使用,也不符合客户、政府等第三方的数据合规要求。即便在使用私有大模型时,也需要加强对于该私有大模型的管理,避免数据泄露风险。
PART.16
法律伦理风险
在当前的技术条件下,大型语言模型尚且不具备理解本质意义,进而发现真理、追求正义的能力,其输出的成果有可能不真实,甚至存在歧视、辱骂性和无意义的内容。如果法律服务过于依赖人工智能,或者不能对其输出的成果进行有效的甄别、提炼和升华,将偏离提供法律服务的初衷,甚至做出违背公平正义的法律意见或咨询建议。因此,需要法律服务企业加强对使用AI工具的服务项目、业务模式的法律、道德、伦理的审视和管理。
未来展望
随着人工智能技术、产品和商业化应用的飞速发展,其在法律行业的深度应用和嵌入已是大势所趋、作为法律服务机构和从业人员,必须顺应行业和技术发展趋势,采取积极的措施,只有成功应对人工智能时代带来的挑战,才能捕捉到人工智能技术带来的机遇,享受到新一轮发展周期所带来的红利。
法律服务企业是应对的主体。意识层面上,要勇于改变法律行业传统的工作和经营模式,肯于在人工智能应用方面投入精力、财力。实践层面上,要通过制定战略,整体规划应对策略和具体措施,不断提升自身人工智能利用和管理水平的基础上,寻找利用人工智能技术为企业带来收益的商业机会。对内,通过AI工具的利用提高工作效率,通过AI agent员工的开发降低人力成本;对外,通过业务模式、商业模式的创新,开拓新的服务领域和项目。
法律服务从业人员是一切应对措施的制定者、执行者。无论在行业中从事着哪类工作、扮演着哪个角色都应当通过持续学习,拓展自己知识和能力边界,改变“法律专业以抗拒创新闻名”的历史,积极应用人工智能工具提升工作效率和质量,积极适应人工智能时代新的工作模式,挖掘并不断提高在人工智能时代下的自身价值。
end
(本文仅代表作者观点,不代表知产力立场)