青岛月嫂培训联盟

北京中心patentics系列培训讲座124-方蕾老师第3讲

2023-05-10 14:56:27

利用Patentics客户端对专利分析文献进行去噪(一)

领域:H02J


关键词:专利分析 去噪 Patentics客户端

方蕾

审协北京中心电学部电力领域审查员,承担发明专利实审审查、兼职复审、PCT检索及质量评价等工作;多次承担大型专利分析项目,具有丰富的专利分析经验和检索经验,擅长Patentics快速检索、检索策略调整、客户端运用等,近年来发表专利分析以及检索类论文5篇。

                      

点击上面小程序卡片进入小程序可获取小程序开放全功能(3级检索命令)

权限至20180820 23:59:59 


大家七夕节快乐,我是北京中心电学部方蕾。

今天为大家介绍是“基于Patentics的专利分析多维度碎片去噪”,是应用在专利分析过程中,利用Patentics客户端、对检索的专利文献进行去噪的方法,以达到对分析对象进行清洗的作用,目的是为了获得一个全面、准确的分析对象。


 一、问题的提出

专利分析过程中,首先要进行检索,检索的过程中,针对分析的对象,希望获得该领域的全部专利文献。比如,如果我们要对“电动汽车无线充电”技术进行专利分析,我们首先要检索到该技术分支的全部专利文献,再进行后续的统计、分析。可见,检索的质量决定了专利分析的准确性和可靠性。


通常对检索的要求是即“查全”、又“查准”。以这幅图为例,大圆代表期望获得的目标专利,我们检索的目标是尽量接近这个大圆。


我们知道,目标文献可能包括各种关键词、分布在各个分类号下。怎样把相关文献捞出来?传统的检索方式,是在S系统中,通过关键词、分类号的与或关系来设计相应的检索式。可以通过“A1 or A2or A3”的形式构造检索式,必要的时候通过“not”去除噪声N1、或逐篇浏览去除噪声。


就像示意图演示的一样,构造全面、准确的检索式几乎是不可能的;去噪又会造成误伤。同时,这个过程耗费大量的时间成本。但最终结果,却很可能与目标合集相去甚远。


二、Patentics多维度碎片去噪原理

因此,本次提出一种新的检索去噪方式,简单说,就是“全面检索+碎片去噪”。尽量做到全面检索,之后,将文献切割成多个单元(碎片),每个碎片由适量的专利构成(如几十篇),通过某种聚类功能,“噪声”聚类形成一些碎片,“目标”聚类形成另外一些碎片,批量去除“噪声”碎片。这样能最大限度的兼顾查全、查准。


这样相对于逐篇浏览去噪而言速度更快,而且相对于构建检索式切割噪声更精准。但如何打碎专利合集?如何使得相似专利聚类呢?


这样相对于逐篇浏览去噪而言速度更快,而且相对于构建检索式切割噪声更精准。但如何打碎专利合集?如何使得相似专利聚类呢?


Patentics客户端的分组功能给出了上述两个问题的答案。Patentics对检索结果按照申请人、申请日、分类号、技术内容等指标进行分组,这就是“碎片化”过程。同时,碎片化的条件就是对检索结果根据设定条件进行聚类,因此,得到的碎片具有着相似的属性。


理想情况下,“噪声”聚类形成一些碎片,“目标”聚类形成另外一些碎片,这样的去噪过程简单明了,去除噪声即获得目标。


然而,实际去噪过程中,通过单一指标对检索结果进行分组得到多个碎片,会将“目标”和“噪声”分在一个碎片。


因此提出了“多维度碎片去噪”,以多维度对检索结果多次分组,以不同形式打破碎片,每个维度中仅滤除确定的噪声碎片,对于目标、噪声在一起的混合碎片不去除,但通过不同维度的分组方式,这种噪声将在其他维度中落入噪声碎片,最终以碎片形式被滤除。形成多指标筛选、分层提取的高效去噪方式。


三、Patentics多维度碎片去噪流程

a.全面检索得到原始合集A0并导入Patentics客户端,其中对A0具有两点要求:1、覆盖目标专利合集A;2、尽量避免引入过多噪声。也即,希望A0尽可能全面,并引入尽量少的噪声,前者影响准确性、后者影响效率。


b. 将原始合集A0导入Patentics客户端中,对原始合集A0进行N个维度的分组,基于条件1~N将原始合集A0打碎:指标条件可以是技术分类、申请人、申请日、分类号、国别、优先权国家等。


c. 由1至N逐层分块去噪

以4维为例:分别进行申请人-申请日-分类号-技术分组

第1维,申请人去噪,将“纯噪声”子集标记为“1”(利用等级标记功能)。

第2维,按申请日去噪,可以将技术起源年之前文献滤除,将“纯噪声”子集标记为“2”,部分标记会覆盖“1”.由于Patentics的标引为全局标引,在后级维度去噪过程中,依然可以清楚看见前级标记。

第3维,按分类号去噪,将“纯噪声”子集标记为“3”。

第4维,按照64个技术分支去噪,将“纯噪声”子集标记为“4” ,部分标记会覆盖“1”“2”“3”。


这样,4维标引之后,对所有文献进行等级分组,没有等级的文献相当于我们期望的“目标”,被标记过等级的相当于“噪声”,可以被滤除。


这一讲主要讲了为什么使用Patentics客户端进行文献去噪,以及Patentics客户端利用分组功能对文献进行碎片化处理、和利用该功能进行去噪的原理,并简单讲解了去噪的流程。下一讲会以一个实际的案例,为大家演示这个流程。



 


-END-

推荐阅读

北京中心patentics系列培训讲座120-凌辉老师第2

北京中心patentics系列培训讲座119-凌辉老师第1讲

北京中心patentics系列培训讲座118-谢文静老师第4讲

北京中心patentics系列培训讲座117-杨盈霄老师第2讲

北京中心Patentics系列培训讲座116-谢文静老师第3讲

北京中心Patentics系列培训讲座115-彭芳芳老师第1讲

北京中心Patentics系列培训讲座114-方蕾老师第2讲

北京中心patentics系列培训讲座113-李安老师第3讲

北京中心patentics系列培训讲座112-徐金环老师第3讲

北京中心patentics系列培训讲座111-徐金环老师第2讲

北京中心Patentics系列培训讲座110-庞尧老师第1讲

北京中心Patentics系列培训讲座109-李安老师第2讲

北京中心Patentics系列培训讲座108-李安老师第1讲


长按二维码关注公众号

微群管理员patentics-concept

有意入patentics检索、分析技术讨论群者,请加管理员微信,拉您进群


 


欢 迎 点 赞 + 转 发


 Patentics微信订阅号:Patentics public

加入我们,获取更多专利检索、分析、运营攻略...



友情链接

Copyright © 2023 All Rights Reserved 版权所有 青岛月嫂培训联盟