专利英文检索技巧,纯干货!
原标题:纯干货!专利英文检索技巧
专利英文检索是很多从业者检索能力薄弱的一个环节,相信一定会有一部分人对专利英文检索存在一些困惑,在表达英文关键词时总是让人感觉很混乱。本文笔者就将结合自己的专利英文检索经验,针对一些问题介绍一些检索小技巧。
目录
1、前言
2、技巧1:全面拓展英文关键词
3、技巧2:英文单词诸多变形的表达
4、技巧3:英文词组双引号“”遇到通配符(*?$)的表达
5、技巧4:英文词组中间有字符“-”的表达
6、技巧5:英文词组的全部组合方式的表达
1、前言
专利英文检索是很多从业者检索能力薄弱的一个环节,相信一定会有一部分人对专利英文检索存在一些困惑,在表达英文关键词时总是让人感觉很混乱,例如,有什么好用的翻译软件可以帮助更全面拓展英文关键词?如何用一两个形式全面表达英文单词的诸多词形变换?当双引号“”遇到通配符(*?$)时怎么办?当英文词组中可能有“-”的时候怎么办?如何用几个简单的表达方式涵盖英文词组所有组合的可能性?
今天,笔者就将结合自己的专利英文检索经验,针对一些问题介绍一些检索小技巧,希望能够对大家有所帮助。
2、技巧1:全面拓展英文关键词
在进行英文关键词拓展时,我们以关键词“电阻”为例,通常会用中文在数据库里面检索,然后看看数据库中的英文是如何表达该关键词的,像下图这样。
这样做在一定程度上有助于收集表达电阻的多个英文表达,但是会增加人工的阅读量,需要阅读很多专利才能收集到较多的“电阻”的英文表达方式。那么如何提高效率,如何更有助于全面拓展英文关键词呢?这里笔者推荐一个小工具:一本词典(http://www.onedict.com/),笔者在此前发表的文章中已经介绍过(新创性检索——基本策略指引)。该工具基本界面如下。
该工具的特点在于其翻译均是来自于专利文献、学术论文、科技材料等,且绝大多数是对专利文献中的英文表达方式的统计,因此准确性相对较高,且该工具会对翻译结果进行数据统计排名,有助于用户选择相关性高的英文表达方式,此外还会提供中文相关联的关键词,具体如下图所示。
3、技巧2:英文单词诸多变形的表达
英文单词与中文最大的不同就是词形变换,下面就介绍几种常见的英文单词的表达方法:
◆几种常见的单复数的表达形式
①加s的情形:在Incopat数据库中,可以用car$一个表达代替car与cars。
释义:$代表零个或者一个字符。
②加es的情形:在Incopat数据库中,可以用bus$$一个表达代替bus与buses,但这也可能带来一定的噪音,例如该表达涵盖了busy,那么为了去掉这个噪音,可以进一步改进为bus$$ not bus?,不过如果这样表达不如干脆直接就用bus or buses。
释义:?代表一个字符。
③变y为i加es的情形:在Incopat数据库中,可以用cand$$$一个表达代替candy与candies,但这也可能带来一定的噪音,去噪方法可以同样参照上文。
④变f或fe为ves的情形,在Incopat数据库中,可以用kin?e$一个表达代替kinfe与kinves。
◆同一个单词的不同拼写
例如color和colour都是颜色的意思,在Incopat数据库中可以用colo$r来同时表达上述两个词。
◆时态、词根、词缀变化
时态,词根,词缀的变化通常使用*即可,在Incopat数据库和智慧芽数据库均适用。*的使用相对简单,本文不再赘述。
划重点了,下文内容将是本文的重点。
4、技巧3:英文词组双引号“”遇到通配符(*?$)的表达
专利英文检索的时候,可能会遇到需要用双引号“”表达一个词组的时候,例如“cross link”,但是可能还有“cross linking”、“cross linked”、“cross linkable”等,按照通常思路,一般我们会想到用“cross link*”表示全部情况,但是目前常用的数据库通常都不支持引号""和通配符(*?$)的同时使用,那面对这种情况我们怎么办?有一种常规解决办法:我们可以把cross与link的所有组合形式全列出来,像这样“cross link” or “cross linking” or “cross linked” or “cross linkable”。这时候灵魂拷问一下自己:
全了吗?
不知道?
不确定?
应该全了吧?
哎呀,算了,时间有限~
就想到这么多种表达形式,那就这样吧~
这样检索出来的结果全面吗?(做海外FTO靠谱吗)?
其实上面的罗列是不全的,笔者英文水平也比较一般,但是笔者知道至少还有一些形式“cross links” or “cross linker” or “cross linkers” or “cross linkability”,那会不会还有“cross linkabilities”?
艾玛,想到这里,不禁吓出一身冷汗,只想静静~~~
即使真的能够把所有的可能性都罗列出来,这也会带来一个问题,那就是我们要面对一个复杂的基本检索要素表,后面还要面对冗长的检索式,带来的检索感受可能也不太好~~~
那现在怎么办?笔者总结了一种简单的表达方式,具体如下:
◆智慧芽数据库中的表达方式:
(cross $PRE0 link*)
释义:$PREn两个限定位置顺序的关键词之间间隔不超过n个单词;
如果cross和link是没有位置关系的,那么可以用下面的表达方式:
(cross $W0 link*)
释义:两个无位置顺序的关键词之间间隔不超过n个单词或n个中文字;
◆ Incopat数据库中的表达方式:
(cross (0w) link*)
释义:w检索的每个单词均已指定顺序。如果前加数字,则代表在两个关键词之间插入0~n个单词;
如果cross和link是没有位置关系的,那么可以用下面的表达方式:
(cross (0n) link*)
释义:n检索包含指定检索词且词序任意的记录。如果前加数字则代表两个关键词之间插入0~n个单词。
5、技巧4:英文词组中间有字符“-”的表达
英文词组的表达在英文中经常可能带有“-”符号,例如cross-link、cross-linking、cross-linked、cross-linkable等,此时应该如何表达?
◆智慧芽数据库中的表达方式:
字符“-”位于单词之间的时,智慧芽是将其作为正常的字符解释的,因此上述情况在智慧芽中可以用cross-link*全部表达
◆ Incopat数据库中的表达方式:
字符“-”位于单词之间的时,系统会将其处理为空格,即cross-link等同于“cross link”,因此上述情况在Incopat中可以用(cross (0w) link*)全部表达。
6、技巧5:英文词组的全部组合方式的表达
英文词组有多少种可能的组合方式呢?想必很多人在检索的时候也都会被各种组合方式所折磨吧,还是以“cross link”为例,在专利文献中的词组组合方式应该主要有三种:“cross link”、cross-link、crosslink,再加上各种时态、词根、词缀的变化,组合方式就更多了,前文第4节就列举了9种变化,如果再乘以3,那就是27种变化,而且还不一定能够穷尽,显然我们不能把这27种情形全部列到检索要素表中,综合前文的表达方式,现给出较为理想的英文词组的全部组合方式的表达方式
◆智慧芽数据库中的表达方式:
(cross $PRE0 link*) or cross-link* or crosslink*
◆ Incopat数据库中的表达方式:
(cross (0w) link*) or crosslink*
上述的表达方式相对就比较简洁了,两三种表达方式就能够涵盖众多英文词组组合的可能性,检索更加全面,检索效率也更高。
以上是笔者个人在专利英文检索过程中总结的一些经验,如果有错误或不当之处,请及时联系笔者修改或删除,欢迎业内同仁探讨、交流、指正。