ご挨拶

このブログは特許調査歴約20年の筆者が日ごろ特許調査について考えている事、特に世間で意識されてない、もしくは誤解されている事や他人とは異なる意見を少しずつ書き綴っていきます。

なお、ここでいう調査とは、市場調査(market research)等の用法、つまり現況の解析というよりは、通常の特許調査とか先行例調査とかの使い方で意味する「資料の探索」と定義しています。

twitterになれたせいかあまり長い文章は書けなくなってきているので気長に見守っていただければ幸いです。

2022年5月16日 (月)

いささか時機を逸した書評

特許を含めた知的財産について世間一般の人に説明しようとするのはとても難しい、というのはこのblogを読んでいる方も共感していただけるのではないでしょうか。なんといっても知財制度は複雑で例外も多く、そもそも法律用語が難しく定義も厳密なので、一度聞いて理解できるようなわかりやすい文章にすることが困難なのです。入門書のような易しい本であっても、文体は平明でも説明は一筋縄ではいかない回りくどい文章になってしまうケースはよく見受けられます。知財を学ぶ意志がある人に対する入門本であってすら難しいのに、知財に興味のない人にわかってもらえる「簡単な表現」を作り出すのは至難の業でしょう。

今年初めに刊行された南原詠著「特許やぶりの女王 弁理士・大鳳未来」を読んで強く感じたのが、まさにこのことでした。予想外の特許係争が降りかかった知財素人な被害者に、名うての弁理士が特許の在り様について簡単な言葉でズバッと言い切って説明する。これは特許係争を題材としたリーガルミステリーだからこそのシチュエーションであり、極めて単純な言い方をする必要性があるわけで理に適ってます。ありがちな入門書の取ってつけたような説明口調とは違う明快さでわざとらしくなく説得力もあります。これは知財を説明するうまいやり方だなと感心しました。

さらにこの本は知財業務の説明という面でも他書にない特徴があります。類書における知財のもめごとといえば「特許が無くて勝手に使われた」とか「提訴を技術的に上手く切り抜けた」という事が多く、お互いの特許権を武器に切った張ったを繰り広げるというのはあまり見たことがありません。企業知財部所属の弁理士でもある著者が実際に見聞きしてきた事を基に書かれているのでしょうか、臨場感があります。たしかにこの本の様な極端な事件は稀でしょうし出てくる人物像もかなり突飛ですが、話にリアリティがあるのはの筆力のなせる技でしょう。知財係争を紹介する本としても価値があります。
あと個人的な話ですが、本の中に無効資料を探す調査屋が出てくるところも特許調査を業とする当blog筆者としては評価したい部分です。世間の人に対して出願前調査や侵害調査を説明するのはそれほど難しくないのですが、無効資料調査を説明してもなかなかわかってもらいにくい事が多かったもので…

というわけでこの本は、リーガルミステリーという以上に、特許に対するとっかかりの本としてなかなかの良書だと思います。
ところでこの著者は次回作をどうするのでしょうか。「知財の本」が書きたかったわけではないとすると、この路線つまりミステリーなのでしょうか。特許で違う題材も難しそうなので商標や著作権?気になるところです。

なお当blog筆者は普段ミステリーはおろか小説というものをほとんど読まないので、ミステリーとしてのこの作品を評する能力は全くありませんのでその点ご容赦ください。

2022年3月23日 (水)

分類とキーワードの組合せ 実際のやり方

一連の記事で書いた分類とキーワードの組合せの話の続きです。

複数の概念双方に対応する集合を策定する時、検索で積演算を行うとどのような事が考えられるかをこれまでの記事で書いてきました。では実際には分類とキーワードを組合せてどのような検索を行うのがよいのでしょうか。
これには正解があるわけではなく、筆者は状況に応じて使い分けをしています。キーワード検索その13と同様に、概念nに関する分類をCn、概念nに関するキーワードをKnとして、概念1×概念2を検索しようとする場合、主に以下の3種のパターンが考えられます。

① C
1×K2+C2×K1

前回の記事でも書いた通り、分類で技術分野を設定し、キーワードで抽出すべき特徴点を限定する「分類×キーワード」という積演算が検索の基本形と考えられます。したがって概念1に関する分類C
1の母集団に対してキーワードK2で限定、同様にC2に対してK1で限定し、それらの和集合を調査対象とするのが通常のやり方と言えます。ただしこの場合、選抜した分類が付与されていない公報はヒットしないため、確実に分類が選択されていると確信できない場合は何らかの手立てが必要になります。

② C
1×K2+C2×K1 + 『K1×K2

想定した分類以外の分類が付与された公報まで調査対象を広げるためにはキーワード検索が必要です。そこで分類を基本とした検索とは別にキーワード同士の積演算による集合を加えることで分類ではカバーしきれない集合をカバーします。これによって①における漏れの不安が減少します。このやり方は例えば「半導体製造工程における排気処理」のような特許分類を飛び越えた分野横断的な技術で特に力を発揮します。
なお『K
1×K2』の部分だけ独立して立式しているので、前半部分で用いたK1,K2と異なる限定をすることが可能です。例えば
・K
1'×K2':この部分だけ検索範囲を全文から要約/請求の範囲等に限定する。
・C
0×K1×K2:C1,C2より上位の大まかな分類、例えばIPCサブクラス(例:"F01D"=前4文字分)で限定する。
等を行えば、キーワード同士の積演算による限定の不十分さを補う事ができます。見た目はその13で式Bとして挙げた(C
1+K1)×(C2+K2)からC1×C2を除いた形ですが、『K1×K2』に限定を加えることで母集団をより適正化する事が可能です。

③ (C
1+K1)×(C2+K2) [=C1×C2+C1×K2+C2×K1+K1×K2]

なお上の式、つまりその13の式Bのように分類とキーワードをひとまとめにして積演算を行うやり方も用いる事があります。それは「C
1×C2」分類同士の積演算に意義がある場合です。実はIPCおよびFIには複数の観点から分類付与を行い相補する分類群が一部あります。例えばB29K「サブクラスB29B,B29CまたはB29Dに関連する成形材料、あるいは補強材、充填材、予備成形部品用の材料についてのインデキシング系列」は、B29B~B29Dがプラスチックの加工方法に関する分類であるのに対して用いる材料別の分類になっています。特定の樹脂に限定されるある加工方法に関する公報はB29B~B29DとB29Kがそれぞれ付与されるため、お互いの分類の積集合として存在することになります。それ故③の式が意味ある検索になるのです。他にも医薬分野ではA61K「医薬用,歯科用又は化粧用製剤」に対してA61P「化合物または医薬製剤の特殊な治療活性」が付与されるのがほぼ必須です。このような元々分類の積が前提となっている分野では③のやり方が有効です。なお前にも書いてますがこの場合は「K1×K2」キーワードの積に留意が必要です。

当然ながら検索式に唯一の正解と言えるものが存在するわけではありません。技術分野や特徴点、用いる分類やキーワードに応じて最適な式をその都度探すしかないと思います。

2022年2月 5日 (土)

分類とキーワードの関係

前記事までに書いた分類検索とキーワード検索の組合せに関して、そもそも分類とキーワードがどのように関わるのかおさらいします。

実際の調査ではまず検出しようとする資料の技術分野、構成要素、特徴等に基づき該当する特許分類とキーワードを選抜します。この時、技術分野/構成要素/特徴等を模式的に演算子を用いて「概念的検索式」を作成し、それらに対して分類やキーワードを当てはめます。しかしこれらの概念がそっくりそのまま分類やキーワードに該当するわけではなく、概念的検索式がそのまま実際の検索式にはなりません。実際には分類/キーワードに置き換えやすい概念、対応しにくい概念があります。

これらの関係を模式化したのが以下の図です。図は点線→線→太線になるに従って結びつきが強くなります。

Photo_20220205093901

このblogでも何回か書きましたがキーワードで技術分野を限定するのは難しく、技術分野を選定するのには分類検索の方が有効でしょう。それに対して特徴点までが分類化されているケースはかなり少ないでしょう。それ以上に特徴点を選抜する時こそキーワード検索が効果的と言えます。

したがって分類で技術分野を設定し、キーワードで抽出すべき特徴点を限定するのが特許調査における検索の基本形と考えられます。構成要素に対しては、分類で規定されている場合はその分類を用い、規定されていない場合は分類で分野を、キーワードで具体的な要素を限定すると良いでしょう。

なおFタームは単純に分類と言いにくい側面もありますので今回の記事では言及を避けます。Fタームについてはいずれまとめて記事化したいと思います。

2022年1月28日 (金)

キーワード検索その13の補足

前記事における式A/式Bの項目のいくつかについて説明を補足します。

まず式A、こちらは「使わない方が良い」式ではありますが、その中のC
1×K1に着目します。この項目は概念1に関する分類検索と概念1に関するキーワード検索の積集合なので、分類C1が付与されかつキーワードK1が文中に存在します。逆に言うと分類C1が付与されていてもキーワードK1が文中に存在しない資料は調査範囲外になるということです。もし概念1を<必ず>K1で表すという確証があれば問題はないのですが、用いた用語以外の記載がありうる場合は漏れの原因になるので、このような項目は避けた方が良いです。
それに対してC
1が概念1を包括する上位概念の分類の場合、キーワードK1でより概念1に限定した絞り込みを行うなら有効な項目です。
前記事の例ではありませんでしたが、例えば複雑な検索式によってC
1×K1×K2のような項目が含まれていた場合、この積演算が本当に意味があるかどうか判断する必要があります。

次に式Bを再度以下に示します。
式B:(C
1+K1)×(C2+K2) [ =C1×C2+C1×K2+C2×K1+K1×K2]

その内「K
1×K2」は前記事でも書いた通り双方のキーワードを共に有する資料であって、技術分野や構成要素を限定してはいません。そこでキーワード検索の対象範囲を「全文」から「要約」「請求の範囲」等に限定することで集合をより絞り込むことは可能です。ただし検索範囲が限定されるだけであってキーワードの有無による検索という本質が変わるわけではありません。また特許性の調査など、調査目的によっては漏れの原因になる事もあるので注意する必要があるでしょう(キーワード検索その5その6を参照)。

式Bの「C
1×C2」は双方の分類のいずれも付与された資料を意味します。以前の記事ですが分類同士の積集合は原則として行わないという話を<分類ばなし6>で書きました。
この式Bの項目内容をよく見ると、概念1×概念2に該当するの資料の中でC
1×C2のみでヒットし他の項目ではヒットしない資料は、K1とK2のどちらのキーワードも含まれていない事になりますが、そのような資料はあっても極少数でしょう。所望の資料はおそらくC1×K2またはK1×C2のどちらかでヒットしている可能性が高く、この項目が無くても漏れる可能性は低いと考えられます。基本的にはこの項目はなくても困らないのではと思います。

2022年1月25日 (火)

キーワード検索その13 分類との組合せ

ここまでキーワード検索の注意点についてblogを進めてきましたが、通常行う特許調査ではキーワード検索だけでは効果的または効率的な調査にならない事も多く、キーワード検索と分類検索を組み合わせるのが普通です。実際の調査ではまず検出しようとする資料の技術分野、構成要素、特徴等に基づき該当する特許分類とキーワードを選抜するのですが、大抵の場合は複数の分類やキーワードを用いることになります。この時、ただ単に選抜した複数の分類群を用いて検索した母集団と複数のキーワード群を用いて検索した母集団との積集合を調査対象としてしまいがちですが、そこに問題があります。

例として調査対象を分野/要素/特徴等について、ある二つの概念を有する資料として考えます。この時の概念的検索式は概念1×概念2になります。ここで概念nに関する分類をCn、概念nに関するキーワードをKnとすると、分類群での検索結果とキーワード群での検索結果の積演算は以下の式Aで表されます。

式A:(C
1+C2)×(K1+K2) [ =C1×K1+C1×K2+C2×K1+C2×K2]

ここで現れる「C1×K1」は、概念1に関する分類検索と概念1に関するキーワード検索の積集合であり、概念2についての限定はされていません。「C2×K2」も同様です。つまり分類群検索とキーワード群検索のそのままの積集合では「限定になっていない」集合が残ってしまい、概念1/概念 2共に限定された有効な母集団にならないわけです。これは良くない検索式と言えます。

そこで概念的検索式に沿って「概念1×概念2」を検索式化してみます。概念1に関する分類検索による母集団とキーワード検索の母集団の和集合、および概念2に関する分類/キーワード検索の和集合、この二つの積集合は以下の式Bで表されます。

式B:(C1+K1)×(C2+K2) [ =C1×C2+C1×K2+C2×K1+K1×K2]

このようにすれば全ての項目で概念1と概念2の両方についての限定が含まれており、限定されない項目はなくなります。ただしこの式でも問題がないわけではありません。それは「K1×K2」の項目で、この部分は概念1のキーワード検索と概念2のキーワード検索の積集合に該当します。つまり「指定の範囲にキーワード1とキーワード2が両方とも含まれた資料」なのですが、それはあくまでキーワードが含まれるという限定であって、キーワードで示される「技術分野」「構成要素」に関する資料に限定されるわけではありません。<キーワード検索その3>でも書きましたが、キーワードが分野を定義するわけではなく、文章中に双方のキーワードがあればすべて集合に含まれるため(註)、本来関連性の低いノイズも多数含まれる可能性があります。つまり「K1×K2」が含まれると無駄が多い検索式になりかねません。

以上を模式図で表すとこのようになります。(C
1×C2、K1×K2については次回詳細を追加します。)
Photo_20220125200201

このように複数のキーワードを複数の分類と組合せて検索する時、分類/キーワードの関係性を把握し、項目ごとの演算が意味のある限定になっているか、十分な限定になっているかを確認する事が検索式作成の上で重要です。

こんなわかりきったことでは間違えないよと思われるかもしれません。しかし上で挙げた例はわかりやすく説明するための極めて単純な場合です。実際の検索式においては、多数の分類やキーワードを複雑に組み合わせて検索を実行するため、検索式の一部に上記の「C
1×K1」「K1×K2」のような項目が気が付かないうちに紛れ込んでしまう可能性はあります。もし実施した検索式で母集団が予想外に大きくなったり、査読時に関連性の低い資料ばかり出てくる場合には、検索式を見直して「限定になっていない」「無駄が多い」演算が含まれていないかを確認した方が良いでしょう。

2022年1月23日 (日)

IPC目次【2022年更新】

IPCについて2022年の改訂がありましたので、国際特許分類(IPC)の2022年時点におけるメインクラス/サブクラスを目次形式(PDF)で列記しました。

メインクラス

サブクラス

 

ご参考までに。

 

2021年12月16日 (木)

素材の耐えられない重さ ~Supplement

当ブログは特許調査が主要テーマですので、前エントリー「素材の耐えられない重さ」で書いた特許調査の詳細について補足します。特に難しい事はしていませんが、細かいポイントがありますので…

今回の調査では海外調査ではCPC、国内調査ではFIを用いました。どちらもIPCを基礎に独自展開した分類であり、付与分類が遡及される、つまり現行のコードを用いればたとえそのコードが無い時代の公報でも基本的に検索が可能であるという利点があります。主に用いたコードはCPC、FIとも同じくG10D7/026およびG10D9/08です。

G10D 弦楽器;気鳴楽器;アコーディオンまたはコンセルティーナ;打楽器;エオリアンハープ;シンギングフレイム;他に分類されない楽器
 G10D7/00 気鳴楽器の全体構造
 G10D7/02 ・気流が傾斜したエッジにふきつけられる型式のもの
 G10D7/026 ・・管の円筒面上に配置された開口部に気流がふきつけられるもの,
           例.フルート,ピッコロまたは横笛
 G10D9/00 気鳴楽器の細部または付属品
 G10D9/08 ・気鳴楽器の製造のための材料;その材料の取扱い

なおこれらはIPCでは2020年1月発行分から新たに加わり、それに呼応してCPC/FIも変更されたコードであり、それ以前はその一つ上位の階層までしかありませんでした。まさに遡及効のおかげで調査しやすくなってました。

実際の調査ですが、まず1920~36年の欧米特許についてはEsp@cenetで上記CPCおよびその上位概念(/00まで)をチェックしました。昔の公報で見にくいしそもそも仏語や独語は読めないのですが、基本的にフルートの管の構造やキーメカニズムの図が掲載されていれば合金組成に関する特許じゃないだろうと推測できるので、スクリーニングはできない事はありません。

国内特許については商用データベース(収録:1971年以降)で当該FI全件に加え「FI=C22C:合金」×「全文=フルート」をチェックしました。実際に特公平3-19294「フルート用素材」のようにG10D~の分類が付与されてない公報もありました。

なお今回は海外特許調査は行ってません。というのは、実は日本は「世界のフルートの半分は日本で生産されている」と言われるくらいフルート大国であり、余程の事が無い限り日本で出願/権利化しなければ効果がないというのが実情なのです。もっともこれはちょっと前の話で現在でもそうかはわからないのですが… ついでに、上の言葉の続きは「その更に半分は埼玉で生産されている」だったりしますw

更に、昨年のAdvent Calenderエントリー記事は出願人名でサクッとヒットする案件だったので詳細は省略します。

2021年12月15日 (水)

素材の耐えられない重さ …素人笛吹きの回想その2

この記事は<知財系 もっと Advent Calendar 2021>に参加しています。昨年のエントリーは「ミのための実用新案」です。

現在通常使われているフルートである金属製ベーム式フルートでは、素材として洋銀(または洋白ともいう銅/亜鉛/ニッケル合金)、銀、金が主に用いられており、金は9K, 14K, 18K, 24K等含有率の異なる合金が用いられてます。音色については一般的に洋銀は軽やかな音、銀は渋めの音、金は輝かしい音といわれています。そして金属の特性故に洋銀→銀→金となるに従って楽器は重くなり値段も高くなります。そこでフルートの胴体やメカニズム等のみを部分的に、またはメッキ処理で高い(つまり重い)素材を用いて値段や重さの折り合いを付けた楽器も多くあります。しかしそれ以外の金属が使われるケースもあり、中にはプラチナ製フルートというのも存在します。

エドガー・ヴァレーズ(Edgar Varese, 1883-1965)が1936年に作曲した無伴奏フルートのための「Density 21.5」、この曲はあるフルート奏者が試作したプラチナ製フルートのための作品として依頼されました。密度というプラチナの物性値を曲名にする即物的な作曲家らしく、フルートの妙なる調べというよりもキーを叩く音や金切り後の様な高音、極端な強弱のニュアンスとよく言えばフルートの可能性を追求する、摩訶不思議な曲になっています(楽譜付き音源はこちら)。ただ現在でも加工処理が難しいと言われるプラチナ、当時の技術で奏者の思い通りのレスポンスが得られる機能的なフルートを作るのは至難の業…そのせいなのか超絶技巧を必要とする難易度の高いフレーズはあまりなく、楽譜上は平易に書かれています。実は御多分に漏れず筆者も高校の文化祭の発表会でこの曲を演奏しました。こういう変な曲を貴ぶ仲間達の受けはよかったのですが(苦笑)。

そこでこのプラチナ製フルートに特許があるかどうか調べてみましたが、見当たりませんでした。まぁこんな「金や銀じゃなくてプラチナにしました」という「銅鉄特許」がその当時に成立なんて事は無いだろうと想像していた通りなので、ここで対象をフルートの素材に関する特許へ方針転換しました。というのも金は柔らかいため金の含有率が高い合金ではフルートに必要な剛性を保つことができず、僕が現役でフルートを吹いていた20世紀後半は金製フルートといえば9Kや14Kでした。それが21世紀に入った前後から18Kや24Kの金製フルートが世に出始めてきており、そこに新しい技術の特許があってもおかしくなさそうなので探すことにしました。

内特許/実用を対象に「金属の組成比のみに特徴を有するフルート用合金」に関する資料を調べたところ27件ありました。そのうち主成分別では金:8、銀:8、プラチナ:4、その他:7、出願人別では以下の通りです(数字は出願数/公告・登録数)。

 田中貴金属工業(21/5)
 宮澤フルート製造( 2/0)
 徳力本店・ヤマハ( 2/0)
 三菱伸銅( 1/0)
 フルヤ金属(1/0)

なんとミヤザワやヤマハを除くとみな金属業者、大半の出願は田中貴金属でした…いみじくも特開昭56-146188(宮澤フルート製造)にこう書かれていました。「~貴金属業者によって既に中空管状に成型された金属を買い受けてこれを単にフルートに加工していたに過ぎない~」「~フルートの素材である金属自体をフルートメーカーか独自に研究の対象として取上げることはなく~」。フルート製造業者は所望の性状の合金を要望することはできても、合金自体を探索するのは難しいのでしょうか。

このなかで金合金に関する特許7件は全て田中貴金属出願でした。18K(18/24=75%)金製フルートに関しては、特開平05-033085では Au:70~80%/Ag:3~11%/Cu:9~25%/Zn(任意):0.1~1% の合金が請求されていますが権利化されていません。24Kについても、特開平07-152368(4族/希土類)、特開平07-230281(Ca/Si)が括弧内の他元素0.01~1%で残りAuという請求項ですが、実はAuをPtやAgにそっくりそのまま入れ替えた出願もあったりします。18Kや24Kのフルートが世に出てきた時期から考えると実際の技術が出てきたのがこの頃だというのはそうらしいのですが、田中貴金属にしてみればどうしても権利化するような話じゃないという事なのかもしれませんね。特許よりノウハウの世界なんでしょうか…

ところで通常のフルートは長さ約65cm、銀製だと重さは500g弱です。金やプラチナは密度が銀の倍くらいありますので24K製やプラチナ製では1kg近くになります。もちろん他の楽器に比べれば軽い方なのですが、フルートを体の右側に張り出すように略水平を保つ姿勢のため、重さ以上の辛さがあります。筆者も中学時代に買ったムラマツMR-120(頭部菅のみ銀/他は洋銀)から三響の総銀製ハンドメイドに替えた時(去年のエントリーにも書きましたね^^;)、特に最初は想像以上の違和感を感じました。プラチナ製なんてどれだけ肩がこるんだか?と思うとお金が有っても手は出さないよと虚勢をはってますw なおDensity 21.5は4分ほどの小品なので重さもなんとか我慢できるでしょうが…

2021年11月10日 (水)

キーワード検索その12 特許特有の語彙

特許資料は科学技術文献であると同時に、権利を開示した法的文書でもあるため、通常の科学技術文献とは異なる語法や用語が用いられることが多々あります。このような特許特有の用語が特許資料の読みにくさの原因になっているばかりではなく、特許調査を行う上での落とし穴になる可能性もあります。このような特許特有の語彙を踏まえた特許調査について考えます。

例えば請求の範囲では「~を特徴とする~」「~請求項1に記載の~」という表記が頻発します。よってキーワードとして「特徴」「記載」を用いて検索しても多くの文献がヒットしてしまい、技術内容から資料を精査しようとしてもうまくできません。また発明の効果を示すために具体的な例示に対してそれ以外の例を「比較例」として記載します。そのため「比較」というキーワードは、請求の範囲を対象として検索するのならともかく、全文を対象とすると効果的な絞り込みにはなりません。

ただし特許文献では、上に書いた様な特許特有の「文法」に関する単語だけではなく、科学技術用語であっても特許に特徴的な用語の使い方をすることがあります。

特許公報では、請求の範囲において具体的な名称ではなく機能で構成要素を限定して記載する事があります。「弾性部材」がその一例です。「弾性」自体は普通の科学用語ですが、特許では力が加わると元に戻ろうとするであればバネでもゴムでもパッキンでも構わない~という構成要素をまとめて「弾性部材」と記載して、権利範囲を不用意に狭めないためこういった用語を用いる事があります。これは一種の上位概念化ですが、より正確には概念の包括化と言うべきでしょう。このため請求の範囲ではあえて具体的な構成要素を記載しない可能性があります。従って権利性の調査で請求の範囲に限定して検索する時は、具体的な構成要素のみではなく「弾性部材」のような観念的用語を念頭に置く事が必須です。

それに対して公報中でも具体例を記載した箇所では、実際のバネなりゴムなり具体的な名称が書かれる事が普通です。なので特許性の調査のような基本的に全文を対象とする場合は具体的なキーワードの方が効率的と考えられます(キーワード検索その5を参照)。

また出願人によっては公報くらいでしか用いない、通常は見たこともないような用語で出願する事があるのでこれも注意が必要です。著名な例では、ある出願人はオートバイの事を常に「鞍乗り型車両」と記載しています。オートバイや自動二輪と記述することによってトライク(三輪車)や四輪バギーが除外される事を排除するための用語でしょうが、特許資料以外で見る事は滅多にありません。これも知らないと検索漏れの可能性が生じます。

結局のところ、特許文献においてある概念がどのような用語で記載されているかは、実際の資料を見てみないとわからない部分があると言えます。実際に調査している最中でも、必要と思われるが検索に含んでいなかった用語を見つけてしまう事はよくあります。この場合はキーワードを追加して再検索することになります。このような試行錯誤を繰り返して調査をより良きものにしてゆくのです。

よって特許調査の精度を上げるにはなるべく多くの、しかも様々な出願人による公報に目を通し、調査しようとしている分野でどのような用語が公報に使われているかを経験知として備えていく必要があります。筆者のようなオールド調査屋は昔「公報100万件めくって一人前」と言われましたが、これは大げさとしても調査経験を重ねて「調査のための語彙」を蓄積した事によって検索式の精度を上げられるのは確かだと思います。

2021年8月28日 (土)

キーワード検索その11 全文検索という落とし穴

現在の特許検索ツールはいわゆる全文テキスト検索が可能なものが一般的です。このテキスト検索では文章のテキストデータから指定した文字列の有無を判別しています。従って特許検索における全文テキスト検索では特許資料の「テキストデータ」全体が検索対象になります。公報中でもテキストデータではない数式、構造式、表、図等の画像データを検索する事はできません。つまり全文検索といっても公報に「書かれた」全ての文字が対象になっているわけではないのです。そのこと自体は理解している人も多いと思いますが、実際の特許調査において所望の資料を検出する事ができなくなる可能性も考えておく必要があります。


5866688

上は極めて特殊なケースですが、形状をハングルで説明しようとした文章に対して請求項全体を画像データで出願してしまった特許5866688の第一頁(部分)です。この公報では請求項のテキストデータが存在せず、請求項を対象としてキーワード検索をしても全くヒットしません。

このようなケースは極めて稀ですが、出願時に使用可能な文字で表現できない、または文字ではわかりにくい概念を画像データで代用するということは一般的で、その代表的な例が有機化合物の構造式です。例えば請求項に「~、イブプロフェン、~を含む」と書かずに「~、式(I)のプロピオン酸系化合物、~を含む」と書いて構造式を画像データで
 …(I) 
と別途記載しても請求する権利範囲は同じです。しかしながら「イブプロフェン」でキーワード検索しても構造式を画像データで表現した後者はヒットしません。化学系特許では物質名をキーワード検索しただけでは不十分で、分類も併用した検索が必須になる事の方が多いです。

以上の様なケースと違い、明確に文字で表現されているにもかかわらずテキストデータとして収録されていないものとして図や表があります。例えば種々の実施例や比較例を表に列記して比べた時に、物性値、組成物やその組成比が表には記載されていても、その出願の発明の特徴点に関わらないため本文中ではそれらの項目が記載されていないという事があります。その場合、探し出そうとしている文字列が公報中に明確に記載されているにも関わらず、テキストデータとして収録されていないためその文字列で検索してもヒットしない可能性がでてきます。つまり「全文テキスト検索」によって漏れが生じるわけです。特に特許性の調査の場合は公報全体が調査対象になるため、図や表「だけ」に対象の文字列が記載されている可能性を考慮する必要がでてきます。

このように特許調査におけるキーワード検索はテキストデータに基づくため「全ての」文字情報を検索できるわけではなく、状況に応じて「検索できない部分の漏れを諦める」か「キーワード検索として限定せず、規模が大きくノイズの多い調査として実施する」か取捨選択するしかありません。「全文検索」といっても完全ではない事にご留意ください。

註 イブプロフェンは示性式で”(CH3)2CHCH2-C6H4-C(CH3)COOH”とテキストデータとして記述することは可能である。ただし文字列「イブプロフェン」で検索できない事は構造式の場合と一緒である。

«キーワード検索その10 実例2