« カバー率と効率の関係…調査の「辞め時」という愚 | トップページ | 検索式コンテスト »

2018年12月29日 (土)

カバー率とコスト

工学の観点で精度という考え方があります。例えばフォーナインと言えば0.9999のことであり10000個のうち不良品が1個(以下)という精度を意味します。ナインの数を増やそうとすればするほどもちろんコストが増加します。例えば精度90%を達成するために必要なコストと比較すると、精度90%を99%に向上するためには同程度のコストが必要になり、さらに99%を99.9%に向上するためには同程度のコストが必要~というのは通常よくあることです。精度をより向上させる事によって実際の精度の増加の絶対値は小さくなっていきますが、かかるコストが小さくて済むわけではありません。

特許調査もまさに同じことが言えます。もちろんカバー率を上げようとすると領域が大きくなる=ヒット件数が増大します。しかし前回書いたようにカバー率を犠牲にして「密度の濃い」効率的な領域で調査をした後の残りの部分は存在確率の低い領域なので、たとえ残部を継続して調査しても増大した件数程にカバー率の絶対値は向上してくれません。カバー率に対する必要なヒット件数は等比級数的と言えるでしょう。

僕の感覚ですが、日本の特許資料を対象にしてある単一のテーマに該当する資料を抽出するという場合、ヒット件数3桁もスクリーニングすれば8~9割のカバー率に達することは可能です。しかし件数4桁の調査でもカバー率は良くて99%程度に達する程度と思います。それが5桁になったからと言って目的の資料を完全にカバーすることを期待するのは無理でしょう。調査件数が一桁増えるという事はコストが一桁増えることに他ならず、カバー率を少し上げようとしただけで驚くほどコストが増大します。だからこそ特許調査は目的に応じてカバー率とコストの兼ね合いを見計らう事がとても大切だと思います。

« カバー率と効率の関係…調査の「辞め時」という愚 | トップページ | 検索式コンテスト »

コメント

コメントを書く

(ウェブ上には掲載しません)

« カバー率と効率の関係…調査の「辞め時」という愚 | トップページ | 検索式コンテスト »