« 進歩性自動判定モデル(覚え書き) | トップページ | 弁理士数と出願件数(2016年) »

人工知能と特許調査(?)

このところ夜がめっぽう弱くなってしまい、色々と書きたいネタもあるんですが、いざ夜中に書こうとすると体力ゲージが見事に0になってしまい、毎日悔やみながら過ごしておりますweep(ちと大げさ)。

さて、本日は、最近話題の人工知能と特許調査についてのお話で。と言っても、結論は「なかなか難しいよね」というところで終わります。

最近流れてきた情報で、あるセミナーにおいて機械学習に必要な教師データの取得に関連して、

しかし、深層学習をビジネスで活用する場合には、教師データの収集は容易ではない。同氏は、こうした例として、特許事務所におけるサーチャー(特許検索者)のケースを紹介した。目的の特許案件にたどり着くための効率的な検索条件を深層学習で見いだす取り組みだ。

という紹介がなされたという記事を見ました。

特許調査自体のやり方は各種書籍になってますし、例えば工業所有権情報・研修館のホームページに各種研修資料が公開されてますから、上の記事で言っている教師データってのは一般的なやり方というよりも、特定の個人の検索スキルを提供してくれるサーチャーさんはなかなかいないよね、という話だと思っています。

で、特定条件における機械学習と特許調査の関係についてはこんな論文もあったりするんですが、汎用的な観点からざっくり考えてみようと思います。

以前もこのブログでご紹介したように、先行技術調査の流れは、調査対象の技術的理解→調査概念作成→検索式作成→検索→抽出公報検討→最終結論だと言われています(私もそうだと思っています)。

この中で、さっきの記事に書いたように、調査概念作成はAIが結構苦手とする分野だと思うので、機械学習でやるならば、発明者などが自然文で作成した検索条件(式でなくてもいいわけです)から検索式を作るやり方だと思います。つまり、世に言う概念検索を機械学習でできないか、ってことです。しかし、調査概念作成は苦手だって先ほどさらっと言ったように、自然文からその概念なり意味を解釈するという作業は、汎用的な機械学習手法があまり得られていない現時点の段階ではかなり難しい作業だと思っています。

むしろ自然文の意味解釈を行い、シソーラスによりテクニカルタームをある程度収束させあるいは拡張させ、これらテクニカルタームの係り受け関係を整理して、キーワード検索を行い、さらには、特許分類とテクニカルタームとの間の関係を整理し、テクニカルタームから逆引きのようにして特許分類を特定する作業を行い、これらから検索式を自動作成する作業のほうがまだ見通しが立つのではないかと思います。

なお、特許分類には適宜テクニカルタームがちりばめられているわけですが、特許分類は技術分野毎に分類手法がかなり異なる(例えば化学分野であれば物質名が主になりますが機械分野であればその機構の動作、作用が主になる)ため、まともにテクニカルタームから逆引きしても適切な特許分類に辿り着きません。特許分類自体は階層構造を持っていますから、この階層構造を維持しつつ特定の特許分類に適切なテクニカルターム(の組み合わせ)を割り当てる必要があります。とは言え、この作業そのものが膨大な作業になりますが。

整理すると、現時点で概念検索自体がまだまだ未成熟なものである以上、これを機械学習により行うことは相当な困難を伴うと思います。つまり、特定の技術分野において(しかもかなり狭い)数多くの機械学習を行い、検索式との関係を覚え込ませれば、上に書いた論文のように何かしらの結論が得られる可能性はありますが、汎用性の高い検索式作成作業を機械学習により行うのは、そもそも現状の機械学習がさほど汎用性が高いとは言えない(汎用性を高くするためには膨大なネットワークによる計算が必要であるし、機械学習の量も半端なくなる)以上、難しいと言えます。

次に、抽出公報の検討を機械学習で行えるかどうかについて考えてみます。ここで一番の問題となるのが、調査概念と抽出公報との技術的類似性についてです。調査概念というか技術的概念をかなり狭い範囲に絞り込み、抽出公報との技術的類似性について機械学習を行えばかなりいい結果が出ると思うのですが、やはりここでも汎用性の壁が立ちはだかります。つまり、調査概念毎に正解は全く違う(当たり前です)以上、調査概念毎に機械学習を行わないといい結果が出ませんから、やはり機械学習の量が半端ないことになります。

むしろ、技術的類似性はテクニカルタームの類似度であると割り切って(この割り切り自体は合理的だと思います)、テキストマイニング技術を用いて、上に書いた自然文に含まれるテクニカルタームと抽出公報内のテクニカルタームとの類似度を算出して抽出公報の検討を行うやり方のほうが見通しが立つと思います。この際、意味解釈的な考え方を導入するとよりよいと思いますが、とはいえ、意味解釈的な考え方についてもまだまだ試行錯誤しながらの状態だと思っています。

あとは、この間謎のメモ書きを残したブログ記事に書いた、進歩性の観点からどこまで迫れるかというアプローチもあると思います。

こうやって考えてみると、技術分野を相当絞ると機械学習による特許調査ができそうにも思いますが、汎用性を持たせようとするとやはり超えなければならない壁は大きいようです。

« 進歩性自動判定モデル(覚え書き) | トップページ | 弁理士数と出願件数(2016年) »

知的財産/特許」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« 進歩性自動判定モデル(覚え書き) | トップページ | 弁理士数と出願件数(2016年) »

2017年11月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    
フォト
無料ブログはココログ