知的財産/特許

人工知能と特許調査(?)

このところ夜がめっぽう弱くなってしまい、色々と書きたいネタもあるんですが、いざ夜中に書こうとすると体力ゲージが見事に0になってしまい、毎日悔やみながら過ごしておりますweep(ちと大げさ)。

さて、本日は、最近話題の人工知能と特許調査についてのお話で。と言っても、結論は「なかなか難しいよね」というところで終わります。

最近流れてきた情報で、あるセミナーにおいて機械学習に必要な教師データの取得に関連して、

しかし、深層学習をビジネスで活用する場合には、教師データの収集は容易ではない。同氏は、こうした例として、特許事務所におけるサーチャー(特許検索者)のケースを紹介した。目的の特許案件にたどり着くための効率的な検索条件を深層学習で見いだす取り組みだ。

という紹介がなされたという記事を見ました。

特許調査自体のやり方は各種書籍になってますし、例えば工業所有権情報・研修館のホームページに各種研修資料が公開されてますから、上の記事で言っている教師データってのは一般的なやり方というよりも、特定の個人の検索スキルを提供してくれるサーチャーさんはなかなかいないよね、という話だと思っています。

で、特定条件における機械学習と特許調査の関係についてはこんな論文もあったりするんですが、汎用的な観点からざっくり考えてみようと思います。

以前もこのブログでご紹介したように、先行技術調査の流れは、調査対象の技術的理解→調査概念作成→検索式作成→検索→抽出公報検討→最終結論だと言われています(私もそうだと思っています)。

この中で、さっきの記事に書いたように、調査概念作成はAIが結構苦手とする分野だと思うので、機械学習でやるならば、発明者などが自然文で作成した検索条件(式でなくてもいいわけです)から検索式を作るやり方だと思います。つまり、世に言う概念検索を機械学習でできないか、ってことです。しかし、調査概念作成は苦手だって先ほどさらっと言ったように、自然文からその概念なり意味を解釈するという作業は、汎用的な機械学習手法があまり得られていない現時点の段階ではかなり難しい作業だと思っています。

むしろ自然文の意味解釈を行い、シソーラスによりテクニカルタームをある程度収束させあるいは拡張させ、これらテクニカルタームの係り受け関係を整理して、キーワード検索を行い、さらには、特許分類とテクニカルタームとの間の関係を整理し、テクニカルタームから逆引きのようにして特許分類を特定する作業を行い、これらから検索式を自動作成する作業のほうがまだ見通しが立つのではないかと思います。

なお、特許分類には適宜テクニカルタームがちりばめられているわけですが、特許分類は技術分野毎に分類手法がかなり異なる(例えば化学分野であれば物質名が主になりますが機械分野であればその機構の動作、作用が主になる)ため、まともにテクニカルタームから逆引きしても適切な特許分類に辿り着きません。特許分類自体は階層構造を持っていますから、この階層構造を維持しつつ特定の特許分類に適切なテクニカルターム(の組み合わせ)を割り当てる必要があります。とは言え、この作業そのものが膨大な作業になりますが。

整理すると、現時点で概念検索自体がまだまだ未成熟なものである以上、これを機械学習により行うことは相当な困難を伴うと思います。つまり、特定の技術分野において(しかもかなり狭い)数多くの機械学習を行い、検索式との関係を覚え込ませれば、上に書いた論文のように何かしらの結論が得られる可能性はありますが、汎用性の高い検索式作成作業を機械学習により行うのは、そもそも現状の機械学習がさほど汎用性が高いとは言えない(汎用性を高くするためには膨大なネットワークによる計算が必要であるし、機械学習の量も半端なくなる)以上、難しいと言えます。

次に、抽出公報の検討を機械学習で行えるかどうかについて考えてみます。ここで一番の問題となるのが、調査概念と抽出公報との技術的類似性についてです。調査概念というか技術的概念をかなり狭い範囲に絞り込み、抽出公報との技術的類似性について機械学習を行えばかなりいい結果が出ると思うのですが、やはりここでも汎用性の壁が立ちはだかります。つまり、調査概念毎に正解は全く違う(当たり前です)以上、調査概念毎に機械学習を行わないといい結果が出ませんから、やはり機械学習の量が半端ないことになります。

むしろ、技術的類似性はテクニカルタームの類似度であると割り切って(この割り切り自体は合理的だと思います)、テキストマイニング技術を用いて、上に書いた自然文に含まれるテクニカルタームと抽出公報内のテクニカルタームとの類似度を算出して抽出公報の検討を行うやり方のほうが見通しが立つと思います。この際、意味解釈的な考え方を導入するとよりよいと思いますが、とはいえ、意味解釈的な考え方についてもまだまだ試行錯誤しながらの状態だと思っています。

あとは、この間謎のメモ書きを残したブログ記事に書いた、進歩性の観点からどこまで迫れるかというアプローチもあると思います。

こうやって考えてみると、技術分野を相当絞ると機械学習による特許調査ができそうにも思いますが、汎用性を持たせようとするとやはり超えなければならない壁は大きいようです。

進歩性自動判定モデル(覚え書き)

<進歩性自動判定モデル>
1.引用発明の検索
・本願が公開公報に掲載されている場合は、その公開公報に記載された特許分類(好ましくはやや広め)に分類されている公報を第一の集合とする
・第一の集合に含まれる公報についてテキストマイニングを行い、本願明細書及び請求の範囲と最も近いと思われる(シソーラスレベルで単語一致度が最も高い)複数の公報(例えば100件程度)を第二の集合とする
・ここで、シソーラスは、第一の集合における公報レベルで検討する、やり方としては、一般文献(例えば新聞)における出現頻度数百位レベルの単語は一般用語として排除し、その上で、第一の集合における単語の出現頻度数百位レベルの単語をテクニカルタームとし、このテクニカルタームの係り受け関係から(この場合一般用語との係り受け関係が好ましい)シソーラスを形成する
2.進歩性判定
・第二の集合に含まれる公報の技術分野と本願明細書の技術分野との比較を行う、通常、技術分野のdeviationは大きくないと考えるので、シソーラス展開をしないで十分
・技術分野が共通すると考えられる公報について、課題の同一性の判断を行う、課題の同一性は、発明の目的が記載されていると考えられる段落について、シソーラスレベルで単語一致度が閾値以上であるか否かで判断する
・明細書レベルでの単語一致度が非常に高いと考えられる公報は新規性否定の根拠となりうる
・明細書レベルでの単語一致度がそれほどでもない場合、技術分野及び課題が同一であると考えられる公報は進歩性否定の根拠となりうる
・この際、単語一致度がさらに低い場合は、技術分野及び課題が同一である複数の公報により進歩性否定の根拠となりうる
・現時点では、進歩性肯定の根拠となりうる要因(特有の効果、阻害要因等)については自動化の対象となり得ていない

ベンチャー企業と普通の企業と特許事務所(意味不明)

もう夜中なので殴り書き程度にcoldsweats01

企業に勤務して、一応中間管理職に就いた私は、自分の後継者を育てるのも管理職の職務であること、また、仕事の内容を自分だけがわかる状況にしないこと(突然入院とかしても誰かが代わってくれること)を教えられました。結果的に自分のポストは組織改編でなくなってしまったので後継者を育てるまでには至らなかったのですが、私の仕事の内容を自分の部署の同僚がトレースできる状態にしておくというのは、当たり前ですが今でもコツコツと継続して実施しています。

とは言え、この作業は意外と手間のかかるものでして、ヒューマンリソースも時間もそれなりに必要とします。

今、とあるベンチャー企業と知財関係での付き合いがありまして、このベンチャー企業での業務の進め方を見ていると、こういった業務の継続性であるとか後進への財産の相続性であるとかをある程度犠牲にして、スピード重視で業務を進めているという印象を受けています。逆に言えば、専門知識や人材を外部から調達することで、社内に一定の財産を蓄積する時間を省いているように見えます。あるいは適切にアウトソーシングすることで、社内に部署や業務を作らない工夫をしているように見えます。

この考え方は合理的なものであると思いますが、企業の継続性という観点からはどこかで考え方を変えざるを得ない時期がいつか来るとも思います。当然、その時期になるともうベンチャー企業とは呼べないわけですが。

さて、こう考えると、特許事務所はベンチャー企業でも普通の企業でもないと思っています。それは、業務が非常に属人的であり、また、弁理士業界の人材流動性は非常に高いので、専門知識を有するヒューマンリソースを外部から調達することが比較的容易ですから、特許事務所内において人材育成に割く時間を確保せずとも業務を遂行することができるからです。一方、案件単位の継続時間は長い(特許だと数年単位)ですから、業務の継続性は地味に必要なのですが、先程言ったように、弁理士業界の人材流動性は非常に高いので、業務の継続性を確保するためにはそれなりの努力が必要です。

業務が非常に属人的であることと業務の継続性を確保することとは、弁理士が長期間に亘って勤務するならば両立は簡単ですが、人材流動性が高いことでこの前提が崩れてきます。かつては、業務の継続性を担保するために大量の紙ドキュメントを包袋内に保管していたわけですが、ペーパーレス時代においてそのようなやり方はあまり好ましくありません。必要なデータなりドキュメントを比較的長期間(とはいえせいぜい10年程度)保管し、所内の誰もがアクセスできる環境を整えるという観点を持っている事務所はかなり少数派であるように思います。

もう一つの後進を育てるという観点は、特許事務所だとなかなか持てないように思います。それは、先程言った、業務が非常に属人的であることと、事務所内での人事異動がそれほどない(そもそもポスト自体が少ない)ので、後進を育てる必要がどの程度あるかということが理由のように思います。当然、所内の担当者の業務能力の育成、向上はどの事務所でも行っていることだと思いますが、自分が担当しているクライアントの案件をいずれ誰かに引き継ぐという発想はなかなか持てないように思います。

しかしながら、これこそが業務の継続性だと思うわけで、この発想を特許事務所にどうやって取り入れるかってのは非常に難しい問いだと思っています。

とりとめのない話で失礼wink

IoTと特許(覚え書き)

半年ほどBLOGの更新を怠っていて申し訳ございませんでした(って誰に謝ってるのか、なんですが)o(_ _)oペコッ。息子の中学受験やら何やらで平日も土日も多忙を極めており、なかなかBLOG記事を書く余裕がなかったのです。ようやく息子も中学生活を始めて、平穏な生活が戻ってきましたので、またぼちぼち更新することにしますwink

本日は、ネタとしては大きいのですが、まだ本格的な検討を始めていないので、覚え書き的な記事に止まってしまうのがこれまた申し訳ない話です(謝ってばっかりですね)coldsweats01

このところ、特許庁はIoT(Internet of Things)関連の特許審査に関する資料を充実させています。IoT関連の特許・実用新案審査基準に関するパワーポイント資料も紹介していますし、特許・実用新案審査基準や特許・実用新案審査ガイドブックにもIoT関連、さらには3DプリンタやAI(Artifical Intelligence)に関する実例等も追加しています。

IoTに関しては、ビッグデータの取扱等を含めた検討を、産業構造審議会の新産業構造部会で継続的に審議しているところですが、近いうちにこれらの資料をまとめ読みして何かセミナー風にまとめられたらなぁ、などと思っています。とは言え、議論すべき内容は多岐に亘るので、セミナーだと2時間コースですかねぇ。

特許庁は昨年のうちにIoT関連の特許・実用新案審査基準、ガイドブックの事例追加等を行い、資料も公表しています。今年になってIoT関連の事例を追加したり、3DプリンタやAIに関する事例を追加しています。昨年の時点での資料はだいたいフォローしていまして、その資料を見た限りの感想としては、特許庁としてはIoT関連技術をデータの流れを中心に見ているようです。

ここで賢明な読者であればお気づきだと思うのですが、データ処理に注目するのは今に始まったことではありませんし、特に、システムに特徴がなくデータ処理の具体的手法に特徴があるものとしては、かれこれ20年近く前に大ブームになったビジネスモデル関連発明がそれに該当するわけです。

ビジネスモデル関連発明ブームの時は、私も企業内で専門部署の立ち上げ時からその部署で担当していましたから、色々と悪夢が蘇ってくるのですが、面白いことに、特許庁は毎年ビジネスモデル関連発明に関する審査動向を報告しており、つい最近もこの内容を更新した際にIoTシステムとの関連性について言及しています。

IoTとビジネスモデル関連発明との親和性、類似性については書き始めると結構長くなるので、そのうちまとめることがあるかもしれませんが、ビジネスモデル関連発明との対比でIoTシステムを捉えた場合、特徴的なところが2点あると思っています。

一つは、IoTを狭義に定義した場合、多数のセンサから取得したデータに関する処理を特徴とすると思うのですが、ビジネスモデル関連発明の場合、サーバ=クライアントモデルを基礎とすることが多いですから、端末側にもある程度の自律性が想定されます。一方、IoTシステムではセンサー側に特段の自律性を求めることはなく、システムとして特徴的な点はサーバ側、今風に言えばビッグデータの処理手順に存在することが多くなろうと思います。ですから、特許請求の範囲においてもサーバ側のそれを重視して立案するのが良かろうと思うのです。

二つ目は、一つ目に書いたことに関連して、システムに関する請求項に加えて、いわゆるサブコンビネーションの関係にある請求項を記載する際に、サーバ側のそれは上述したように特段の問題は生じませんが、センサ側のそれはいわゆる技術的特徴事項(STF)に欠ける内容になる可能性が出てきます。この点に関して、昨年に特許・実用新案審査基準を改定した際に、サブコンビネーションの関係にある請求項にSTFがない場合の取扱について追記しています。

以上の二点についてはまだまだ派生的な議論ができるのですが(例えばサーバに関する請求項を立案しても、サーバが海外にあった場合にどうすればいいのか、など)、まずは本日はこの辺でお話を終わらさせていただければ、とconfident

スタートアップ企業などでの法務担当者の苦悩(大げさ)

特定の会社を念頭に置いた話ではないんですが、ふと思いついたことを。

スタートアップ企業で特にBtoCを主要サービスとしている企業において、自社が提供しているサービスが消費者を含めた社会に与える影響をunderestimateしてしまうことがあると思っています。特に、革新的なサービスであればあるほど、既存の商慣習、法規制、さらには既成概念との間に対立を生じることがあります。

時に、自社サービスの優位性を信じて止まない経営陣は、こういった対立を「打破」する方向に考えを進めがちなのですが、少なくとも法規制を短時間で「打破」することは難しく、スタートアップ企業等の法務(含む知財)担当者は、規制当局と経営陣との間で板挟みになることは少なくないと思っています。

明らかな法律違反である場合は現状何もできないわけですが、規制当局との間の解釈の相違だったり、現状の法律では明確な規定はないものの規制当局は全般的にネガティブな印象を持っていそうな場合は、法務担当者としてはやはりネガティブな情報を経営陣に提供することが職務であると思います。

こういったネガティブな情報を経営陣に提供するとき、明確な規制がない場合には、法務担当者は「リスクがあります」という言い方をすると思います。経営陣からすると、「リスクがあります」という報告は単なる可能性に言及しているに止まり、では、実際のところリスクは何%なんだ、大丈夫なのかそうではないのか、という疑問を持つでしょうし、そういった発言を受けた法務担当者の方は数多くおられると思います。

一方、法務担当者からすれば、リスクがあることを指摘するだけでなく、リスクの生起の可能性(しかも%まで)まで発言することはかなり難しいだろうと思います。もし自分の発言通りの可能性には結果的にならなかったときにどうやって責任を取るかと言われたら、法務担当者は萎縮してしまうでしょう。

一方、経営陣からすると、法務担当者の物言いは実に曖昧で責任逃れなものに見えるのだと思うのです。リスクがあるのはわかったから、どの程度の可能性があるかを明確にして欲しいし、その可能性を承知の上で最終的な決断をするのは経営陣なので、その根拠を教えて欲しいというところだと思います。その辺のコミュニケーションがこじれると、経営陣は、法務担当者のことを「何か新しいことを考えるとネガティブなことしか言わない消極的な奴だ」というレッテル貼りをしかねません。これではお互い不幸です。

法務担当者としては、新しいサービスが世の中に出たときにどのような影響が生じうるかを、想像力をフルに働かせてリストアップし、その影響に対して一つ一つ可能性と対処策を考え、これらをパッケージにして経営陣に提供するのがよいと思うのですが、これこそ言うは易く行うは難しです。とは言え、できるだけの対処策を講じ、必要であればサービス内容のmodifyを図って、経営陣の当初の思いを叶えられる実現策を提示できるのが、優れた法務担当者だと思います。

一方、大企業になると法務担当者も経験豊富な方が多数揃っておられるので、上に書いたような事態はなかなか生じないかと思うんですが、今度は、マーケットを牛耳るほどの大企業であると、社会的責任とか社会での評判とかを考慮する必要が出てくると思います。自分たちの行動が社会を大きく変化させ、一方で、社会との多大な軋轢を生じさせることを念頭に置いて、やはり、上に書いた想像力をフルに働かせて、万全な対策をしたというまでの検討は必要なんだと思うのです。

とは言え、法務担当者はいつも経営陣に対してブレーキをかける立場にならざるを得ないのは仕方ないんですかねぇ…think

HPによるSamsungのプリンタ事業買収

これから時々知財ニュースを参照して、知財アナリスト的な記事も掲載していこうと思います。とは言え、仕事ではないのでツールが無料なものに限定されることもありweep、隔靴掻痒な内容になってしまうのが微妙に残念ですがcoldsweats01

Samusungがプリンタ事業をHP(最近、Hewlett-Packardが分社してプリンタ+PC事業の会社の名前はこれになりましたので、略称でも何でもないのです)に10億5000万ドル(だいたい1000億円くらい)で売却するというニュースは、これとともにSamsungが6500件以上のプリンタ関連特許および約1300人の研究者とエンジニアを獲得するということがニュースリリースに書いてあったこともあり、知財系のニュースでも報道されていたように思います。一応、日本語でのニュースとしてこれこれ、Samsung側のプレスリリースとHP側のプレスリリースとをそれぞれご紹介しておきます。

このニュースを聞かれた方の中には、「あれ?Samsungってプリンタやってるんだ」という素朴な疑問を持たれた方もそれなりにいらっしゃると思います。IDCが発表した直近の(2015年の)世界プリンター/複合機市場実績に関するプレスリリースをご紹介しておきます。このプレスリリースに紹介されている数字を見ると、Samsungが世界シェア第5位になっています。もう一つ、少し古い記事なんですが、Samsungは後発メーカーであることから脱却するために、他の事業(例えばTV)でやった手法である、デザインを重視することで付加価値を高めて売上を上げるといおう手法を採用しています。とは言え、Samsungのプリンタは日本国内になかなか入ってこないので、実像がつかみにくいのは確かだと思います。

ただ、上にご紹介したランキングの中に、インクジェット製品を主に販売されているエプソンが3位にランクされていることからもわかるように、このランキングはプリンター、複合機、コピー機の全てを足し合わせた数字ですので、対象製品はかなり広いということがおわかりになろうかと思います。

プリンター/複合機というカテゴリーで考えると、ざっと考えてみたら、いわゆるレーザープリンタ(これはプリンター単機能機ですね)、インクジェットプリンタ、複合機(コピーもファックスもプリンターも兼ねる)及びコピー単機能機が含まれます。レーザープリンタというカテゴリーで考えると、HPはIBM(今はLexmarkですね)とともにレーザープリンタとしては老舗に属します。普通紙コピー機はXeroxが世界に広めた後、日本のキヤノンを含めた各社が鎬を削り、そして、レーザープリンタ技術を応用したコピー機が出現したことで、レーザープリンタとの垣根が崩れたわけですが、世界的シェアで考えると、レーザープリンタと複合機とではその顔ぶれが違ってきます。カテゴリー毎のシェアについては、二次資料を見つけたのでここで貼っておきます。

プリンター業界のここ10年あるいはそれ以上前からのトレンドとして、大規模オフィスではネットワークを介して複数のプリンター/複合機に接続可能になり、特に、印刷枚数の管理及び削減、さらにはセキュリティの観点から、非接触式ICカードを用いて部署単位での印刷/コピー枚数の管理及び課金処理、そして複合機の前に行って非接触式ICカードをタッチして初めて印刷が可能になるなど、ネットワークソリューションを含めて提供することが求められています。

さて、先程ご紹介した資料から見えてくることは、HPによるSamsungのプリンタ事業買収は、単純に考えれば、Samsungが非本流事業を切り離す一方、HPはSamsungのプリント事業を知的財産権や従業員とともに入手して、レーザープリンタにおける地位をより堅固なものにするためであると言えそうです。

ただ、HPのプレスリリースや、既にご紹介したニュースを丹念に読むと、HPはキヤノンを初めとした他社から、いわゆるプリンタエンジンと呼ばれる部分(ドラムを含めたレーザープリンタの中核部です)を購入していたところ、Samsungのプリンタ事業買収に伴い、Samsungが製造していたプリンタエンジンに切り替えること、そして、HPは、買収のプレスリリースとともに、A3対応の複合機の新機種を発表しています。つまり、HPは、プリンタエンジンの調達先を一本化する決断をするとともに、これに伴って、日本メーカーの牙城である複合機事業のシェア拡大を目論んだ、ということです。実に戦略的な判断だと思います。

こういったストーリーを考えると、Samsungのプリンタ事業を日本の複合機メーカーが買収するという選択肢はあまり考えにくいです(ニュース発表時に、何故日本メーカーが買収しないのかという発言をFacebookでしましたが、前言撤回します)。日本の複合機メーカーは大抵プリンタエンジンを自社で製造しています。そして、仮に日本の複合機メーカーがSamsungのプリンタ事業を買収したとしても、Samsungのプリンタエンジンを持て余すことになると思います。

であるならば、日本の複写機メーカーは今まで通りの戦いをすることが得策になると言えます。面白いことに、キヤノンの御手洗さんはHPのプレスリリースで好意的なコメントを発表しています。これを穿った見方で考えるならば、キヤノンの有価証券報告書に記載されているように、キヤノンとHPとの間にはインクジェット製品に関するクロスライセンスがあり、また、Samsungは片面的な、つまり、レーザープリンタ事業の広範囲な技術についてにキヤノンからのライセンスを一方的に受ける契約が存在するようです。この情報に基づいて考えると、Samsungへのライセンスは相手先がHPに変わっただけであり、HPが複合機を売れば売るほどキヤノンにはライセンス料が入ってくることになります。キヤノンはHPにプリンタエンジンを販売していましたから、その分の損はあるものの、ビジネスとしては悪くないdealなのかもしれません。

あと、本来ならば特許数の比較もしたいところなのですが、HPはころころ社名を変えているので公報ベースの検索では名寄せが大変なのと、複合機に関する特許分類は多岐に亘るので検索自体が半端なく大変なので、大した検索はできていません。インクジェット製品を含めたプリンタ全般に関するIPCはB41Jですから、USPTOの登録ベースで検索するとSamsungで1057件、esp@cenetで8414件検索できました。一方、キヤノンだとUSPTOの登録ベースで703件、esp@cenetだと10000件を超えたので正確な数字が出ませんでした。で、これだけでは何か確定的なことは言えません。やはり無料のDBでは限界がありますねshock

教育経済学と特許経済学?

本日はちと知財関係ではない話題から。

1年ほど前の話題で、教育経済学に関する書籍が話題になったことがあります。教育経済学という言葉はあまり馴染みのある用語ではないと思うんですが、ざっくり説明すると、Wikipedia的に言えば、「教育と関連がある経済事象を取り扱う学問のこと」になるようです。まぁ、これだけだと当たり前すぎる定義ですので、では、経済学で教育を取り扱う意義として、これもWikipediaの記載を孫引きすると、「教育の経済的効果、教育の費用負担、教育における効率性と教育計画、教育の便益に関する分析」についての問題を取り扱うことが、教育経済学の幾つかの研究課題のようです。

1年ほど前に話題になったのは、慶應義塾大学総合政策学部(いわゆるSFCですね)の准教授である中室牧子さんの著書「学力の経済学」が結構なベストセラーになって、この著書の内容が幾つかのメディアで紹介されたことがきっかけだと思います。私は恥ずかしながらこの著書を読んでいないのですが、メディアで紹介された内容に基づいてざっくり書くと、例えば、ゲームは子供に悪影響を与える(ゲーム脳が子供を暴力的にするとか)という俗説に対して、ゲームのプレイ時間と問題行動などとの相関関係をアンケート等で明らかにし、統計学的にはどうなんだということを明らかにしたり、少人数教育の効果を同様にアンケート等により明らかにして、教育政策として一番効率的なものを探ったりしているようです。

当然、こういった議論には反論が出ます。曰く、うちの子はゲームばっかりしていたら問題児になった、ご褒美で釣ると効果が出ると言われてるけど、うちの子はご褒美をあげてもちっとも勉強しない、などなど。

しかし、教育経済学の結論と我が子の結果との間に違いがあっても、教育経済学が教育行政の効率を最大にすることを目的とし、また、統計学に基づいて多数の傾向を明らかにしている以上、上に書いた違いは当然生じるものですし、違いがあるからと言って、教育経済学の結論が間違っているわけでも、また、我が子の結果が間違っているわけでもありません。とは言え、教育経済学の結論は多数の傾向ですから、それと違うことを我が子に対してやることには若干の勇気が必要かもしれませんが。

さて、こんな畑違いの話題を延々としてきたのは、この辺の話って、知財関係にも通用するかもと思ったからです。

現在、知的財産権法以外の領域で(つまり、知財戦略とか知財マネジメントとかで)知的財産を研究する研究者、先生方が採用されているアプローチは、結構な場合、企業に対してアンケートを取ってこのアンケートを検討したり、また、知的財産に関するデータ(大抵は商用知財DBが出力可能か出力可能なデータから解析できるデータ)を統計処理してその傾向なり結論を導き出すものです。このアプローチ自体、経営学であったり技術経営学であったり、そういった学問で採用されているアプローチを適用したもので、MOTを専攻した私にとっても実にfamiliarなものです。

一方、企業の知財担当者、特に企業の知財戦略立案担当者からすると、我が社の実情を考慮した知財戦略の立案方法を、上に書いた研究者や先生方から入手できないか、というニーズはあると思います。

しかし、このニーズを満足する研究はなかなか簡単ではありません。それは、特定の企業が上に書いた多数に属するかどうかの保証もありませんし、そもそも、教育経済学であれ知的財産を研究する研究者、先生方がやっておられる学問である特許経済学(一応こんなネーミングにしておきます)であれ、「多数」がmajorであるとも言えないからです。

私がMOT時代に先人の研究を見ていて当初違和感を感じていたこととして、統計学上の関連性を示す相関係数が0.6~0.7程度であっても「相関性あり」として結論づけられていたものがほとんどだったことが挙げられます。実際、研究者の先生(実は同じ会社に所属していたことがある方です)と話をしていて、その先生も当初の学歴は理系ですので、やはり私と同じようなモヤモヤ感をお持ちだったそうですが、「社会科学で相関係数が0.9とかいくことはまずなく、0.6や0.7でも上出来なんですよ」という結論に至られたそうで、なるほどなぁと思ったことがありました。

一例として、「特許請求の範囲の文字数が少ないとその権利範囲は広い」という研究結果が出たとします。実務家ならお分かりの通り、この研究結果が妥当する特許権は確実に存在すると思いますが、一方で、幾らでも反証を挙げることができそうです。

相関係数がその程度になるというのは、そもそものモデル設定に無理があるというか、事象は複雑系ですので、簡単なモデル設定では全ての事象を説明することができないということだと思います。で、全ての事象を説明しうるモデルは逆に複雑になり過ぎて扱いづらい(変数が多すぎて何が何だかわからないし、関係性を記述する方程式も複雑になるので解法が簡単ではない)ですから、なかなか大変です。

あと、教育経済学と特許経済学との大きな違いは、母数の差があるということです。こう書くと、だって特許出願は日本だけでも年間30万件あるんだから十分ビッグデータだよねという反論があろうかと思います。しかし、企業の知財担当者が議論したいのは自社の特許出願(あるいは競業他社の特許出願)についてであって、この場合の母数は精々多くて数万件、大抵は数千件です。しかも、特定の分野についての特許出願を取り上げた場合、数百件レベルになってしまう可能性があります。統計学上、数百件をサンプリングして数万件の傾向を議論することはありますが、この場合、数百件が数万件を代表するという妥当性があってのことです。で、特定の企業なり分野なりに関する特許出願が特許出願全体を代表するという命題は、まず簡単に否定されてしまうでしょう。

この手の議論でなかなか悩ましいのが、知財評価においてDCF(ディスカウントキャッシュフロー)法により知財権の現在価値を算出する手法が結構紹介されているのですが、DCFにしてもこのDCFがベースとするCAPMにしても、証券取引のトランザクションが無数であるからこそ一定の傾向を読むことができるわけで、特許権の取引件数が圧倒的に少ない現状において「割引率ってどう設定するの?」という入口の入口で躓いてしまうわけです。

一方、特許経済学のアプローチの限界も自分自身は重々承知しており、また、知財政策への貢献という観点(この場合は多数の利益を追求することに問題はないわけです)であれば特許経済学が寄与するところは大であると思います。一方、特定の企業に対する明確な解答なり指針を与えるということは難しそうです。

経営学ですと、例えばSWOTやPPMなどのフレームワークが種々提案されており、PPMなどはある程度の客観的な指標に基づいたものですから、知財分野においてもこういったフレームワークがないだろうかと思うのですが、どうも「これ!」というものに出会えません。鮫島弁護士及びそのグループの皆様が幾つかモデルを提案されており(連載記事はこちら)、私も内容を存じ上げているのですが、統一的な特許戦略の指標とも言いづらいという印象を持っております。

考えてみると、10年ほど前から自分自身はずっとこの点を研究していて(日本知財学会で3回発表しました)、確か、現在日本大学の教授をしておられる加藤浩氏からは「具体性がない」とご自身の論文で批評されてしまったのですがcoldsweats01、いや、フレームワークを提示している以上、具体的にブレークダウンするのは皆さんにお考えいただかないとと思ったものの、やはりそれは自分自身の研究の至らぬところだなぁ、と思っています。

この点は、何とかフレームワークなり精緻なモデリングなりをいつか発表したいと思っていて、漠然としたアイデアはあるものの、ちとそれをやっている時間も余裕もない(毎日明細書を書かないとあっという間に干上がってしまう)ので、まぁ、そのうちですなぁweep

弁理士数と出願件数(またまたまたまた続き)

このところ多忙続きだったので、2016年の特許行政年次報告書が公表されていたにもかかわらず、例年のデータ更新を怠っておりましたcoldsweats02 ようやく少し時間が取れましたので、データ更新したものをご紹介しますwink

特許出願件数の減少、弁理士数の増加、また、企業勤務弁理士数の増加など、ここ数年の傾向は全く変わっておりませんので、なんだかデータを公開する意義があるんだろうかと思いつつ、まぁ、いつものことですから公開いたします。

20151

20152

例年通り、ファイルも公開します。

「2015.xlsx」をダウンロード

調査概念って…

どうも定期的にBLOGを更新できずにすいませんm(__)m もうこのBLOGも色んな方から忘れ去られていると思うので、思いっきり勝手なことを書こうかとも思うんですが、そこはぐっと我慢して少しはまともなことをcoldsweats01

今日は小ネタで。

ちょっと前に、特許庁が先行技術調査にAI(人工知能)を用いる検討を始めるというニュースが流れてきました。人工知能ネタは既に3回記事にしているので、本日はそこがポイントではないんですが、では、世におられる特許サーチャーのお仕事って人工知能で置換できるような「単純な」ものなのか?ってあたりを探ってみたいと思います(結論はそこにないんですけどね)。

私が把握している限りで特許サーチャーさんがやられている仕事ってのは、調査対象の技術的理解→調査概念作成→検索式作成→検索→抽出公報検討→最終結論、って流れだと思っています。この仕事の流れは私が勝手に考えたのではなくて、INPIT(工業所有権情報・研修館)さんが公開している資料に書いてある(調査概念って言葉は使ってないんですが)ことですので、用語はともかく、この流れは一応オーソライズされたものだと思っています。で、AIでできそうなことというのは、調査概念作成から検索式作成までだろうと思います。

さて、この「調査概念」って何か、実は、特許サーチャーのお仕事で、ここの部分が意外と他の人に理解されていないように思っています。つまり、技術を理解できれば、その技術を表現するキーワードが想起できて、このキーワードを使って検索すれば十分なのでは、あるいは、技術を表現する特許分類(IPCとかFIとか最近はCPCとか)が特定できれば、この特許分類を使って検索すれば十分なのでは、と思われがちのように思っています。

しかし、まず、特定の技術を表すキーワードは一つではなく、結構なバラツキがあります(検索を容易にするために明細書で使用できるキーワードを特定すべしなどという極論もあり得るでしょうが(^_^;))。このため、所謂シソーラスという概念を用いて複数のキーワードを使った検索が必要になります。また、特定の技術に対応する特許分類は時に一つに限定されず、種々の観点から特許分類を選定する必要があります。

こういった、ある意味での検索の対象となる母集団を概念的に記すために、特許サーチャーさんは調査概念を作成します。そして、この調査概念を包含する母集団を検索するための検索式を作成するわけです。この、調査概念は正に調査対象の技術から概念的に抽出されるものですから、AIにより調査概念を作成するのは結構骨が折れる作業ではないかと思っています。

あと、一部の特許商用データベースで「概念検索」という調査メニューを用意しているところがありますが、私が理解している限り、この「概念検索」は、自然文からキーワードを切り出してシソーラス辞書を使ってキーワードを展開し、展開したキーワードを使って検索をしているだけなので、上に書いた「調査概念」を一部実現してはいるものの、言うほど「概念」的ではないと思っています。

で、特許サーチャーさんがこの「調査概念」を使って先行技術調査を行っているのですから、実は、企業の知的財産担当者であれ特許事務所の技術担当者であれ、特許サーチャーさんに先行技術調査を依頼する時には、自分なりにこの「調査概念」を作成して、この「調査概念」を一つのインタフェースとして会話をすればいいんではないかと思っています。自分も経験があるのですが、自分としては当該技術について明確にかつ丁寧に説明したつもりであるにもかかわらず、提出された調査結果が今ひとつ納得がゆかないことが何度かありました。先行技術調査が予想通りに行かないことは多々あることで、大抵は適切な公報を発見することができないことがその理由で、ないことを証明するのは悪魔の証明ですからこればかりは致し方ないんですが、上に書いた調査概念のずれがその理由ではないかと思うこともそれなりにありました。その後、自分なりの調査概念を特許サーチャーさんに提示して、この調査概念に基づいて説明なり議論をすると、だいぶ思い通りの先行技術調査結果が得られるようになりました。

こういった話をすると、「調査概念を作成するのは特許サーチャーの責任だから、適切な調査概念を作成できないのは特許サーチャーの能力不足だ」という意見が出てくるように思います。しかし、共通の言語を持たずにコミュニケーションをすることの難しさは明確にありますし、最終的に満足する先行技術調査結果を得るためには様々な努力をしてもいいと思うのです。つまり、後工程ばかりに責任を負わせるのではなくて、前工程から努力をするということです。実際に、自分は調査概念を共通言語として特許サーチャーさんに業務を依頼することで、かなり効率は向上したと思っています。

で、そろそろ長くなったので、本来なら調査概念の具体的内容について説明しないといけないんですが、その辺りは先程ご紹介したINPITさんの研修資料に書いてありますので、さくっと割愛させていただきます(なんという無責任なbleah

あと、今までの話は先行技術調査についての話ですが、クリアランス調査や無効資料調査については、調査概念の設定の仕方がかなり違ったり、無効資料調査の場合はmissing pieceを見つけるという観点が主になるので、調査概念という言い方があまりそぐわない場合もあったりで、これは個別具体的に調整が必要になります。

本日はこんなところで。

弁理士の仕事は人工知能に奪われるのか(さらに補遺)

7月1日は弁理士の日で、ドクガクさんからのお題が「知財業界でホットなもの」ということでしたが、私としては、過去2回自分のBLOGで知財とAIについてお話ししてきて(これこれ)、ネタが1つ残っていたので、これをお話しすることでドクガクさんからのお題に答えようかな、と思っています(前振りが長すぎますね)coldsweats01

さて、数ヶ月ほど前に出席したシンポジウムで、日立製作所の方が汎用AIについて発表されていました。詳細は資料に譲るとして、私が理解した範囲でみると、いわゆるディープラーニングによる人工知能において、人工知能システムが各パラメータの因果関係を特段解明することなく、膨大な教師データに基づいて自己学習して最善の結果を得るシステムのようです。例として挙げられていたのが、人工知能システムがブランコ漕ぎをやったり、コールセンターにおける人員配置等の最適化でした。いわゆるCRMにおいて、利益最大化を命題として各商品の配置とかを考えさせる用途とかによさそうです。

で、この発表を聞いた後に私が無謀にも考えたのが、知財戦略立案に人工知能を使えないか、ということでした。

知財戦略という言葉をどのように定義し、何をすることが知財戦略であるかという根本的なところでなかなか一致を見るのは難しいのですが、ここではごく単純に、当該事業(会社単位に広げると少しだけ大変なので、ここでは事業単位で考えます、会社の事業が単一ならば会社と読み替えることもできます)の利益の最大化をもたらすための知財業務の方向性を決定し、また実際の数値計画を立案することだとします。ポリシーとかスローガンも知財戦略に含まれうるのですが、ここはAIの範疇にすることが難しいので、取りあえず外しておきます。

こう考えると、知財戦略で決めるべき事は幾つかのパラメータを決定することに集約されます。つまり、当該事業に関連する知財関係の年度毎の出願件数、権利成立件数、訴訟提起件数、ロイヤリティ収入金額といったパラメータについては主体的に決定できることが多いですので、担当者が自ら「知財戦略」として立案、実行することができます。
次に、第三者との関係性で決まってきて、しかも事業の収益に影響を与えるであろうパラメータが幾つかあります。例えば、訴訟被提起件数(そしてその結果としての賠償金支払金額)、ロイヤリティ支払金額といったパラメータについては、種々の外部条件を考慮することで年度毎の計画数値を(えいやであっても)決定することができます。
あとは事業の利益を判断するに当たって、特許の事業への貢献度を見積もる必要があります。ここが一番難しいのですが、正直、ここは担当者の感覚で決定するしかないです。あと、良く言われる三分法、四分法(事業の利益を1/3、1/4が知財の貢献度)はここでは使えません。それは、三分法とかは事業の利益ありきの考え方であって、知財戦略立案時の知財の貢献度とは、知財の存在により事業の利益をどれだけ押し上げられるかですから、ある意味で時間軸が逆方向なのです。

そして、これらのパラメータと事業の利益とを上述した汎用AIシステムに入力して、複数年度のパラメータを解析することで、事業の利益を最大化するためのパラメータが決定できないか、と考えてみたのです。これこそ、AIを用いた知財戦略立案なのです。

…とここまでお読みのみなさんは、何かおかしいと思われたのではないかと思います。

まず、汎用AIシステムに入力できるパラメータは精々数十年単位のものになります。この程度のサンプル数で汎用AIシステムが適切な解(つまりパラメータの好ましい数値)を定められるのか。この点については、汎用AIシステムの出来によると思いますが、現状では数十年単位のデータ量ではかなり難しいのではと思っています。入力パラメータは汎用AIシステムにとっての教師データになるわけで、ディープラーニングによる学習の効率を考慮すると、現時点でのディープラーニング技術ではパラメータの最適値を収束させるまでには至らないと思います。

もう一つ、AIシステムは各パラメータの因果関係まで考慮して結論を出すに至らないことがあります。つまり、出願件数をこの程度にすべしとのアウトプットが出た時に、それは何故かという理屈づけも難しいですし、従って、AIシステムがアウトプットしたパラメータから最終的にずれた値になった時にどうなるかも予測できません。人間は、ある意思決定をする時にその意思決定に至るまでの過程の妥当性を検証したがります。それは、いわゆるPDCAサイクルにおいてD以降の工程をするためのことでもあります。AIシステムは、そういった因果関係や意思決定までの過程を見せてくれないでしょう。そこはAIシステムの現時点での目的ではないですし、検証なり検討は正に人間しかできないことかもしれません。
で、それはそれでいいのかもしれませんが、でも、上に書いた多数のパラメータの因果関係を人間が何かしらのモデルを仮定して検証することも実際には不可能に近い作業です。パラメータが多すぎて何がなにやらわからないわけです。

この辺りをどう解決するかについて、もやもやとした状態ですが、面白いアイデアを持っています。ただ、このアイデアの説明をすると極端に長文になりますので、またの機会によろしくscissors

より以前の記事一覧

2017年10月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        
フォト
無料ブログはココログ