読者です 読者をやめる 読者になる 読者になる

機械学習(ディープラーニング)は犯罪予備軍を一網打尽にするか?

このブログは面倒くさい話題が多い。だから、たまには違った方面の話をします。きりん は過去、システムエンジニアだった時代があります。それで形態素解析で単語学習とか人口無能を試しに作った事もあるので、機械学習(ディープラーニング)について、空想科学実験をするくらい許されるかと思って書いてみます。

いま話題の技術、機械学習(ディープラーニング)とは何か。コンピューターに明るくない人向けに、簡単に言えば、人間みたいに、いろんな情報を元に何かを判断するプログラムです。難しいな。ええい。もうAI(人工知能)そのままだと思えばいい。これが2000年代後半から現実のものとなって現れ始めた。一般的なAIのイメージと異なるのは以下の3点。「簡単な判断しか出来ない」「適切な方法でむちゃくちゃ勉強させないと動かない」「人間やロボットの形をしていない。ただのデジタルデータ」という事です。

で、どんな事ができるか。有名な例として、写真に猫が映ってるかどうか判断するというのがあります。詳しく知りたい人はリンク先を参照してほしいんだけれども、実物の猫でも、ぬいぐるみの猫でも、絵の猫でもかまわず、猫が映ってる写真かどうかを識別できる。猫っぽいものが映ってるかどうかを判断する、といったほうがいいかもしれない。とにかく「猫ってこういうもんだよね」という特徴をAIプログラムが学習して、写真をAIに見せるたびに「猫映ってる」「猫映ってない」を自分で判別していく。他の事は何も出来ないAIだけど、とにかく猫の識別に関しては人間並みに一人前、というわけ。

他の使い方としては、医療現場なんかがある。例えば、AIに「悪性腫瘍ってこういうもんだよ」「これは悪性腫瘍じゃないよ」というのをより分けてレントゲン写真を大量に渡してみる。そうするとAIはそれぞれの特徴を学習する。その結果、以後、病気かどうか未判断のレントゲン写真をみたら「これ悪性腫瘍ある」「ない」を見分けられるようになる。疲れを知らない記憶力バツグンのコンピューターの事だから、最終的には悪性腫瘍をレントゲンから発見する事だけにかけては、人間の医師より正確な医師になることでしょう。しかもAIはデジタルデータだから無限に増殖できる。一家に1台どころか、スマフォ1つに1アプリずつ腫瘍を見つけるAIを入れる事は造作も無いでしょう。

話変わって きりんは このとおりブログを運営していて、どうやったら沢山の人に見てもらえるかという勉強をしています。言葉の書き方やブログの構成も勉強するんだけど、SEO(検索エンジン最適化)という、どうやったらGoogleの検索で、きりんのブログを大きく取り扱ってくれるか勉強もしています。

そのSEOを勉強している中で知った事で、検索エンジンのGoogle。Googleは今や、ブログ記事に対して「これは質の高い記事だ」「これはゴミのような記事だ」というのをAIで判別できるようになっているらしい。リンクの数とか単語の出現頻度とか、そういう要素じゃなく。人間が見た時のような抽象さで「これは良いサイト」「これは記事の質が低い」をある程度判定しているらしい。その結果、私たちが、Googleで検索した際に、結果のサイト一覧に質の高いページを優先的に表示している。だからSEOを商売にしていた人は、今や特別なGoogle掲載への攻略法を見いだせず「質の良い記事を書こう」「Googleが何故気に入ったか・気に入らなかったか我々でも説明できない状況が増えてきている」と言っている。すごいぞgoogle。

で、ここからが空想科学実験。とにかく機械学習は、適切な方法で沢山のインプットをすれば、なんでも人間に近い判定が下せるようになるとする。そうであれば「これは○○であって、さらに○%の確率で××」という事もきっと出来るようになると思う。前述の医療の例で言えば「レントゲンを見たところ、悪性腫瘍がある確率は99.8%。悪性腫瘍を持っている人は過去のデータから15%の確率で肺炎を併発している」みたいな事です。後半の肺炎の確率はAIじゃなくても、過去の統計を見れば人間にも分かる。今回の話では、これをちょっと飛躍させてみる。

東野圭吾作の小説、プラチナデータ をご存知でしょうか。嵐の二ノ宮君主演で映画にもなりました。

プラチナデータ (幻冬舎文庫)

プラチナデータ (幻冬舎文庫)

この作品では、近未来、DNA捜査によってDNAを事前に調べる事により犯罪発生の可能性を発生前に見極めれるようになった。よって犯罪率0%の社会が実現した。という設定の近未来サスペンスです。映画の方は博士役の二ノ宮君が頑張るのを応援したくなる佳作に仕上がっています。

で、この話が近い未来そのまま可能になる。というのは少し難しそうなので、機械学習で可能な、犯罪捜査の代替案として以下の方法を空想してみます。

  1. 国民はGoogleアカウント1つにつき1つ、AIプログラムを入れる事を義務付ける
  2. AIプログラムは日々、各個人・全国民の検索キーワードを収集していく
  3. AIは貴方の検索キーワード入力パターンを記憶していく
  4. AIは、あなたの検索キーワードの入力パターンと、過去の犯罪者のキーワードパターンを定期的に(自動で)照合する
  5. あなたの犯罪者の検索パターン特徴との適合率が80%を超えるまで、何もしない
  6. 適合率80%以上になったら、犯罪直前動作探知のAIプログラムが追加で作動する
  7. 犯罪直前探知キーワード適合率が○%で、さらにクレジットカード監視AIプログラム作動
  8. あなたが凶器の購入を確認したらクレジットカード監視AIプログラムが、警察に通報

どうでしょう? 1人に1つ以上のAI捜査官が付く未来。Googleに変なキーワードばっかり入力してる人は戦々恐々かも知れない。でも法律さえ許せばこれは技術的にかなり現実的なんじゃないかと きりんは思っています。キーワード収集が無理なら、マウスの軌道でも巡回サイトのURLでも割り出せるんじゃないかと思います。とにかくプライバシーに対する国民感情と折り合いがついて、現実的な学習モデルが作れるデータならなんでも良い。


▼▼▼▼▼

ディープラーニングはこういった分野以外にも、様々な可能性を秘めています。1人の人間に1人以上のAI作業員を割り当てる事で可能になるサービスやシステム。対象が人じゃなくても、牛でもいいし、火山活動データでもいいし、1本の木でも良い。雑誌1ページ毎でもいい。コストが限りなく0に近い優秀なAI作業員を1つの物に何人でも割り当てる事が可能になる。

これが現実のものだとしたら、あなたはどんな未来を想像しますか?

アンドロイドは電気羊の夢を見るか? (ハヤカワ文庫 SF (229))

アンドロイドは電気羊の夢を見るか? (ハヤカワ文庫 SF (229))

  • 作者: フィリップ・K・ディック,カバーデザイン:土井宏明(ポジトロン),浅倉久志
  • 出版社/メーカー: 早川書房
  • 発売日: 1977/03/01
  • メディア: 文庫
  • 購入: 70人 クリック: 769回
  • この商品を含むブログ (436件) を見る

ブレードランナー ファイナル・カット 製作25周年記念エディション [Blu-ray]

ブレードランナー ファイナル・カット 製作25周年記念エディション [Blu-ray]

2001年宇宙の旅〔決定版〕

2001年宇宙の旅〔決定版〕

こぼれ話や解説、ブログ更新をツィッターで毎日配信中