領収書等のスキャンサービスを行うExpensify、実は人に読ませていたことが発覚

「Expensify、個人情報つきの画像をメカニカル・タークに送信していたことが判明。同社はこれを「仕様」と述べる」

arstechnica.com

領収書などを「機械学習」でスキャン、認識して管理する、と喧伝しているExpensifyは、450万以上の利用者がいるサービスですが、実はAmazonのネット経由業務委託システムであるメカニカル・ターク(Mechanical Turk)を使っていたことが判明しました。

これはメカニカル・タークの労働者市場(ワーカー・マーケットプレース)上での発注情報から明らかになったもの。

同社は11月25日に「新機能」として「Private SmartScan」を発表しました。これは「利用者が自分でメカニカル・タークでバックアップのワーカーを募集できる機能」らしいです。これは同社CEOによれば「プライバシー強化機能」なのだとか……。

今回の発覚に対してExpensifyは、画像処理技術の精度を確保するために人力に頼っていると述べています。

ちなみに2013年にQuora(Q&Aサイト)で質問を受けた際に、同社は「メカニカル・タークの使用はやめた、(当時)外部業者に委託するようにした」といった旨を解答しています(機械学習で処理できないのを外部委託するなら結局人力だろうと思うのですが)。なお、その際に機微情報は見えないようにしている、とも述べています。機械的認識ができないから委託するのに、どうやって機微情報を識別しているのかは謎です。

また記事後半では、詐欺防止を目指す企業ForterのCEOが「OCRサービスでは、機械処理できないものを(メカニカル・タークに限らず)人力に任せる習慣がはびこっている」と述べています。

なお、Expensifyはこれに関して、先述の"Private SmartScan"のテスト用だと述べています。

「Expensifyいわく、メカニカル・タークで使われた領収書は新機能テスト用のもの」

www.theverge.com

簡単に言えば「機械による領収書認識は当面無理」ということだと思います。それにしてもみなさん機械(というか「機械学習」や「AI」)を信用してるんですね……。