ハイパー(偽)データサイエンティスト増殖中

投稿者:

ハイパー(偽)データサイエンティスト増殖中

最近の某産業新聞では「データサイエンティスト(データ分析官)という表現が目につきます。いつからデータサイエンティスト=データ分析官という定義に変わってしまったの?と首をかしげてしまいます。ほんの数年前までは、「データ分析官(データマイニング技術者)」という記事を多く目にしたものです。つまり、この新聞の用語では、データサイエンティストも、データマイニング技術者も、データ分析官も同じことのようです。無意味に言葉を言い換えるのは、言葉遊びです。
海外ではData MinerとかData Scientistという言葉はよく使われていますが、日本で使われている「データ分析官」に相当するような英語(無理やり訳したらData analyzing officerになると思いますが)を私は知りません。たぶん、この言葉を広めたのはデータマイニングの受託サービスをしている某会社の社長さんなのですが、私が思うに、これは彼の造語であり、もともとそんな言葉はなかったと思います。「データ分析技能者」で良いところをわざわざ「官」の字を入れたのは、その会社が、さも特別に公的な権限を持ってデータマイニングの仕事をしているようなイメージ(つまり、もぐりではないこと)を演出したかったからだと思います。
個別の会社が勝手に「データ分析官」を名乗るぐらいのことは、とくに何の問題もありません。ある程度の見識を持つ人から見れば「ああ、イメージアップに懸命なんだな」で済むことです。しかし、新聞記者がそのお先棒まで担ぐのはちょっと困りものです。新聞記者が取材の中で「Data Miner=データ分析官」という説明を受けて、それを鵜呑みにしてしまい、今度はまた「Data Scientist=データ分析官」と言い換えられても、それをそのまま、何の疑問も持たずに記事にしてしまっているのは、何とも情けない限りです。自分が歳をとったせいもあるのかもしれませんが、新聞記者のレベルがかなり落ちているように感じてなりません。
大事なことなのでもう一度強調しておきますが、「データ分析官」という言葉はありません。「データサイエンティスト」は「データ分析官」でもありません。
「データ分析官」という語にはとても嫌な違和感を感じるので付け加えますが、データ分析の機会は万人に開かれているべきであり、けっして官によって規制されたり利権化されたりしてはなりません。
Data Minerは、「データマイニングをする人」であり、したがって、「データマイニング技術者」とか「データマイニング技能者」と訳すのは可能だと思います。Data Scientistは、カタカナで「データ・サイエンティスト」です。ここで重要なのはScientistとは、日本語で「科学者」ということです。ですから「データ科学者」と訳すのが正しい訳し方でしょう。
ただし、英語でのData Scientistも”just a media hyped title”(単にマスコミがでっち上げた肩書き)に過ぎません。もともとのイメージではあくまでも「科学者」なので、統計学か数学か、あるいはコンピュータ・サイエンスなどの分野で、最低でも修士以上の学位に相当する学識を有するというイメージでした。それが、データ分析に関する何等かのコースを履修したらData Scientistと自称できるという風潮が英語圏でも広がっているようです。詳しくは、こちらをご参照ください。
大学院でニューラルネットワークとかその他の機械学習テクノロジーの研究をしていたような人が、大学でポストを得る代わりに、Googleのような先端企業に入って研究を続ける人もいるわけです。基礎研究のテーマだったものが応用・実用化の段階に移行して、科学者の新しい就職口として企業がクローズアップされるようになってきたわけです。それが企業でデータ分析をする人がデータサイエンティストであるかのように意味が転じてしまい、さらには「データサイエンティスト」という肩書をでっちあげて、それになるためのコースやら資格認定やらを商売にしようと画策する会社や団体が出てきたのが昨今の状況です。
日本でも「データサイエンティスト協会」などという団体が設立されてしまっています。説明するまでもなく、この協会は科学者の団体ではなく、「データ分析技能者協会」と称したほうがよさそうな中身です。どうせ「自分の(会社の)都合の良いように世間を誘導したい」という人たちが作っている団体なので、弊社はまったくノータッチです。
マスコミに頻繁に登場する自称・脳科学者の何人かは、地道な実験等は何もしていない「ノー科学者」なのに、それに対する批判がまったく報道されないぐらいなので、科学者が作ったデータ分析用ソフトウェアを使うだけで「サイエンティスト」を自称できてしまっても、そりゃ文句を言えません。ノー科学者よりかは、はるかに地道な仕事をしていることは確かです。世の中、肩書のインフレーションだらけです。
そういうことなので、昨今マスコミでもてはやされる「データサイエンティスト」は、「データ分析技能者」と脳内変換して解釈しなければならないのですが、それが流行の最先端を行く花形職種だというのもまた大うそです。
かつて、プログラマーやSEが花形職種としてもてはやされたものですが、現在の惨状を見れば、もはや説明の必要もないでしょう。独自の製品を開発できる一握りの天才的なプログラマーは巨万の富を得ましたが、何を開発すればよいかわからず、単にコンピュータの知識だけで仕事をしようとしたプログラマーやSEは、今やしがない派遣労働者でしかありません。データ分析のスキルだけで仕事ができると思っている人がいるとしたら、そういう人はたぶん派遣どころか早晩失業の憂き目に遭うことでしょう。「英語ができる」というだけでは、大して仕事には役に立たないのと同じようなことです。
本物のデータサイエンティストとハイプ(hype:誇大・インチキ・ほら吹き)なデータサイエンティストは、月とすっぽんです。ちなみに、かつてHyper Media Creatorという肩書の人がおりましたが、Hyper Mediaというバズワードが死語となった今では、「ほら吹きなメディア制作者」という意味でしか通用しなくなっております。ですから、昨今のにわかデータサイエンティストも「ハイパー・データサイエンティスト」と名乗っておけばよいと思います。
もともとのデータサイエンティストの意味からすれば、統計解析や機械学習、人工知能などを用いたシステム(たとえば、次世代のデータマイニング・システム)を開発している人こそが、本物のデータサイエンティストなわけですが、そういう人たちが現在開発しているのは、もはや偽データサイエンティストのためのシステムではありません。
本物のデータサイエンティストが目指しているのは「マインドウエア」です。すなわち、(経営者などの)人間の「判断」をモデルできるシステムです。それは、単純に「コンピュータによって判断を自動化する」ということを超えて、経営者の「マインド(戦略)」を会社の隅々にまで行き渡らせて、個々の取引または顧客対応のレベルで実行可能にします。たとえば、弊社が取り扱っているViscoveryがそれです。
Viscoveryのような本物のデータサイエンティストが開発したシステムは、そのユーザーに(本物または偽物の)データサイエンティストであることを要求しておりません。

投稿者について