Oracle Cloud Developers Meetup@東京「機械学習のリーサルウェポン「R」ってなんだ?」レポート
event

Oracle Cloud Developers Meetup@東京
「機械学習のリーサルウェポン「R」ってなんだ?」レポート

2016.06.30

膨大なデータから新たな知見や予測を得る新しいソリューションが各社から続々と提供されていますが、その中で目的に合ったものを探すのはなかなか難しいものです。機械学習、ディープラーニングなど、それっぽいキーワードはよく見聞きするけれど、実際になにから手をつけたらいいの?と思っている方も多いでしょう。新たなことを学ぶにも、なにかとっかかりがないとなかなか手をつけづらいですよね。
そこで今回は「Oracle R Enterprise」に注目し、6月3日に開催された「Oracle Cloud Developers Meetup」に参加してきました。本稿では、データアナリストの鈴木了太氏によるセッション「Oracle R Enterpriseの実力とは?」の模様をレポートします。
(鶴田 展之)

本題に入る前に、「Rってなに?」を少し説明しておく必要があるでしょう。Rは統計解析用途向けに開発された、オープンソースの言語です。単純で簡易な記法と高速な処理、高度なグラフ作成機能を持っていて、機械学習の分野ではPythonと並んでよく使われているそうです。そのRをOracleデータベースと統合するのが、「Oracle R Enterprise(以下ORE)」で、Oracle 11g Release 2から、いわゆるビッグデータ分野の製品として提供されている機能になります。そのOracleによるRの実装がどのぐらい現場で役立つのか、15年近くRを使ってきた鈴木氏が、ひとつひとつ疑問に答えてくれました。

結論から書いてしまうと、OREをオススメすべきなのは、当然ながらまず「Oracleデータベースを運用していてある程度Rが使える人」。次いで、「既存のRユーザー」、その次に「Oracleデータベースを運用していてRの利用経験がない人」だそうです。以下、その理由をひとつずつ挙げていきましょう。

まず、OREの最大の利点はデータの入出力が簡単なことです。Rでは、多くの場合分析用のデータを「データフレーム」と呼ばれるオブジェクトの型式で扱います。OREでは、Oracleデータベースのテーブルを「ore.pull」で取り出してデータフレーム型式に変換したり、逆に「ore.push」でテーブルに書き込むことができます。データ型の変換も自動的に行われるので、既存のデータベースのデータをシームレスにRで活用することが可能になっています。つまり、Oracleデータベースを運用中のユーザーは、OREによってRによる解析が容易に行えるわけですね。

また、OREは通常のRと極めて高い互換性が確保されており、日常的にRを使っている人なら違和感なく使えるとのこと。もちろんORE独自に拡張された専用の関数などもありますが、それも元のR関数と近い感覚で使えるよう設計されているそうです。すでにある程度Rで処理が記述できる人にとっては、データベースにOracleを利用することで一気に大規模データ解析の環境が整うという魅力がありそうです。

問題は「Rを使ったことがない人」。R自体、一般的なアプリケーションエンジニアには馴染みが薄い言語だと思いますので、筆者を含めてほとんどの読者の方はここに当てはまる気がします。ただ、Oracleデータベースが導入済みで大規模データの解析に興味があるクライアントがいれば、この機会にRを学習してみるのは非常に有意義だと思いました。Rを通してデータの加工やモデリング、解析の手法に触れてみることは、高度なデータ活用のための学習の入口としても、なかなかよいきっかけになるのではないかと思います。

鈴木氏が代表を務める株式会社ef-primeでも、RをGUIで使えるアプリケーション「R AnalyticFlow」をオープンソースライセンスで配布しているそうなので、これからRを学んでみたい人は学習ツールとして利用してみてはいかがでしょうか。

「R AnalyticFlow」ダウンロード
http://www.ef-prime.com/products/ranalyticflow/index.html

原稿:鶴田 展之
qnote代表取締役。オープンソースソフトウェアを用いたシステムインテグレーション及びコンサルティングの傍ら、技術書を中心に多数の著述活動を行う。
なお、オフィスには7匹の猫がいる。

この記事はどうでしたか?

おすすめの記事

キャリアを考える

BACK TO TOP ∧

FOLLOW