MENU

R、Python どっちを学べばよい?

データサイエンスを学ぶのにプログラミングは必須です。代表的なプログラミング言語としてRとPythonが知られていますが、どっちを学べばよいかが分からない、私もデータサイエンスを学び始めた頃、疑問を持っていました。一見すると汎用性の高いPythonでよいのではと考えてしまいますが、実はRの良さもあり、うまく使い分けると効率的なデータ分析ができるのです。この記事では、R、Pythonの概要と双方の長所と短所について書きます。

・R、Pythonの概要、開発思想
Rは、1995年 ニュージーランドのオークランド大学の科学者ロバート・ジェントルマンとロス・イハカによって開発されたデータ解析・統計プログラミング言語です。当初、研究用途で使われていましたが、現在ではオープンソース化され、R Development Core Teamによりメンテナンスと拡張がなされています。元々、学術分野で使われていたことから、統計学に基づく信頼性が高いことと、データ分析での多変量解析や可視化にすぐれます。

Pythonは、1991年にグイド・ヴァン・ロッサムによって開発されたプログラミング言語です。開発者がプログラマーであることもあり、読みやすく、効率的もよいコードをなるべく簡単に書けるようにする設計思想があります。オブジェクト指向が取り入れられています。Pythonはオープンソースであり、グローバルコミュニティが開発および保守をしています。機械学習などのライブラリが豊富であり汎用性に優れます。また、多言語、アプリ等への拡張性が強いです。

・R、Pythonの長所と短所
[R]
長所:多変量解析、可視化にすぐれる。統計的なアプローチ 時系列分析は強い
   少ないコード記述で書ける
   データ分析が専門、シンプルにかけるので早くできる。
短所:機械学習ライブラリが少ない。汎用性低い

[Python]
長所:機械学習のライブラリが豊富、汎用性が高い 多言語、アプリ等のインターフェースが充実
短所:Rよりも学ぶのに時間がかかる、データ分析では pandasやnumpy、可視化ではmatplotlibなどを使う必要がある。

・結局どっちを使えばよいか
使用目的に合った言語を選ぶというのがよいです。双方の長所を理解した上で両方を使い分けるのがベストです。EDA(探索的データ分析)はR、機械学習モデル構築と予測はPython、考察用分析は Rといったようにです。ただ、両方を使えるレベルまでにするのは大変です。どちらか選ぶのであればPythonをやっておけば、たいていのことができます。

まとめ
データサイエンスで使われる代表的なプログラミング言語であるR、Pythonの概要と長所と短所について紹介しました。結論、使用目的に合った言語を選ぶのがよいです。双方の長所を理解した上で両方を使い分けるのがベストです。どちらか選ぶであれば、Pythonをやっておけば、たいていのことができます。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次