最近我在进行一些更多的统计分析,我想知道有没有特别适合这种目的的编程语言。我知道 R,但我希望有一个更通用的语言(或者说R就是通用的吗?)。
你们有什么建议吗?有没有语法/语义特别面向此领域的语言?或者有没有出色的库的语言?
最近我在进行一些更多的统计分析,我想知道有没有特别适合这种目的的编程语言。我知道 R,但我希望有一个更通用的语言(或者说R就是通用的吗?)。
你们有什么建议吗?有没有语法/语义特别面向此领域的语言?或者有没有出色的库的语言?
作为参考,该奖项的其他获得者包括TeX、Smalltalk、Postscript、RPC、'the web'、Mosaic、Tcl/Tk、Java、Make等。 这不是一个坏公司。John M. Chambers
出于S系统,它永远改变了人们分析、可视化和操作数据的方式。
毫无疑问,正如Dirk所说,R是用于统计的最佳语言。我想在此添加一些观点:
首先,我认为您应该使用R的主要原因是由于社区的支持。它已经被学术界和工业界的专家广泛使用,以至于没有其他语言能够与之相比。
其次,应该承认,R语言很容易使用。它是我的主要语言,尝试过其他选择后,我绝不会放弃它。但是它并没有在数据编程方面的优势垄断,这一点可能有些过分。所有的Lisp和函数式语言在数据编程方面都很强大。毕竟,Lisp来源于“list programming”,而正是Lisp对R的影响使得R成为了现在的样子。
R社区中有些成员(例如Ross Ihaka)实际上将Lisp视为未来的统计语言(请参见“回到未来”论文),因为R语言存在一些深层设计问题(例如没有多线程)。
因此,虽然R无疑是用于统计计算的最佳语言,但我认为熟悉另一种语言像OCaml、Haskell或(可能)Clojure/Incanter也有一定的价值。
从我的经验来看,R
在以下领域具有异常强大的语言能力:
数据的操作和转换。
统计分析。
图形。
但是,R
并不仅限于这三个方面。我还将该语言应用于一些不完全适合上述类别的任务。以下是一些例子:
一个脚本,通过识别和匹配不同架构的静态和动态库,然后运行结果组通过lipo
以协助创建OSX通用二进制文件。
从网页上抓取信息的脚本。
一组脚本,用于创建地理参考影像,使用GDAL
将图像划分为瓷砖集,形成描述输出的JSON
清单,并将结果上传到网站以供OpenLayers
立即显示。
我最喜欢使用R
的部分是我经常会说:
哇!有一个包可以做那个?!
我认为R语言是最好的选择,因为我们大学的大部分统计课程都使用R语言,而且我的朋友们也对其功能和范围感到非常满意。
我甚至尝试过MATLAB,发现它也很方便。
祝好!
针对统计分析,pystats库(适用于Python)非常合适。
scipy
,matplotlib
,pandas
,statsmodels
,scikit-learn
等组合,具体取决于您正在做什么。当您需要的东西在Python中没有实现时,rpy2
也是与R交互的好接口。 - Danica