R語言是什么?
R語言是用于統計分析、繪圖的語言和操作環境。R語言是屬于GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用于統計計算和統計制圖的優秀工具。
R語言是統計領域廣泛使用的誕生于1980年左右的S語言的一個分支。可以認為R語言是S語言的一種實現。而S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析和作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟件,它基于S語言,并由MathSoft公司的統計科學部進一步完善。后來新西蘭奧克蘭大學的Robert Gentleman和Ross Ihaka及其他志愿人員開發了一個R系統。由“R開發核心團隊”負責開發。R語言可以看作貝爾實驗室(AT&T BellLaboratories)的Rick Becker、John Chambers和Allan Wilks開發的S語言的一種實現。當然,S語言也是S-Plus的基礎。所以,兩者在程序語法上可以說是幾乎一樣的,可能只是在函數方面有細微差別,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能運用于R。
R語言有哪些特點?
R作為一種統計分析軟件,是集統計分析與圖形顯示于一體的。它可以運行于UNIX、Windows和Macintosh的操作系統上,而且嵌入了一個非常方便實用的幫助系統,相比于其他統計分析軟件,R還有以下特點:
1.R是自由軟件。這意味著它是完全免費,開放源代碼的。可以在它的網站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。標準的安裝文件自身就帶有許多模塊和內嵌統計函數,安裝好后可以直接實現許多常用的統計功能。
2.R是一種可編程的語言。作為一個開放的統計編程環境,語法通俗易懂,很容易學會和掌握語言的語法。而且學會之后,我們可以編制自己的函數來擴展現有的語言。這也就是為什么它的更新速度比一般統計軟件,如SPSS、SAS等快得多。大多數最新的統計方法和技術都可以在R中直接得到。
3. 所有R的函數和數據集是保存在程序包里面的。只有當一個包被載入時,它的內容才可以被訪問。一些常用、基本的程序包已經被收入了標準安裝文件中,隨著新的統計分析方法的出現,標準安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經包含的程序包有:base—R的基礎模塊、mle—極大似然估計模塊、ts—時間序列分析模塊、mva—多元統計分析模塊、survival—生存分析模塊等等。
4.R具有很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進行的,輸入語法中如果出現錯誤會馬上在窗口中得到提示,對以前輸入過的命令有記憶功能,可以隨時再現、編輯修改以滿足用戶的需要。輸出的圖形可以直接保存為JPG、BMP、PNG等圖片格式,還可以直接保存為PDF文件。另外,和其他編程語言和數據庫之間有很好的接口。
5.如果加入R的幫助郵件列表一,每天都可能會收到幾十份關于R的郵件資訊。可以和全球一流的統計計算方面的專家討論各種問題,可以說是全世界最大、最前沿的統計學家思維的聚集地。
R是基于S語言的一個GNU項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。R的語法是來自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語言有一定的兼容性。S-PLUS的使用手冊,只要稍加修改就可作為R的使用手冊。所以有人說:R,是S-PLUS的一個“克隆”。
但是請不要忘了:R是免費的(R is free)。R語言源代碼托管在github,具體地址可以看參考資料。
R語言的下載可以通過CRAN的鏡像來查找。
R語言有域名為.cn的下載地址,有六個,其中兩個由Datagurn,由中國科學技術大學提供的。R語言Windows版,其中由兩個下載地點是Datagurn和USTC提供的。