激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - R語言 - R語言中文本文件分割 符號 sep的用法

R語言中文本文件分割 符號 sep的用法

2022-01-12 14:44奮斗的code R語言

這篇文章主要介紹了R語言中文本文件分割 符號 sep的用法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

一般情況下:

csv 文件 sep = “,” # 以逗號分割

txt 文件 sep = “\t” #以制表符分割

其他文件 sep = " " #以空格分割

 

具體情況,具體調整

sep= 文件中的字段分離符,用于文件數據文本的讀取和保存過程中指定分割符號。

補充:用R語言把超大文本文件拆分成幾個小文本文件

近一段時間一直在研究一些醫院的數據。

前兩天遇到一個尷尬:想打開一個僅有3G左右的文本文件(有時候必須要打開,直接傳到數據庫滿足不了需求),破電腦(4G內存的電腦)就是打不開(用的Notepad++)。

就是這造型:

R語言中文本文件分割 符號 sep的用法

上網搜了一些方法,下了一些比較不常用的文本處理工具和其它工具,也不理想。

得知好多人在許多場景都需要打開或者拆分8G甚至10G以上的文本文件,于是想著自己研究一下。

 

下面就是我用R來拆分大文本的過程

雖然方法比較笨,但是簡單輕巧、思路清晰。

1.首先把你想要拆分的大文本文件放到R的當前工作目錄下

我的文件名在這里叫details.txt。

2.用函數split_file()來拆分大文本文件

split_file()函數是自定義的一個函數,用來拆分超大文本文件。

它總共有兩個參數filename和eachfile_lines_num,即split_file(filename,eachfile_lines_num)。

filename是指需要拆分的超大文本的名字,eachfile_lines_num是指拆分完的每一個文件中有多少行數據。

split_file()會返回一個數值,代表了總共拆分成的小文本的數量。

split_file()拆分出來的文件會放置在R當前的工作目錄下。

使用如:

split_file("details.txt",1000000),它把名為details.txt的超大文本文件拆分為每個文件只有1000000行的一個個的小文本文件。

split_file()的細節:

file_split <- function(filename,eachfile_lines_num){                               #建立函數
	c <- file(filename,"r")                                                    #建立鏈接
	varnames <- paste("splitfile", 1:1000, sep = "_")                          #建立盡可能多但不要太多的動態變量名
	i <- 1                                                                     #初始值
	while(TRUE){
		assign(varnames[i],value = readLines(c,n = eachfile_lines_num))    #分別把從filename中讀出來的數據存放在變量中 
		write.table(get(varnames[i]),paste(varnames[i],".txt",sep = ""))   #分別把存放在變量中的數據寫出到文件中
		if (length(get(varnames[i])) < eachfile_lines_num) break           
		else i <- i + 1                                                    #判斷循環停止條件
}
	return(i)                                                                  #返回文件數量
}

我執行完file_split("details.txt",500000)之后得到了30多個文件:

R語言中文本文件分割 符號 sep的用法

3.對拆分的文件進行處理

由于過程中用到了readLines(),因此拆出來的文件每一行是一個字符串,有引號。

這好像不符合要求,只需用Windows記事本或notepad++或其他文本處理應用處理一下就行。

在notepad++中執行“搜索 -> 替換”把雙引號替換成\0就行了。

R語言中文本文件分割 符號 sep的用法

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持服務器之家。如有錯誤或未考慮完全的地方,望不吝賜教。

原文鏈接:https://blog.csdn.net/qq_40256654/article/details/86413651

延伸 · 閱讀

精彩推薦
  • R語言如何用R語言繪制散點圖

    如何用R語言繪制散點圖

    這篇文章主要介紹了如何用R語言繪制散點圖,幫助大家更好的理解和學習使用R語言,感興趣的朋友可以了解下...

    菜鳥教程13002021-12-23
  • R語言R語言中qplot()函數的用法說明

    R語言中qplot()函數的用法說明

    這篇文章主要介紹了R語言中qplot()函數的用法說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧...

    Jack_丁明12752022-01-05
  • R語言R語言常量知識點總結

    R語言常量知識點總結

    在本篇文章里小編給大家整理了一篇關于R語言常量知識點總結內容,有興趣的朋友們可以學習分享下。...

    R語言教程網12102021-12-29
  • R語言R語言中的vector(向量),array(數組)使用總結

    R語言中的vector(向量),array(數組)使用總結

    這篇文章主要介紹了R語言中的vector(向量),array(數組)使用總結,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要...

    A葉子葉來5772021-11-14
  • R語言R語言讀取xls與xlsx格式文件過程

    R語言讀取xls與xlsx格式文件過程

    這篇文章主要為大家介紹了使用R語言讀取xls與xlsx格式文件的過程步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步早日升職加薪...

    Kanny廣小隸11982022-01-20
  • R語言R語言gsub替換字符工具的具體使用

    R語言gsub替換字符工具的具體使用

    這篇文章主要介紹了R語言gsub替換字符工具的具體使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友...

    lztttao10372021-12-24
  • R語言基于R/RStudio中安裝包“無法與服務器建立連接”的解決方案

    基于R/RStudio中安裝包“無法與服務器建立連接”的解決方案

    這篇文章主要介紹了基于R/RStudio中安裝包“無法與服務器建立連接”的解決方案,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧...

    truffle52815052022-01-05
  • R語言R語言實現支持向量機SVM應用案例

    R語言實現支持向量機SVM應用案例

    本文主要介紹了R語言實現支持向量機SVM應用案例,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下...

    一天_pika5222022-01-18
主站蜘蛛池模板: 日本成年免费网站 | 深夜小视频在线观看 | 亚洲欧美日韩久久精品第一区 | 欧美一级做一a做片性视频 黄色网址免费进入 | 日韩在线激情 | 天天看成人免费毛片视频 | 男女污视频在线观看 | 九艹在线| 中文欧美日韩 | 女人裸体让男人桶全过程 | 精品无吗乱吗av国产爱色 | 国产精品成人av片免费看最爱 | 成人久久久精品国产乱码一区二区 | 日本成人一二三区 | 一区二区三区四区视频在线观看 | 天天草夜夜骑 | 成人免费观看毛片 | 九九夜夜| 影视免费观看 | 欧美日韩亚洲国产 | 99精品视频久久精品视频 | www日韩在线| av成人一区二区 | 天天看夜夜爽 | 一级一级一级一级毛片 | 久久99久久99免费视频 | 97久色 | 精品久久久久久 | 免费久久久久久 | 久色免费 | 一区二区三区欧洲 | 91精品国产777在线观看 | 欧美精品一区二区久久久 | 国产毛片网 | 欧美a区| 欧美在线成人影院 | 成人黄色小视频网站 | 日本教室三级在线看 | 久久3p视频| 韩日黄色片 | 成人在线视频在线观看 |