极品一区,91在线看,亚洲成人av一区二区三区

數據篩選是在分析中最常用的步驟，如微生物組分析中，你的OTU表、實驗設計、物種注釋之間都要不斷篩選，來進行數據對齊，或局部分析。

今天來詳解一下此函數的用法。

match

match：匹配兩個向量，返回x中存在的返回索引或TRUE、FALSE

match函數使用格式有如下兩種:

第一種方便設置參數，返回x中元素在table中的位置

				?

									match(x, table, nomatch = NA_integer_, incomparables = NULL)

第二種簡潔，返回x中每個元素在table中是否存在

				?

									x %in% table

參數詳解

x: 向量, 要匹配的值;

table: 向量, 被匹配的值;

nomatch: 沒匹配上的返回值, 必須是整數;

incomparables: 指定不能用來匹配的值.

match函數是一個完全匹配函數, 當兩個元素類型不一樣時, 如果進行類型轉換后匹配得上的話, 則仍可匹配, 可看下例.

匹配上且返回位置

				?

									match(c(1, "TRUE"), c(T, 0, "1"))

返回3 1，即1位于表中的3號位，TRUE位于1號位，且T和TRUE可匹配成功

				?

									c(1, "TRUE", F) %in% c(T, 0, "1")

返回TRUE TRUE FALSE，表示每個元素在table中是否存在

pmatch

pmatch函數是一個部分匹配函數, 依次從x里面挑出元素, 對照table進行匹配, 若匹配上則剔除匹配上的值, 不再參與下次匹配, duplicate.ok可設置是否剔除; 對于某一個元素,

匹配一共分成三步:

1、如果可以完全匹配, 則認為匹配上了, 返回table中的位置;

2、不滿足上述條件, 如果是唯一部分匹配, 則返回table中的位置;

3、不滿足上述條件, 則認為沒有值與其匹配上.

pmatch函數的格式

				?

									pmatch(x, table, nomatch = NA_integer_, duplicates.ok = FALSE)

x: 向量, 要匹配的值;

table: 向量, 被匹配的值;

nomatch: 沒匹配上的返回值, 必須是整數;

duplicates.ok: table里面的元素是否可以適用多次.

默認不允許重復使用table中元素，返回位置1 2 3

				?

									pmatch(rep(1, 3), rep(1, 5))

允許重復，返回位置1 1 1

				?

									pmatch(rep(1, 3), rep(1, 5), duplicates.ok = TRUE)

補充：R語言實例-數據過濾

1、問題

一組數據，變量有40個，就是40列。

我要做數據篩選。

1.第一列中包含語段"a11","a12","b23"。請注意是包含，實際不存在“a11”,往往是“a1120”之類的信息

2.第二列中不包含“美國”、“日本”等信息。請注意，也是不包含，而不是不等于。

請問具體的R語言語句應該怎么寫？

2、解決

假設樓主的數據為一數據框，名字為“testdat”，第一列名"a"，第二列名"b"，則過濾語句為：

				?

									result<-subset(testdat,grepl("a11|a12|b23",testdat$a) & !grepl("美國|日本",testdat$b))

3、注意

grep()函數返回的是匹配元素的索引，grepl()返回的是匹配或不匹配的邏輯值：

				?

									grep(value = FALSE) returns a vector of the indices of the elements of x that yielded a match (or not, for invert = TRUE. This will be an integer vector unless the input is a long vector

									grepl returns a logical vector (match or not for each element of x).