例如,考慮下面的匹配日期的正則表達(dá)式:
復(fù)制代碼 代碼如下:
/\A((?:19|20)[0-9]{2})[\- \/.](0[1-9]|1[012])[\- \/.](0[1-9]|[12][0-9]|3[01])\z/
使用Re之后,正則表達(dá)式可以短小易讀的表達(dá)式為基礎(chǔ),一步一步地構(gòu)建出來,例如:
復(fù)制代碼 代碼如下:
require 're'
include Re
delim = re.any("- /.")
century_prefix = re("19") | re("20")
under_ten = re("0") + re.any("1-9")
ten_to_twelve = re("1") + re.any("012")
ten_and_under_thirty = re.any("12") + re.any("0-9")
thirties = re("3") + re.any("01")
year = (century_prefix + re.digit.repeat(2)).capture(:year)
month = (under_ten | ten_to_twelve).capture(:month)
day = (under_ten | ten_and_under_thirty | thirties).capture(:day)
date = (year + delim + month + delim + day).all
雖然代碼量增加了,但是每個(gè)部分都很短小,也很容易驗(yàn)證。同時(shí),捕獲的部分可以通過相應(yīng)的變量名訪問:
復(fù)制代碼 代碼如下:
result = date.match("2009-01-23")
result[:year] # => "2009"
result[:month] # => "01"
result[:day] # => "23"
注意,用Re構(gòu)建正則表達(dá)式會(huì)很慢,所以推薦創(chuàng)建正則表達(dá)式并復(fù)用。匹配的時(shí)候,性能和原生的正則表達(dá)式很接近。(額外的方法調(diào)用和創(chuàng)建Re::Result以返回匹配結(jié)果影響一點(diǎn)點(diǎn)性能。)如果你需要追求極致的性能,你仍然可以使用Re來構(gòu)建正則表達(dá)式,然后抽取出原始的Ruby Regexp來匹配。這樣的話,性能就和使用原生正則表達(dá)式一樣了。
例如,構(gòu)建匹配電話號(hào)碼的正則表達(dá)式:
復(fù)制代碼 代碼如下:
PHONE_RE = re.digit.repeat(3).capture(:area) +
re("-") +
re.digit.repeat(3).capture(:exchange) +
re("-") +
re.digit.repeat(4)).capture(:subscriber)
然后抽取出原始的正則對(duì)象,直接使用它來匹配:
復(fù)制代碼 代碼如下:
PHONE_REGEXP = PHONE_RE.regexp
if PHONE_REGEXP =~ string
# blah blah blah
end