激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - 正則表達式 - PHP 正則表達式效率 貪婪、非貪婪與回溯分析(推薦)

PHP 正則表達式效率 貪婪、非貪婪與回溯分析(推薦)

2020-08-27 16:07正則教程網 正則表達式

先掃盲一下什么是正則表達式的貪婪,什么是非貪婪?或者說什么是匹配優先量詞,什么是忽略優先量詞,好吧,下面通過實例給大家介紹下PHP 正則表達式效率 貪婪、非貪婪與回溯分析,一起看看吧

先掃盲一下什么是正則表達式的貪婪,什么是非貪婪?或者說什么是匹配優先量詞,什么是忽略優先量詞?

好吧,我也不知道概念是什么,來舉個例子吧。

某同學想過濾之間的內容,那是這么寫正則以及程序的。

?
1
$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪

看起來,好像沒什么問題,其實則不然。若

?
1
$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';

那么經過上面的程序處理,其結果為

?
1
2
3
4
$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';
$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪
print_r($str);
//$str 輸出為 <script>alert(document.cookie)</script>

仍然達不到他想要的效果。上面的就是非貪婪,也有的叫惰性。其標志非貪婪的標識為量數元字符后面加? ,比如 +?、*?、??(比較特殊,以后的BLOG中,我會寫到)等。即標識非貪婪,如果不寫?就是貪婪。比如

?
1
2
3
4
$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';
$str = preg_replace('%<script>.+</script>%i','',$str);//非貪婪
print_r($str);
//$str 輸出為 <script 只有這些了,好像還是不太合適,哈,您知道如何重寫那個正則嗎?

以上為貪婪,非貪婪的區別介紹。下面,聊下貪婪、非貪婪引起的回溯問題。先看個小例子。

正則表達式為\w*(\d+),字符串為cfc456n,那么,這個正則匹配的$1是多少??

如果您回答是 456,那么,恭喜你,回答錯了,其結果不是456,而是6,您知道為什么嗎?

CFC4N來解釋一下,當正則引擎用正則\w*(\d+)去匹配字符串cfc456n時,會先用\w*去匹配字符串cfc456n,首先,\w*會匹配字符串cfc456n的所有字符,然后再交給\d+去匹配剩下的字符串,而剩下的沒了,這時,\w*規則會不情愿的吐出一個字符,給\d+去匹配,同時,在吐出字符之前,記錄一個點,這個點,就是用于回溯的點,然后\d+去匹配n,發現并不能匹配成功,會再次要求\w*再吐出一個字符,\w*會先再次記錄一個回溯的點,再吐出一個字符。這時,\w* 匹配的結果只有cfc45了,已經吐出6n了,\d+再去匹配6,發現匹配成功,則會通知引擎,匹配成功了,就直接顯示出來了。所以,(\d+)的結果是6,而不是456。

當上面的正則表達式改為 \w*?(\d+)(注意,此處為非貪婪),字符串仍然為cfc456n,那么,這時候,正則匹配的$1是多少??

甲同學回答:結果是 456。

嗯,是的,正確,是456,CFC4N弱弱的問下,為什么是456 呢?

我在來解釋一下 為什么是456

正則表達式有條規則,是量詞優先匹配,所以\w*?會先去匹配字符串cfc456,由于\w*?是非貪婪,正則引擎會用表達式\w+?每次僅匹配一個字符串,然后再將控制權交給后面的\d+去匹配下一個字符,同時,記錄一個點,用于在匹配不成功的時候,返回這里,再次匹配,也就是回溯點。由于\w后面是量詞是*,*表示0到無數次,所以,首先是0次,也就是\w*?匹配個空,記錄回溯點,將控制權交給\d+,\d+去匹配cfc456n的第一個字符c,然后,匹配失敗,于是乎,接著講控制權交給\w*?去匹配cfc456n的c,\w*?匹配c成功,由于是非貪婪,所以,他每次只匹配一個字符,記錄回溯點,然后再將控制權交給\d+匹配f,接著,\d+匹配f再失敗,再把控制權給\w*?,\w*?再匹配c,記錄回溯點(這時\w*?匹配結果是cfc了),再把控制權給\d+,\d+去匹配4,匹配成功,然后,由于量詞是+,就是1到無數次,所以,接著往后匹配,再匹配5,成功,再接著,再匹配6,成功,再接著,繼續匹配操作,下一個字符是n,匹配失敗,這時,\d+會吧控制權交出去。由于\d+后面已經沒有正則表達式了,所以,整個正則表達式宣告匹配完成,其結果就是 cfc456, 其中第一組結果是456。親愛的同學,您明白剛剛的題目的結果,為什么是456了嗎?

好了,您是否從上面的例子了解了貪婪,非貪婪的匹配原理了?那您是否明白您在什么時候需要使用貪婪,非貪婪去處理您的字符串了?

鳥哥的文章里講到針對表達式、程序為

?
1
2
3
$reg = "/<script>.*?<\/script>/is";
$str = "<script>********</script>"; //長度大于100014
$ret = preg_repalce($reg, "", $str); //返回NULL

其原因就是回溯太多了,直到造成耗盡棧空間爆棧。

再來看個例子。

字符串

?
1
$str = '<script>123456</script>';

正則表達式為

?
1
2
3
$strRegex1 = '%<script>.+<\/script>%';
$strRegex2 = '%<script>.+?<\/script>%';
$strRegex3 = '%<script>(?:(?!<\/script>).)+<\/script>%';

以上所述是小編給大家介紹的PHP 正則表達式效率 貪婪、非貪婪與回溯分析,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對服務器之家網站的支持!

原文鏈接:http://www.manongjc.com/article/654.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 欧产日产国产精品v | 美女视频黄a视频免费全过程 | 欧美爱爱视频 | 一级成人毛片 | 国产精品一区网站 | 12av毛片 | 国产深夜福利视频在线播放 | 一区二区三区日韩在线 | 久久久久九九九女人毛片 | 欧美日韩激情 | 久久久久久片 | 日日草夜夜 | 最新中文字幕在线视频 | 国产免费一区二区三区网站免费 | 欧美一区二区三区不卡免费观看 | 国产精品毛片无码 | 久久国产一级 | 87成人免费看片 | 成年毛片 | a在线视频 | 操操日日| 爱操影院 | 欧美成人一区二区三区 | 久久综合给合久久狠狠狠97色69 | 色人阁导航 | 国产亚洲精品视频中文字幕 | 91九色丨porny丨国产jk | 亚洲一区在线免费视频 | 女人一级一级毛片 | 国产精品99久久久久久久vr | 国产99页| 91 在线免费观看 | 国产成人高清在线观看 | 一级电影免费 | 91精品国产手机 | 91九色视频在线观看 | 国产乱淫av片免费 | 成人免费网站在线观看视频 | 一级黄色毛片免费 | 亚洲综人网 | 快播av在线 |