`
hslh22
  • 浏览: 76808 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

c# 正则表达式如何处理换行符(网页)

    博客分类:
  • C#
阅读更多

我们要分析网页,把整个网页内容作为匹配源,但是c#的正则表达式是默认以一行为单位的,使用 RegexOptions.Multiline 也没有实质性作用(它知识改变了^和$的行为)

 

只要在正则表达式前面加上(?s)这个选项即可

 

考资料:http://hi.baidu.com/hetaoos/blog/item/7936a80faec513e9ab6457b8.html

 

string s = ".......";
string r = @"(?s)(?i)导演:\s*</span>\s*<span\s+class=""m_c"">\s*<span><a.*?>(?<director>.*?)</a>";
string t = Regex.Match(s, r).Groups["director"];
Console.WriteLine(t);
// (?s) 点号匹配一切字符(含换行符)
// (?i) 进行不区分大小写的匹配
// (?<name>...) 命名捕获
  
  
            Regex r = new Regex("(?s)(?i)id=\"__VIEWSTATE\" value=\"(?<__VIEWSTATE>[^\"]+)\" />.+" +
                "<span id=\"lbinfo\">(?<lbinfo>[^<]+)</span>.+" +
                "<span id=\"lbIP\">(?<lbIP>[^<]+)</span>.+" +
                "<span id=\"lbuserid\">(?<lbuserid>[^<]+)</span>.+" +
                "<span id=\"lbRealName\">(?<lbRealName>[^<]+)</span>.+" +
                "<span id=\"lbRemainMoney\">(?<lbRemainMoney>[^<]+)</span>.+" +
                "<span id=\"lbFreshTime\">(?<lbFreshTime>[^<]+)</span>.+" +
                "<span id=\"LNowState\">(?<LNowState>(开放|关闭)IP成功).+</span>.+" +
                "id=\"__EVENTVALIDATION\" value=\"(?<__EVENTVALIDATION>[^\"]+)\" />", RegexOptions.Compiled);
分享到:
评论

相关推荐

    C#正则表达式学习

    符下两ows表研究室的火热,当晨在“@”虽然并非C#正则表达式的“成员”,但是它经常与C#正则表达式出双入对。“@”表示,跟在它后面的字符串是个“逐字字符串”,不是很好理解,举个例子,以下两个声明是等效的: ...

    C#中正则表达式与回车换行符问题

    C#中,读取文本文件内容,里面往往有许多回车换行符(“\r\n”),虽然一般不可见,但却实实在在的存在。这时候,使用正则表示式进行匹配,需要考虑其存在。今天就遇到这样一个问题: 有文本文件内容如下: DT ...

    正则表达式

    \n 匹配一个换行符 \r 匹配一个回车符 \s 匹配一个空白字符,包括\n,\r,\f,\t,\v等 \S 匹配一个非空白字符,等于/[^\n\f\r\t\v]/ \t 匹配一个制表符 \v 匹配一个重直制表符 \w 匹配一个可以组成单词的字符...

    C# 正则表达式30分钟入门教程

    . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束

    正则表达式经典实例中文版 (美)高瓦特斯

    即使有经验的用户也经常会遇到性能不佳、误报、漏报等让人挠头的错误,《正则表达式经典实例》对于如何使用正则表达式来解决一些常见的问题给出了按部就班的解决方案,其中包括C#、Java、JavaScript、Perl、PHP、...

    正则表达式经典实例

    即使有经验的用户也经常会遇到性能不佳、误报、漏报等让人挠头的错误,本书对于如何使用正则表达式来解决一些常见的问题给出了按部就班的解决方案,其中包括c#、Java、JavaScript、Perl、PHP、Python、Ruby和VB...

    正则表达式经典实例.pdf

    即使有经验的用户也经常会遇到性能不佳、误报、漏报等让人挠头的错误,本书对于如何使用正则表达式来解决一些常见的问题给出了按部就班的解决方案,其中包括c#、Java、JavaScript、Perl、PHP、Python、Ruby和VB...

    正则表达式30分钟入门教程

    正则表达式里还有更多的元字符,比如\s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等。\w匹配字母或数字或下划线或汉字等。 对中文/汉字的特殊处理是由.Net提供的正则表达式引擎支持的,其它...

    正则表达式模式修饰符

    默认情况下,PCRE 认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), “行首”元字符 (^) 仅匹配字符串的开始位置, 而”行末”元字符 ($) 仅匹配字符串末尾, 或者最后的换行符(除非设置了 D 修饰符...

    正则表达式C#实现帮助类

    表示任意字符(除了换行符)。例如,a.b 可以匹配 "aab"、"acb"、"a#b" 等。 4. 转义字符(Escape characters):使用反斜杠 \ 可以转义特殊字符,使其成为普通字符。例如,\. 可以匹配句点,\d 可以匹配任意数字...

    C# 正则表达式 使用介绍

    为了避免以后这样的情况,在此记录下正则表达式的一些基本使用方法附带小的实例。让以后在使用时能一目了然知道他的使用,为开发节约时间,同时也分享给大家 正则元字符 ...匹配除换行符以外的任意字符。

    使用正则表达式最小化间距

    将多个空格,制表符或换行符压缩为单个空格,制表符或换行符的正则表达式模式。

    Java-PHP-C#

    上面的正则表达式"/"就是分隔符,两个"/"之间的就是表达式,第二个"/"后面的字符串"is"就是修饰符。 在表达式中如果含有分隔符,那么就需要使用转义符号"\",比如"/hello.+?\/hello/is"。转义符号除了用于分隔符...

    editplus 代码编辑器html c++ jsp css

    (6)选择“换行符”,插入“\n”,表示回车符。 ④、“替换为”组合框保持空,表示删除查找到的内容。单击“替换”按钮逐个行删除空行,或单击“全部替换”按钮删除全部空行(注意:EditPlus有时存在“全部替换”不...

    EditPlus 2整理信箱的工具

    (6)选择“换行符”,插入“\n”,表示回车符。 ④、“替换为”组合框保持空,表示删除查找到的内容。单击“替换”按钮逐个行删除空行,或单击“全部替换”按钮删除全部空行(注意:EditPlus有时存在“全部替换”不...

    Editplus 3[1].0

    (6)选择“换行符”,插入“\n”,表示回车符。 ④、“替换为”组合框保持空,表示删除查找到的内容。单击“替换”按钮逐个行删除空行,或单击“全部替换”按钮删除全部空行(注意:EditPlus有时存在“全部替换”不...

    C#开发实例大全(基础卷).软件开发技术联盟(带详细书签) PDF 下载

    全书分6篇共25章,主要内容有C#开发环境的使用、C#语言基础应用、字符串处理技术、数组和集合的使用、面向对象编程技术、数据结构与算法、Windows窗体基础、特色窗体界面、窗体控制技术、MDI窗体和继承窗体、Windows...

Global site tag (gtag.js) - Google Analytics