IOS使用正则表达式去掉html中的标签元素,获得纯文本

news/2024/7/8 2:16:27

IOS使用正则表达式去掉html中的标签元素,获得纯文本

content是根据网址获得的网页源码字符串
NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n"
                                                                                    options:0
                                                                                      error:nil];
     
    content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];//替换所有html和换行匹配元素为"-"
     
    regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"-{1,}" options:0 error:nil] ;
    content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];//把多个"-"匹配为一个"-"
     
    //根据"-"分割到数组
    NSArray *arr=[NSArray array];
    content=[NSString stringWithString:content];
    arr =  [content componentsSeparatedByString:@"-"];
    NSMutableArray *marr=[NSMutableArray arrayWithArray:arr];
    [marr removeObject:@""];
    return  marr;
//正则去除网络标签
-(NSString *)getZZwithString:(NSString *)string{NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n"options:0error:nil];string=[regularExpretion stringByReplacingMatchesInString:string options:NSMatchingReportProgress range:NSMakeRange(0, string.length) withTemplate:@""];return string;
}

 

转载于:https://www.cnblogs.com/liuyingjie/p/5286797.html


http://lihuaxi.xjx100.cn/news/268977.html

相关文章

Android之传感器(一)

传感器的种类&#xff1a;1. 动作传感器加速度传感器、重力传感器和陀螺仪&#xff08;判断手机姿态&#xff09;等2. 位置传感器方向传感器和磁力传感器3. 环境传感器温度传感器 、压力传感器和亮度传感器 使用传感器的方法&#xff1a;1. 获取SensorManager对象SensorManage…

2020,AI创业与投资进入“深水区”

出品 | AI科技大本营&#xff08;rgznai100&#xff09;【导读】7 月 3-4 日&#xff0c;由 CSDN 主办的第三届 AI 开发者大会&#xff08;AI ProCon 2020&#xff09;在线上举行。本次大会有超万人报名参与&#xff0c;参与人群覆盖 60 领域、5000 家企业。其中有来自行业内 7…

java jni调用dll文件_Java通过jni调用动态链接库

(1)JNI简介JNI是Java Native Interface的缩写&#xff0c;它提供了若干的API实现了Java和其他语言的通信(主要是C&C)。从Java1.1开始&#xff0c;JNI标准成为java平台的一部分&#xff0c;它允许Java代码和其他语言写的代码进行交互。JNI一开始是为了本地已编译语言&#x…

最大流学习笔记(1)

1 流网络。流网络G(V,E)是一个有向图&#xff0c;每条边$(u,v)\in E$有一个非负容量值$c(u,v)\geq 0$.如果$(u,v)\notin E,c(u,v)0$.另外有一个源节点s和汇点t。 2 流。G中的流是一个实值函数$f:V\times V\rightarrow R$&#xff0c;满足&#xff1a; &#xff08;1&#xff09…

Git远程仓库Github

Git远程仓库Github 目录 一、创建远程仓库 二、配置SSH 三、克隆项目 四、多人协同开发 五、代码冲突 六、标签 七、分支 提示&#xff1a;Github网站作为远程代码仓库时的操作和本地代码仓库一样的&#xff0c;只是仓库位置不同而已&#xff01; 准备Git源代码仓库 htt…

Nature:16年前的论文生成软件SCIgen至今仍有人用,骗过同行评审,论文被接收...

视学算法报道转载自&#xff1a;机器之心编辑&#xff1a;杜伟计算机程序自动生成的逻辑不通的论文也能被接收&#xff0c;你敢信&#xff1f;然而&#xff0c;在计算机科学领域&#xff0c;这种事情的的确确在发生着。近日&#xff0c;Nature 的一篇文章揭露了由计算机程序 SC…

最差的算法工程师能差到什么程度?

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达编辑&#xff1a;Amusi&#xff08;CVer&#xff09; | 来源&#xff1a;知乎https://www.zhihu.com/question/347545092本文仅作为学术分享&#xff0c;如果侵权&#x…

配置导出MOSS2010列表数据到Excel并根据列表记录自动刷新数据

第一章 简介 场景描述 根据最近客户的需求&#xff0c;他们需要自动维护MOSS2010列表数据导出到Excel的数据实时同步&#xff0c;就是列表添加记录后&#xff0c;导出的Excel列表自动同步数据过来。 第二章 配置方法 1. 打开MOSS2010站点http://moss:8001的要导出的列表 2. 点【…