`
276833190
  • 浏览: 14056 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用正则表达式去除html中的标签元素以及js和css脚本和样式

    博客分类:
  • java
阅读更多
public static void main(String[] args) {
		String str = readFile(new File("D:\\workspace\\izbra_front\\WebRoot\\aa\\aa.java"));
		// 先过滤 script 标签
		String reg_tag = "<[\\s]*?#t#[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?#t#[\\s]*?>".replace("#t#", "script");
		str = Pattern.compile(reg_tag,Pattern.CASE_INSENSITIVE).matcher(str).replaceAll("");
		// 再 过滤 hmtl 标签
		reg_tag = "<[^>]+>";
		reg_tag = "<[\\s\\S]*?>";
		str = Pattern.compile(reg_tag,Pattern.CASE_INSENSITIVE).matcher(str).replaceAll("");
		str = str.replaceAll(" ", "");
		str = str.replaceAll("\n{1,}", "#");
		str = str.startsWith("#") ? str.substring(1) : str;
		str = str.endsWith("#") ? str.substring(0, str.length() - 1) : str;
		System.out.println("数量=="+str.split("#").length);
		str = str.replaceAll("#", "\n");
		System.out.println(str);
		
		
	}
	
	public static String readFile(File file){
		StringBuilder sb = new StringBuilder();
		try {
			BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file), "UTF-8"));
			String line = null;
			while((line = br.readLine()) != null){
				if("添加".equals(line))
					continue;
				sb.append(line+"\n");
			}
			br.close();
		} catch (Exception e) {
			e.printStackTrace();
		} 
		return sb.toString();
	}

 

0
1
分享到:
评论

相关推荐

    100个直接可以拿来用的JavaScript实用功能代码片段(1-10)

    86、原生JavaScript用正则表达式清除html代码中的脚本 87、原生JavaScript动态执行JavaScript脚本 88、原生JavaScript动态执行VBScript脚本 89、原生JavaScript实现金额大写转换函数 90、原生JavaScript常用的正则...

    flex3的cookbook书籍完整版dpf(包含目录)

    16.8.节使用ActionScript动态添加和去除图表中的列 16.9.节重叠多个图表 16.10.节拖曳图表中的项目 16.11.节创建一个可以编辑线状图 第十七章. 共享对象(557) 17.1节. 创建一个共享对象 17.2节. 写入数据到共享...

    程序天下:JavaScript实例自学手册

    13.35 使用正则表达式验证日期 13.36 全面的日期选择功能 13.37 全球的时间查看表 13.38 无刷新定时取数据 13.39 取当月的最后一天 第 14章 数字、数组和统计函数特效 14.1 边打字边显示字数 14.2 创建随机数 14.3 ...

    《程序天下:JavaScript实例自学手册》光盘源码

    13.35 使用正则表达式验证日期 13.36 全面的日期选择功能 13.37 全球的时间查看表 13.38 无刷新定时取数据 13.39 取当月的最后一天 第 14章 数字、数组和统计函数特效 14.1 边打字边显示字数 14.2 创建随机数 14.3 ...

    PHP开发实战1200例源码

    实例024 Dreamweaver中创建和附加CSS样式 42 实例025 Dreamweaver控制弹出信息 45 实例026 Dreamweaver控制浏览器的窗口 46 实例027 通过Dreamweaver创建站点 47 实例028 通过Dreamweaver开发第1个PHP程序 48 1.7 ...

    IBM WebSphere Portal门户开发笔记01

    58、JS正则表达式去除空格类方法 335 59、JS重写CONFIRM把确定修改为是与否 335 60、JS执行EXE可执行文件 336 61、JS读取注册表且执行EXE文件 336 62、JS与VBSCRIPT的结合使用 337 63、IE与火狐获取标签的文本内容...

    PHP开发实战1200例(第1卷).(清华出版.潘凯华.刘中华).part1

    实例024 Dreamweaver中创建和附加CSS样式 42 实例025 Dreamweaver控制弹出信息 45 实例026 Dreamweaver控制浏览器的窗口 46 实例027 通过Dreamweaver创建站点 47 实例028 通过Dreamweaver开发第1个PHP程序 48 1.7 ...

    PHP开发实战1200例(第1卷).(清华出版.潘凯华.刘中华).part2

    实例024 Dreamweaver中创建和附加CSS样式 42 实例025 Dreamweaver控制弹出信息 45 实例026 Dreamweaver控制浏览器的窗口 46 实例027 通过Dreamweaver创建站点 47 实例028 通过Dreamweaver开发第1个PHP程序 48 1.7 ...

    Java面试宝典2020修订版V1.0.1.doc

    35、写出验证Email的正则表达式 22 39、说出十种常见的异常 22 40什么是检查性异常和非检查性异常? 23 41、Java的异常处理机制是什么? 23 42、一个静态方法,里面可不可以用this和super关键字 24 三、JavaScript/...

    JavaScript网页特效范例宝典源码

    目录: 第1章 窗口/框架与导航条...实例302 利用CSS样式打印页面中的指定内容 478 实例303 利用CSS样式分页打印 479 11.5 套打邮寄产品单 482 实例304 打印汇款单 482 实例305 打印快递单 484 实例306 打印信封 485 第...

    精通JavaScript

    2.选择浏览器的“工具”-“安全”-“本地Intranet”-“自定义级别”-“活动脚本”中选用“禁用”单选框 3.在浏览器中输入下述地址:http://localhost/1.2.htm • 1.1.htm 多段代码相互调用 • 1.2....

Global site tag (gtag.js) - Google Analytics