365体育彩票,365体育app

图片
网站首页  
清丰县档案信息网
乡镇频道: 城关镇 | 韩村乡 | 固城乡 | 马庄桥镇 | 柳格镇 | 双庙乡 | 纸房乡 | 六塔乡 | 瓦屋头镇 | 巩营乡 | 仙庄镇 | 马村乡 | 高堡乡 | 大流乡 | 古城乡 | 阳邵乡 | 大屯乡
365体育彩票
中原经济区 365体育app 365体育彩票 职称教育
档案科研 档案学会 党建 精神文明 廉政
365体育app
通知公告 档案新闻 档案界论坛
档案界维基百科 《365体育彩票》电子期刊
365体育彩票
网上预约服务 馆藏珍品展厅
网上调查 365体育app 365体育彩票 365体育彩票
365体育app
已公开现行文件查询 河南数字档案馆
音视频档案 历史记忆 365体育app
 365体育彩票
把Word转为简洁的html的若干种方法
更新时间:2013-11-18

 

Word转为简洁的html的若干种方法

word可以直接另存为 htm,但即使是 另存为 html 也会有大量的废代码。以前我一般用 dreamweaver clean up html 来处理,先处理 word 特有标签,然后删除一些 font,b,span 等。进一步,在 editplus 里面用正则进行处理,最后得到我想要的干净的html 代码。当然最完美的办法就是拷贝文字出来,自己用文本编辑器书写htm标签,:)

今天又看到lifehacker这几种word 2 clean htm方法:

1.使用这个HTML Tidy Library Project开源软件来处理。

2.微软官方站点也有个Office 2000 HTML Filter 2.0工具,可以用来处理掉word2000html时出现的多余代码。

3.使用这个Word HTML Cleaner 在线工具来处理。只能处理word2000以下版本。

4.有人给出了正则表达式(其实,上面的各种软件也都是用正则来解决的)

删除不需要的标签

<[/]?(font|span|xml|[ovwxp]:w+)[^>]*?>
- replace any matches with the empty string

删除class,style...等不需要的属性

<([^>]*)(?:class|lang|style|size|face|[ovwxp]:w+)=(?:'[^']*'|""[^""]*""|[^>]+)([^>]*)>
- replace any matches with <$1$2>

详细解释在Clean Word HTML using Regular Expressions

 

 

365体育app:郑州市金水路18号 邮政编码:450003 电子邮箱: hndafgc@126.com
版权所有 河南省档案局 豫ICP备11015203号-1 用户登录