将Word文字或表格数据提取到Excel表格中
(此法使用前提为Word文档格式基本一致,出表后需浏览全表,个别因Word格式不一致导入表格不一致的地方需手动调整。)
将下图Word日报表格中数据提取到Excel中。
数据提取到Excel中,如图:
本图例为提取Word版2期日报,若一年期全部提取到Excel中,可方便查询、分类整理。
操作步骤:
1.将所需Word文档放在一个文件夹里。
2.新建一个Word或WPS,依次点击插入—对象—文件中的文字。(插入对象必须为Word格式,其他格式导入为乱码。)
3.选择刚才放入一个文件需要插入的文档。
4.全选,点击插入—表格—表格转成文本。转换标记符号选用正文中不存在的符号,如本例中使用$作为分隔符。
5.打开查找替换工具,将所有的段落标记替换为符号作为后续成表时用的分隔符(分隔符支持中文符号)。[段落标记处在导出表格中分行,分隔符处在导出表格中分单元格(每个分隔符会分一个单元格,有时正文出现的分隔符会占单元格将相应内容顺延至后面,需手动调整)(手动换行符另存为文本文档后与段落标记效果一样,在导出表中分行,因此导出表中要在同一单元格的内容在Word中不能分段也不能用手动换行符分段,可用空格或斜线符号等作为间隔)(+:另有特殊符号导入Excel后会分行,个别调整即可)。](分隔符相当于相邻两个单元格中间的分隔线,一个分隔符在Excel表中分一个单元格。)
继续替换:
将文档的开头文字符号全部替换为段落标记(回车符)。(因导出Excel表格中需要日期项,所以将如图“新闻日报”,即开头日期“年*月*日”之前内容选中后按Ctrl+H替换为段落标记(核对一下替换数与日报期数,本例均为2,数据多时可能因个别格式不同导致替换不成功的再单独替换为段落标记)。选中后按Ctrl+H替换操作如图:
通过替换将“标题”行序号“1、2、……”前添加换行符:查找内容输入“([0-9]{1,2}、)”,通过通配符查找替换达到全文序号前添加换行符的目的,格式字体加粗,高级搜索勾选“使用通配符”,替换为输入“^p\1”格式字体加粗,全部替换。
然后另存为文本文件(后缀名txt),保存选项默认“确定”即可。
6.新建Excel或金山表格,点击数据菜单“导入数据”(弹出提示“此操作连接到外部数据源”,确定即可),依次点击“直接打开数据文件”“选择数据源”,选择刚才保存的文本文件,此处默认选项,然后下一步。
7.选择“分隔符号”,下一步,然后选择刚才金山文字表格转换为文本中设定的分隔符号,在“其他”框中输入该分隔符,取消勾选其他项,下一步,(此处一般默认常规等选项不动。如果有身份证号、银行账号等超过15位的数据,导入时点击该列,选择文本格式,日期也要选择对应格式。否则默认即可)点完成。
8.导入结束,整理表格。删除空白行列,选中后底部计数为0说明为空白行列;因格式不同导致相同项可能不在一列,复制剪切使相同项在一列;视情删除不需要的列;添加列名称;或复制所需行列到另外的工作表中使用。
注:(1)Word正文表格中每个单元格内容(如“摘要”等)尽量不能有回车,有几个回车符,操作中会替换为分隔符,会在导入表格中占几个单元格,后续内容顺延。确需间隔的可敲空格或斜线等符号间隔。(2)选中需查找替换的内容,快捷键Ctrl+H,选中内容自动填入“查找内容”。若查找替换提示找“无法找到您所查找的内容”,看是否含有之前操作时默认填入的格式,清除格式即可。