热点推荐:
您现在的位置: 电脑学习网 >> 软件专区 >> 正文

巧妙提取多个文本文章标题

2013-09-12 17:23:14  来源: 软件专区 
平日里我们的电脑中存储了大量的文档,当需要查找时,要准确找到相应的文章内容就很麻烦了。如果我们将所有文档的文章标题提取出来,并保存为一个文件,就可以知道电脑中到底保存了哪些文章。下面就是提取标题的具体方法:

一、给所有标题打上“烙印”

首先将所有的文本文档拷贝到一个空目录中。在该目录下新建文本文件a.txt,并在文件内输入“aaa”,并注意文字后面不要有空行。打开该目录,在“开始→运行”中输入CMD,点击“确定”,在命令提示符窗口下的提示符下输入:

copy *.txt+a.txt *.txt

通过该步操作后将所有文本文档内容中的结尾处添加了文字“aaa”。

然后删除文件a.txt,在命令提示符后输入:

copy *.txt b.doc

此时,打开文件b.doc后会看到所有的文档都合并到了该文件中,并且在所有的文章标题前都有“aaa”文字,不过第一行,即第一篇文章的标题没有“aaa”文字,我们必须手动添加上。Www.ItCOMpuTER.com.Cn

二、提取文章标题

用Word2000打开b.doc文件,利用替换法将内容“aaa”全部替换为制表符。按下“Ctrl+A”组合键选择文档的全部内容,选择“表格”菜单中的“转换→文字转换成表格”,在“将文字转换成表格”对话框中将“列数”调整为2,在“文字分割”位置选择“制表符”,点击“确定”。此时看到所有文字变成了表格,而右侧一列中就是我们所需要的文章标题。

这时只要删除左侧一列,剩下的就是含有文章标题的表格了。选择Word菜单中的“表格→转换→表格转换成文字”,在出现的“将表格转换成文字”对话框中选中“段落标记”,点击“确定”。此时所有的文章标题间会有一个或多个空行,我们用替换法将空行删除。在“查找内容”栏输入两个段落标记,在“替换为”栏输入一个段落标记,全部替换即可(如图)。

三、“批处理+宏”提取标题更简单

首先创建文本文件a.txt,内容为“aaa”。然后用记事本创建批处理文件copy.bat,用来完成文章标题的标记和文档的合并:

@echo off

copy *.txt+a.txt *.txt

del a.txt

copy *.txt b.doc

exit

用Word2000打开b.doc文件,点击菜单栏的“工具→宏→录制新宏……”,为宏取一个名,开始录制。然后依次完成第二步骤,不过在删除表格的列时,由于在宏的录制过程中无法通过鼠标选择,这时可以点空格键取消选择,然后点击Word菜单栏上的“表格→选定→列”选定第一列,按下剪切键删除,再点击“表格→选定→列”选定含有文章标题的列,并将表格转换为文字。完成所有工作后,点击停止录制键,停止宏的录制。

然后点击Word2000菜单栏的“工具→自定义”选择“命令”栏,在“类别”中选择“宏”,将“命令”栏中刚刚创建的宏用鼠标拖到菜单栏上,生成一个按钮,右击该按钮改名为“标题提取”,关闭“自定义”窗口。

当我们要提取某些文档的文章标题时,我们先将所有文档拷贝到一个空目录下,并把文件a.txt和copy.bat拷入,运行文件copy.bat,生成b.doc文件,用Word2000打开该文件,点击菜单栏上的“标题提取”按钮并按几下回车键就会生成文章标题的文件b.doc,将文件改名保存即可。

 
巧妙配置系统页面文件   在WindowsXP中,页面文件(Pagefile.sys)是一个非常重要的隐藏文件,尤其是在运行一些大型程序诸如3D游戏的时候,页面文件直接关系着程序运行的快慢。但是配置页面文件却是一个让人头痛的问题。(本文为WWW.SQ120.COM电脑知识网推荐文章)
  默认情况下,Windows将页面文件存储在系统分区中,默认的页面文件大小为系统内存的1.5倍。
  不少人都知道,要提高电脑性能,就要将页面文件移到不同分区。当页面文件在系统分区中时,Windows必须执行系统文件夹和页面文件上的磁盘读取和写入请求。如果将页面文件移到另一个分区,则将减少读取和写入请求间的竞争。但如果从系统分区中完全删除页面文件,则Windows将无法创建转储文件(Memory.dmp),转储文件用于在出现内核模式STOP错误时写入调试信息,不然,可能的后果是停机时间可能会延长。(本文为WWW.SQ120.COM电脑知识网推荐文章)
  最好的办法是创建一个页面文件(略小),默认情况下该文件存储在系统分区上,然后在另一个不经常访问的分区上再创建一个页面文件(略大)——该分区最好没有任何数据或操作系统特定的文件。当不经常访问的分区上的页面文件放在它自己的分区中时,该页面文件不会变成碎片,这可以算是另一个明显优势。如果页面文件驻留在包含其他数据的分区上,则当它为满足所需的额外虚拟内存进行扩展时将被碎片化。
  未经碎片化的页面文件,可以使虚拟内存访问速度更快,并且更有可能捕获无重大错误的转储文件。按照设计,Windows会优先使用不经常访问的分区上的页面文件,而不是被访问较多的系统分区上的页面文件。系统使用内部算法确定将哪个页面文件用于虚拟内存管理。
  结论:按上述方法设置的电脑遇到内核模式STOP错误时可以捕获Memory.dmp文件,而且,由于页面文件在一个访问量最小的分区上,所以不经常访问的分区上的页面文件可以得到最频繁的使用。  
巧妙打造瑞星DOS版杀毒光盘 经过笔者不断尝试,摸索出利用Windows 98启动盘生成的虚拟盘和subst.exe相结合,制作瑞星DOS版杀毒光盘工具的方法,以下就是具体制作方法:

首先,在硬盘上建立一个目录:ravdos ,然后利用瑞星杀毒中的“制作/升级软盘版”选项,把制作出来的五张软盘中的所有文件(制作之前最好把瑞星软件升级到最新版)拷贝到该目录下。再把Windows 98自带的subst.exe也拷贝到该目录下。

接着,编辑ravdos目录下的autoexec.bat文件,在PROMPT $p$g下面添加以下内容:

@ subst a: .(虚拟目录下的所有文件为A盘)

@ a:\

保存后退出。

说明:.是一点,很多人以为subst的格式是:subst (空格)盘符(空格)文件夹的详细路径,其实只要把subst拷贝到要虚拟的文件夹中,运行subst(空格) 盘符(空格). 即可。这个参数是隐含参数,微软并没有公开,但非常实用,因为不用输入虚拟文件夹的详细路径,给瑞星杀毒光盘带来很大的方便。

接着,我们就要制作一张可启动数据光盘所需要的启动软盘了,制作方法如下:

在Windows 98下制作一张启动软盘,然后对启动软盘下的config.sys和autoexec.bat进行如下的添加和修改(文中的中文字均是说明,实际修改的时候不用输入):

修改Config.sys

1.在[menu] 字段中添加“menuitem=RAV, Start computer with RAV support.”一行 。

2.添加整项[RAV]

device=himem.sys /testmem:off

device=oakcdrom.sys /D:mscd001

device=btdosm.sys

device=flashpt.sys

device=btcdrom.sys /D:mscd001

device=aspi2dos.sys

device=aspi8dos.sys

device=aspi4dos.sys

device=aspi8u2.sys

device=aspicd.sys /D:mscd001

3.在[COMMON]项中把相应的行修改和添加成以下内容就可以了:

files=40(修改)

buffers=20,0 (修改)

devicehigh=ramdrive.sys /E 7068(修改,增加虚拟盘的大小)

修改autoexec.bat

1.在EXT项下一个项中添加一行:IF “%config%”==“RAV” GOTO RAV

2.需要添加整项:RAV

LH %ramd%:\MSCDEX.EXE /D:mscd001 /L:W(定义光驱的盘符为:W)

copy W:\ravdos %RAMD%:\ > NUL (拷贝光盘\ravdos目录下的所有文件到虚拟盘)

%RAMD%:\ (进入虚拟盘)

autoexec.bat(运行虚拟盘上的批处理文件,即一开始就修改过的瑞星杀毒盘上的批处理文件)

echo.

GOTO QUIT

修改之后保存退出,在刻录机启动数据光盘的时候,把这张经过修改的启动软盘放进软驱,刻录程序会读取这张软盘上的所有文件,刻录结束之后,我们就可以拥有一张瑞星的杀毒光盘了。使用的时候,只需要把电脑设成光盘启动,在出现的菜单中选择Start computer with RAV support,就可以使用瑞星的DOS版杀毒工具来查杀那些在Windows下无法清除的病毒了。

 
From:http://www.itcomputer.com.cn/Article/Software/201309/3453.html
    Copyright © 2005-2013 电脑知识网 Computer Knowledge   All rights reserved.