热点推荐:
您现在的位置: 电脑学习网 >> 网络技术 >> 正文

网页收集新方法──取己所需 分类保存

2013-09-12 17:26:43  来源: 网络技术 
通常,我们都是用IE来收集网页资料,但有时候我们仅仅只需要网页中的一小部分资料,这种方法却会把整个网页文件都保存下来了,不仅浪费了硬盘空间,还不便于资料的查询。现在,我们带给大家一个新的收集方法,它可以按照你的需要将网页中的任意部分分类保存,不仅如此,它还提供了强大的查询功能,让你查找保存资料更轻松。

一、保存网页中所需资料

首先下载安装Net Snippets V3.1.1.0(下载地址:http://js-http.skycn.net:8080/down/nsclient3110.exe,汉化补丁可在http://www.skycn.com/soft/16342.html处获得。)安装之后打开IE,在工具栏上会出现一个Net Snippets图标,遇到好的网页资料时就可以点击图标打开Net Snippets来进行保存了。

为了保持保存资料存放的整洁清爽,我们可以按照保存资料的类型建立分类目录。在Net Snippets窗口的“My Snippets”目录上单击右键,选择“建立文件夹”项弹出创建窗口(图1),按顺序输入“文件夹名称”和对文件夹的“描述”,在“重要性”选项中若选择了“高”,会在文件夹目录中将文件夹名称加粗显示以突出该目录。wWW.itcOmputER.coM.cn在添加好的目录下也可以用此方法来添加子目录分类。

目录分类建立好之后就可以分类保存网页上的资料了。首先选中网页上你要保存部分的内容,然后将选中内容拖动到已经建立好的目录中,释放鼠标左键后会弹出一个编辑设置窗口(图2),这是一个类似于网页编辑工具的窗口,在这里你就可以对要保存的内容进行编辑修改,包括改变字体、插入链接图片。在窗口的下方你还可以对保存内容“名称”、“注释”、“参考目录”、“关键词”、“自定义信息”、“摘要”等选项进行设置,设置完毕单击“保存”按钮即可。

提示:在“关键词”选项中最好根据保存的内容设置两个以上的关键词,以方便日后的信息搜索。

二、查找保存信息

随着保存网页的增多,按照目录查找内容可能有所困难,利用Net Snippets提供的搜索功能可以轻松定位保存的信息。在“My Snippets”的右键菜单中选择“搜索”弹出搜索窗口(图3),输入搜索内容并勾选好搜索类别,然后点击“搜索”按钮进行搜索,完毕后单击“查看结果”按钮即可查看搜索到的内容。

另外,在目录的右键菜单中选择“创建索引目录”,可以为目录下的所有内容建立一个索引页面,以方便资料的查看。利用右键菜单中的“邮件”选项还可以将目录内容发送给你的朋友,让他一起分享你的保存资料。

 
批量保存网页信息 壮壮在一家医药零售单位工作,需要经常和本省的一些制药企业联系,但记录网页中众多联系地址的工作量是非常大的。以登录中国医药网(http://www.pharmnet.com.cn/cgi/company_search.cgi)为例,在“搜索企业”处输入“四川”,一共可以获得159家企业之多。

现在我们利用网络数据库探索者来批量保存这些联系地址,就能大大减少重复劳动的工作量。

下载地址:http://www2.skycn.com/soft/14620.html

一、查找页面规律

在使用网络数据库探索者前我们要摸清页面的规律,一般可以从两、三个所需页面的链接地址对比中找到规律。在“四川”的企业列表中进入第二、第三页,发现它们的地址分别为:http://www.pharmnet.com.cn/cgi/company_search.cgi?p=2&t=company&terms=四川&c=和http://www.pharmnet.com.cn/cgi/company_search.cgi?p=3&t=company&terms=四川&c=,可见地址变化的就是p的值,依此类推就可以得出p=4是第四页、p=5就是第五页……这里的p就是数据页的url关键字,其前面的地址部分http://www.pharmnet.com.cn/cgi/company_search.cgi?是url1,后面的&t=company&terms=四川&c=则是url2了。

二、设置规则

清楚页面规律后还需要为要保存的网页信息建立一个规则。开启网络数据库探索者,在“文件”下点击“新建规则文件”打开“设置规则”窗口(图1)。首先设置“一级规则”,一级规则的内容就是类似制药企业列表这样的一级数据了。在“规则用途”方面是根据所要保存的页面数据大小来定,这里的各企业联系方法数据较小就勾选“提取一般数据”,接下来给规则输入一个名称并输入数据页的url1、url2和关键字。

提示:如果没有url2就以空格代替;填写url关键字的时候要注意其大小写要和实际地址中的一致。

因为在页面中我们只需要其中的列表部分,这里要设置一下列表部分的“起始关键字”,一般可以取列表上一行的固定文字,这里取用“共有159家企业”;“每页行数”则是从关键字开始一直到列表结束的行数,包括空格;“提取页数”就是列表的页数了,这里共有11页,就设置为“1到11”,“递增值”一般设置为1。

我们真正所需的企业联系信息是列表中的各个企业的链接页面值,即二级数据,因此在设置完“一级规则”后勾选“二级规则”,进入“二级设置”选项卡,勾选“使用提取行数”,“二级链接的url范围”的选择可先在软件自带的浏览器中打开一个一级数据网页如http://www.pharmnet.com.cn/cgi/company_search.cgi?p=2&t=company&terms=四川&c=,然后按下“二级链接的url范围”后的小按钮,在弹出的窗口中定位好所需网页资料的序号(图2),若需要28~42之间的二级数据,则“二级链接的url范围”就是“28到42”;然后像设置“一级规则”一样设置好“二级数据页的起始关键字”和“提取行数”就可以“确定”保存规则了。

提示:在选择“使用提取行数”和“使用结束关键字”时要注意,如果二级数据的行数固定就选“使用提取行数”选项,否则选“使用结束关键字”。

三、批量提取数据

规则设置完毕返回软件主界面就可以提取所需要的网页信息了。在“规则”下选择刚才建立的规则文件“四川制药企业”,单击“提取”按钮就可以执行数据库的信息提取了。提取完毕,在“数据浏览”中可以查看到与一级数据相对应的二级数据即各制药企业的具体联系方法了。运行“文件→提取的数据另存为文本”就能保存所需要的网页信息了。

编后:某些网站提供的网页信息是以分页形式发布出来的,这样的网页具有一定的规律性且数据量大,要想保存这样的网页若依靠手工逐一操作,工作量太大。使用网络数据库探索者可以直接读取网站数据库来保存网页信息,能够有效减少重复劳动,减轻工作量。

 
Web聊天 打开网页就开聊 常聊天的朋友,可能都会选择一款聊天工具下载安装后再进行聊天,这样势必就会占用一定的系统资源。而且很多局域网管理员为了便于管理网络,通常会禁止一些端口来限制聊天工具的使用。如果我们使用Web版的聊天工具,这些担忧就可以抛在脑后了,不必再经过下载、安装软件等烦琐的步骤,打开网页就能随时随地和朋友开聊了!

秀出真我──IMU Web版

最近网上聊天软件又热了起来,经常上网的朋友一定对IMU不再陌生吧,今天我们就来品尝一下它的新鲜──IMU Web版,你只要有了自己的IMU号码,不用下载客户端就可直接从Web方式登录使用了。

首先,在任何一个上网的计算机上,打开浏览器的地址栏,输入http://www.imu.com.cn即可登录即时通网站。在主页面的右下角找到Web版IMU的登录链接,点击后即可出现登录窗口(图1)。

IMU登录的方式也是多样的,用户可以从IMU号码、E-mail、手机号码三种方式中任意挑选,并且可以设定登录时的情绪,这可是IMU的独创哦!够新鲜吧?同时还提供登录模式的选择,看来IMU开发者投入了不少精力。

小提示:现在申请IMU号,还提供靓号自选的特大优惠!

登录成功后,你就可以进入聊天室开聊了。当然,你也可以边聊边查找在线好友,还可以随时调整自己的情绪和状态。不想聊了,一关界面就OK了。不用下载IMU软件,一样也能享受聊天的乐趣!

用心来沟通──雅虎通Web版

在浏览器地址栏里输入http://messenger.yahoo.com/#webmessenger后,点击页面右下方的“Launch Yahoo! Web Messenger Beta”进入到登录界面(图2)。

雅虎通Web版无论是外观还是使用方法,都给用户一种简洁、方便的感觉。如果你是第一次和雅虎通接触,可以点击左侧较醒目的“Sign Up Now”注册到系统分配给你的ID号。在登录窗口里输入Yahoo ID和密码后,点击下面的“Sign In”即可登录。接着,系统会让你选择登录的模式,如“Let My Friends See Me Online”(正常登录)和“Keep Me Invisible”(隐身登录),选择其中的一种登录方式后,再次点击“Sign In”进入。

进入雅虎通Web版聊天界面之后,我们就可以根据自己的需要进行一些必要的设置了。当然Web版供用户设置的选项比较少,如控制Tool Bar(工具栏)和Status Bar(状态栏)的出现或隐藏、在线时间的显示等,但雅虎通Web版在线状态设置只有Available(正常在线)和Invisible(隐身)两种,比起IMU可谓单调了许多。

雅虎通Web版同样也支持在线添加好友,并且提供了通过YAHOO ID及实时的在线用户来查找。点击“Tools→Manage Friend List→Search For a Friend”来寻找,然后点击工具栏上的“Add”按钮进行添加。在列表中选中好友后,通过工具栏上的Message按钮,就可以与好友进行交谈了。除了在线聊天,雅虎通Web版还在“Tools”项里提供了YAHOO邮件通知、YAHOO搜索、发送贺卡等十多项服务供使用,可以说Web版就是雅虎通版本的一个简化。

来自远方的问候──ICQ Web版

在地址栏中输入http://go.icq.com后,网站会自动打开ICQ登录窗口,输入ICQ号和密码后,再点击“Connnect”即可登录。点击弹出的信息窗口上的“OK”即可登录成功。

进入聊天界面之后,首先就是寻找和添加好友,点击界面下方的“Find/Add Users”后,用户可以通过提供ICQ号码、E-mail地址、姓名、年龄、所在城市等信息来进行详细的查询好友,并且还可以点击“User Info”来查看详细资料,最后点击“Add User”按钮就可以把他加为好友了。在ICQ主操作界面的上方我们可以点击“Online Only”和“Groups”以不同的分组方式来显示好友列表。并且用户还可使用界面上方的Google搜索来进行网络搜索,使用下方的Send SMS可以实现发短信的功能。至于其他的怎样操作,相信大家都知道了吧?

小提示:在交流过程中,通过程序下方的下拉列表,你还可以灵活地切换自己的状态(如上线、隐身)。

其实除了以上几款聊天软件提供了Web版之外,还有大家比较熟悉的MSN同样也开通了Web版的聊天,感兴趣的朋友也可以到http://webmessenger.msn.com/去感受一下它的魅力。

 
From:http://www.itcomputer.com.cn/Article/Network/201309/3964.html
  • 上一篇文章:

  • 下一篇文章:
  • Copyright © 2005-2013 电脑知识网 Computer Knowledge   All rights reserved.