当前位置: 首页 > news >正文

网站怎样做货到付款/怎样做网站平台

网站怎样做货到付款,怎样做网站平台,网站建设有什么好建议,开发软件java开源论坛系统http://javabbs.javaz.cnWeb页面信息采集从FreeCMS 2.1开始支持通过简单配置即可抓取目标网页信息,支持增量式采集、关键字替换、定时采集,同一采集规则可采集多个页面(静态和动态),可采集多种信息属性,可自动审核…

java开源论坛系统http://javabbs.javaz.cn

Web页面信息采集

从FreeCMS 2.1开始支持

通过简单配置即可抓取目标网页信息,支持增量式采集、关键字替换、定时采集,同一采集规则可采集多个页面(静态和动态),可采集多种信息属性,可自动审核且静态化信息页面。

采集规则管理

从左侧管理菜单点击采集规则进入。

8e5397e4deeb775079c3c3e2ee8450fc.png

添加采集规则

在采集规则列表下方点击"添加"按钮。

3a54b019f672ed76202258ea0373950a.png

81ea999830f64c6b72c5a4b53354b4db.png

47f9a18bfff316a8d9a574d0975a662e.png

a0ed85f061b25792cd683951a4e15690.png

dfc164e835256316cf9c71c268e270d2.png

3ca0e1ac7a51971c7800ca8c2d45452c.png

64a2d4bd49f1a2b42e6effd1c017153d.png

填写相关属性后点击"保存"按钮即可。

采集规则属性说明

采集规则属性分为基本、设置、采集地址,采集属性,关键词替换。

一般情况下只要在基本选项卡填写相关属性即可完成。如果需要更多高级设置可以使用后面几个选项卡。

下面针对主要属性进行解释说明。

名称:采集规则的名称。

采集到栏目:采集的信息要添加到那个栏目。

页面编码:目标网页的页面编码,默认为UTF-8。

采集地址:目标网页的地址。在基本选项卡中只能设置一个,想要设置多个可以在采集地址选项卡中设置。

采集调度:设置定时执行采集操作,这个设置非常重要,只有设置了采集调度系统才执行采集操作。

内容列表开始结束html:因为系统是通过对目标网页内容进行关键词截取来提取信息属性的,所以设置目标属性的开始结束html就很重要,一定要设置为相对比较唯一的开始结束html,这样系统才能正确的截取到目标属性。此属性主要为了截取目标页面信息列表的html.

内容地址开始结束html:根据上面的属性获取内容列表html后,使用此属性截取各个内容地址。

内容标题开始结束html:根据上面的属性获取内容地址后,系统会抓取此内容地址的网页内容,然后根据此属性截取内容标题。内容相关属性的设置跟此属性类似,下面不再赘述。

状态:启用状态下的采集规则,系统才会执行。

采集图片:将信息内容中的图片下载到本地。

自动审核通过:将采集的信息直接设置为已审核状态。

使用采集信息点击量:默认采集到的信息的点击量为0,设置此属性和内容点击量开始结束html后系统会截取目标信息的点击量,设置为采集后信息的点击量。

最多采集内容数:默认不限制,如果设置了此属性,系统会从采集记录中统计此采集规则已采集了多少条信息,如果超过最多采集内容数,系统将不再采集。

将首幅图片设为标题图片:如果信息内容中有图片,则提取第一张做为标题图片,并设置信息为图片信息。

清除内容中的html标签:将信息内容中的html标签清除,保留纯文本。

当内容为空时是否采集:可设置在内容为空时不采集此信息。

使用采集信息的添加时间:默认采集到的信息的添加时间为当前时间,设置此属性和内容添加时间开始结束html后系统会截取目标信息的添加时间,设置为采集后信息的添加时间。

采集信息添加时间格式:默认格式为yyyy-MM-dd,如果目标页面的添加时间格式不同,需要在这里设置为正确的日期格式。

采集开始时间:默认为当前时间,如果不到采集开始时间,系统是不会采集的。

采集结束时间:默认为永不结束,如果超过采集结束时间,系统是不会采集的。

内容地址补全url:因为有些网页使用的是相对路径或绝对路径,可以设置内容地址的前缀。

图片地址补全url:因为有些网页使用的是相对路径或绝对路径,可以设置图片链接地址的前缀。

内容中A标签链接地址补全url:因为有些网页使用的是相对路径或绝对路径,可以设置内容中A标签链接地址的前缀。

采集地址分为静态和动态地址,静态地址为固定的地址,动态地址一般指可以分页的地址,通过{page}来代表分页变量,可以设置从那一页采集到那一页,如http://www.freetam.cn/list_{page}.html,设置开始页数为1,结束页数为10,系统会自动提取http://www.freetam.cn/list_1.html到http://www.freetam.cn/list_10.html所有页面的数据。

一般情况下我们只采集信息的标题和内容就可以了,系统还提供采集内容描述、点击量、作者、来源、添加时间属性的功能。

通过关键词替换功能,您可以将采集到的信息里面的关键词替换为自己想要的关键词。

编辑采集规则

选择需要编辑的采集规则,然后点击"编辑"按钮。

注意:同时只能编辑一个采集规则。

35923ad57bc6f704134bb85bc60c8c3f.png

填写相关属性后点击"保存"按钮即可。

采集

选择需要采集的采集规则,然后点击"采集"按钮。

注意:同时只能对一个采集规则进行采集操作。

e6532ef9ad4619f1ab2c2b93d92354af.png

ac8f25cf39738aaa51d37d6558e20b0d.png

删除采集规则

选择需要删除的采集规则,然后点击"删除"按钮。

提示:同时可以删除多个采集规则。

87d0993e4c7b2c2eaf6ae45fb3e7e230.png

031cd54d87a337eb9f9560b4cfcb72b8.png

为了防止误操作,系统会提示用户是否删除,点击"确定"完成删除操作。

查看采集记录

从左侧管理菜单点击采集记录进入。

3a897a059a4db1a88aef74d5991dd1a5.png在这里可以查看到所有web页面采集记录,您可以删除指定的采集记录,但并不会删除已采集的信息数据,选择需要删除的采集记录,然后点击"删除"按钮。

提示:同时可以删除多个采集记录。

664fa5cc205dffd49640cbfb397ba305.png

33c6f6417773db018e9d4252154e1823.png

为了防止误操作,系统会提示用户是否删除,点击"确定"完成删除操作。

http://www.lbrq.cn/news/786331.html

相关文章:

  • 衡水建设网站首页/谷歌优化怎么做
  • 手机网站跳转/网络营销网站
  • 网页制作手机软件下载/文山seo
  • 户外保险网站/seo 优化一般包括哪些内容
  • 腾讯云怎么备案网站吗/百度app下载安装普通下载
  • 做网站吉林/刷赞网站推广空间免费
  • 北京国际建设集团网站/企业网站优化工具
  • 在线编辑器/成都百度推广优化创意
  • wordpress 3.2/郑州seo实战培训
  • wordpress 网站建设/万网域名注册查询网
  • 做网站域名/百度官方网
  • 哈尔滨松北区建设局网站/百度招聘官网首页
  • 如何创建自己网站/平谷头条新闻
  • 湛江模板建站多少钱/北京建公司网站价格
  • 那里做网站最好/申请网站怎么申请
  • 做网站收会员费违法吗/现在百度推广有用吗
  • 公司网站维护都需要怎么做/营销型网站的推广方法
  • 开工作室做网站怎样找资源/手机怎么建网站
  • 郑州上街区网站建设公司/百度指数什么意思
  • 公明做网站的公司/上海网站建设咨询
  • 啥网站都能看的浏览器/什么叫关键词举例
  • 顺德网站制作案例如何/农夫山泉软文300字
  • wordpress文章编辑技巧/杭州优化建筑设计
  • 鹤壁专业做网站多少钱/个人怎么做网站
  • 网站 维护方案/产品推广运营的公司
  • 常州做网站yongjiaweb/seo服务商排名
  • 如何选择购物网站建设/南阳seo优化
  • 网络服务器的作用/seo推广效果怎么样
  • 企业网站建设平台/成品网站源码1688免费推荐
  • 怎样才能增加网站/网络平台推广方式
  • History 模式 vs Hash 模式:Vue Router 技术决策因素详解
  • JavaScript 中的流程控制语句详解
  • 2025年8月4日私鱼创作平台v1.0.4公测版更新发布-完成大部分功能包含关注创作者以及发布作品及合集功能优雅草科技
  • FastAPI入门:安全性
  • 第15届蓝桥杯Scratch图形化国赛初/中级组2024年9月7日真题
  • [自动化Adapt] 录制引擎