虚拟主机域名注册-常见问题CMS教程问题 → 织梦CMS


织梦输入网址采集单个网页功能发布 不需要写采集规则一键采集
作者:

梦搏网络一键采集不需要写采集规则,系统自动识别文章正文内容和标题,现已经集成到织梦cms,使用织梦cms的站长有福了,完全可以替换织梦后台自带的“输入网址采集单个网页>>”的功能,首先分析对比下织梦系统自带的“输入网址采集单个网页>>”梦搏网络一键采集有什么区别?

1、织梦自带的“输入网址采集单个网页>>”需要在采集前些每个采集网站的采集规则,而且如果采集网页布局不同也无法公用,这样就导致了,采集网页非常麻烦,还有很多站长并不会写规则,这样也就无法使用这个采集单个网页的功能,编辑发布文章都需要复制标题,在复制内容来人工发布。

2、梦搏网络一键采集主要功能是,改善织梦自带的“输入网址采集单个网页>>”改善之后,只要输入网址就可以采集,支持95%以上的网页,尤其是文章类型的网站,不需要写采集规则,采集前不需要写规则,一切都是系统自动完成。采集的字段包含:标题、缩略图、简介描述、文章正文内容。

下面看下如何修改,只需要在系统的两个文件上面加几行代码就可以,绝不影响系统以后升级。

打开织梦cms的后台目录文章发布文件,默认是:dede/aticle_add.php 和 dede/templets/aticle_add.htm


dede/aticle_add.php增加如下代码

/获取文章最大id以确定当前权重
$maxWright = $dsql->GetOne("SELECT COUNT(*) AS cc FROM #@__archives");
//新增加梦搏网络一键采集
$url="http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key";
$caiji=json_decode(file_get_contents($url));
$caiji_lead_image_url= mb_convert_encoding($caiji->{'lead_image_url'},'gbk','utf-8');//图片
$caiji_word_count= mb_convert_encoding($caiji->{'word_count'},'gbk','utf-8');//字数
$caiji_title= mb_convert_encoding($caiji->{'title'},'gbk','utf-8');//标题
$caiji_content= mb_convert_encoding($caiji->{'content'},'gbk','utf-8');//内容
$caiji_description=preg_replace("/<(\/?.*?)>/si","",$caiji_content);//过滤html标签
$caiji_description = mb_substr($caiji_description,0,80,'gbk');//简介
//
include DedeInclude("templets/article_add.htm");


dede/templets/aticle_add.htm 文件修改如下代码


<td width="150" height="31"><strong><a name="downurl"></a>&nbsp;采集单个网页-URL:</strong></td>
            <td width="320" align="center"><input name="posturl" type="text" id="posturl" style="width:290px" value="<?php echo $geturl; ?>" /></td>

<td width="90">&nbsp;文章标题:</td>
            <td width='408'><input name="title" type="text" id="title" value="<?php echo $title.$caiji_title; ?>" style="width:388px" /></td>


<td width="90"> &nbsp;缩 略 图:</td>
            <td width="560">
                <table width="100%" border="0" cellspacing="1" cellpadding="1">
                <tr>
                  <td height="30">
                  <input name="picname" type="text" id="picname" style="width:240px" value="<?php echo $caiji_lead_image_url; ?>"/>


<td width="90">&nbsp;内容摘要:</td>
          <td width="449"><textarea name="description" rows="5" id="description" style="width:80%;height:50px"><?php echo $description.$caiji_description; ?></textarea></td>

<td width="100%" id="arcBody">
     <?php
       GetEditor("body",$body.$caiji_content,450);
        ?>
       </td>


代码中http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key 请联系http://www.sinmeng.net/ 获取你的key




来源:
阅读:3558
日期:2017-01-05

推荐朋友 】 【 评论 】  【 字体: 】 
上一篇:PHP中替换换行符的3种方法 让多行成为一行
下一篇:html静态页面获取网址url参数的方法
  >> 相关文章
  没有相关文章。
发表评论


点  评: 字数0
用户名:  密码:

  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款