月度归档:2013年08月

wordpress后台上传主题插件提示需要输入FTP信息如何处理?

之前群里一个朋友问小V为什么他的wordpress网站搬到新空间后在后台安装插件或主题都提示需要输入FTP信息呢?其实这是因为服务权限设置造成的问题,如果是自己的VPS或独服呢,可以登录ssh执行以下命令:

chmod -R 755 /home/wwwroot
chown -R www /home/wwwroot

其中的目录修改为你网站在服务器的绝对路径,相信有实力用VPS或独服的站长不会连网站的绝对路径都找不到吧?如果不是在VPS上出现以上问题该如何处理呢?我们有两种处理方法:

方法一:在网站根目录的wp-config.php中加入以下代码,

define("FS_METHOD", "direct");
define("FS_CHMOD_DIR", 0777);
define("FS_CHMOD_FILE", 0777);

方法二:还是在网站根目录的wp-config.php中加入代码:

define('FTP_HOST', 'ftp主机');
define('FTP_USER', 'FTP帐号');
define('FTP_PASS', 'FTP密码');

本来小V是不想写这篇文章的,因为网上同样的代码太多了,不过想了想还是记录下,不为别的,就为了让更多遇到同样问题的新人看到这篇文章。

搜索引擎抓取系统概述(二)

编者按:之前与大家分享了关于搜索引擎抓取系统中有关抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程的内容,今天将于大家分享搜索引擎抓取系统第二部分内容—spider抓取过程中的策略。

spider在抓取过程中面对着复杂的网络环境,为了使系统可以抓取到尽可能多的有价值资源并保持系统及实际环境中页面的一致性同时不给网站体验造成压力,会设计多种复杂的抓取策略。以下简单介绍一下抓取过程中涉及到的主要策略类型:

1、抓取友好性:抓取压力调配降低对网站的访问压力

2、常用抓取返回码示意

3、多种url重定向的识别

4、抓取优先级调配

5、重复url的过滤

6、暗网数据的获取

7、抓取反作弊

8、提高抓取效率,高效利用带宽

1、抓取友好性

互联网资源庞大的数量级,这就要求抓取系统尽可能的高效利用带宽,在有限的硬件和带宽资源下尽可能多的抓取到有价值资源。这就造成了另一个问题,耗费被抓网站的带宽造成访问压力,如果程度过大将直接影响被抓网站的正常用户访问行为。因此,在抓取过程中就要进行一定的抓取压力控制,达到既不影响网站的正常用户访问又能尽量多的抓取到有价值资源的目的。

通常情况下,最基本的是基于ip的压力控制。这是因为如果基于域名,可能存在一个域名对多个ip(很多大网站)或多个域名对应同一个ip(小网站共享ip)的问题。实际中,往往根据ip及域名的多种条件进行压力调配控制。同时,站长平台也推出了压力反馈工具,站长可以人工调配对自己网站的抓取压力,这时百度spider将优先按照站长的要求进行抓取压力控制。

对同一个站点的抓取速度控制一般分为两类:其一,一段时间内的抓取频率;其二,一段时间内的抓取流量。同一站点不同的时间抓取速度也会不同,例如夜深人静月黑风高时候抓取的可能就会快一些,也视具体站点类型而定,主要思想是错开正常用户访问高峰,不断的调整。对于不同站点,也需要不同的抓取速度。

2、常用抓取返回码示意

简单介绍几种百度支持的返回码:

1)  最常见的404代表“NOT FOUND”,认为网页已经失效,通常将在库中删除,同时短期内如果spider再次发现这条url也不会抓取;

2)  503代表“Service Unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。

3)  403代表“Forbidden”,认为网页目前禁止访问。如果是新url,spider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。

4)301  代表是“Moved Permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们推荐使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。

3、多种url重定向的识别

互联网中一部分网页因为各种各样的原因存在url重定向状态,为了对这部分资源正常抓取,就要求spider对url重定向进行识别判断,同时防止作弊行为。重定向可分为三类:http 30x重定向、meta refresh重定向和js重定向。另外,百度也支持Canonical标签,在效果上可以认为也是一种间接的重定向。

4、抓取优先级调配

由于互联网资源规模的巨大以及迅速的变化,对于搜索引擎来说全部抓取到并合理的更新保持一致性几乎是不可能的事情,因此这就要求抓取系统设计一套合理的抓取优先级调配策略。主要包括:深度优先遍历策略、宽度优先遍历策略、pr优先策略、反链策略、社会化分享指导策略等等。每个策略各有优劣,在实际情况中往往是多种策略结合使用以达到最优的抓取效果。

5、重复url的过滤

spider在抓取过程中需要判断一个页面是否已经抓取过了,如果还没有抓取再进行抓取网页的行为并放在已抓取网址集合中。判断是否已经抓取其中涉及到最核心的是快速查找并对比,同时涉及到url归一化识别,例如一个url中包含大量无效参数而实际是同一个页面,这将视为同一个url来对待。

6、暗网数据的获取

互联网中存在着大量的搜索引擎暂时无法抓取到的数据,被称为暗网数据。一方面,很多网站的大量数据是存在于网络数据库中,spider难以采用抓取网页的方式获得完整内容;另一方面,由于网络环境、网站本身不符合规范、孤岛等等问题,也会造成搜索引擎无法抓取。目前来说,对于暗网数据的获取主要思路仍然是通过开放平台采用数据提交的方式来解决,例如“百度站长平台”“百度开放平台”等等。

7、抓取反作弊

spider在抓取过程中往往会遇到所谓抓取黑洞或者面临大量低质量页面的困扰,这就要求抓取系统中同样需要设计一套完善的抓取反作弊系统。例如分析url特征、分析页面大小及内容、分析站点规模对应抓取规模等等。

来源:百度站长平台

WordPress的Connect是个败笔

WordPress的开发公司Automattic刚刚宣布推出了一项Connect功能,即WordPress Connect。很简单,功能与Facebook Connect,就是账号绑定登录。但这个Connect功能仅限于WordPress.com,即WordPress自运营的博客平台的用户。

拥有WordPress.com账号的用户可以在绑定该登录插件的网站或应用直接登录。几个已经绑定的网站有Akismet、VaultPress以及Polldaddy,感兴趣的读者可以试用一下。

WordPress的开发团队对Connect这个产品的优势做了如下描述:

让千百万WordPress.com用户能够直接登录你的网站或应用;

5月份在宣布获得老虎基金5000万美元投资的时候,Automattic公司的CEO Matt Mullenweg说WordPress.com的注册用户从5年前的400万增至了5000万人。这个成绩确实值得庆贺。但问题是,作为一个绑定登录功能,仅有5000万用户能说服开发者吗?

我倒觉得,真正需要绑定第三方账号系统的其实是WordPress.com自己,例如Facebook、Twitter有数十亿用户的平台级网站等。而不是Wordpress.com拿出“仅仅”5000万的用户去给别的网站做绑定

用户数量不是最重要的。虽然只有5000万,但也不妨推出一个绑定功能,给WordPress.com的忠实用户更多的拓展选项总是没错的。但是做账号绑定,WordPressc.com有一个巨大的缺点,那就是缺乏社交性。

WordPress.com是个博客平台,不是个社交平台。这样,某个App绑定WordPress.com的账号后,就无法实现好友间的互联。例如导入联系人、推荐给好友等这些移动互联网服务需要的基本社交模块就无法实现。

兼容现有登录系统,既可以独立使用也可以与其他账号系统共存;

如果一个网站或App已经绑定了Facebook或Twitter,开发者还会去再接入一个用户数量根本不在一个级别的WordPress.com吗?大多数人都有Facebook账号,因为社交是个硬性需求;但没有10亿人拥有博客账号,因为不是谁都喜欢写博客,更不是谁都能坚持高频率登录自己的博客。

借用WordPress.com的信任关系。

这是说,用户在用WordPress.com账号登录其他网站是,调用的是WordPress.com的网络证书。而无需去维护多个网络账号。这是句实话。但是,Facebook、Twitter难道不是吗?

总之,WordPress的这个Connect功能由于平台自身的成熟程度和属性限制,无法实现与Facebook、Twitter一样的用户体验。

虽然每个WordPress.com的“控制台”(Dashboard)所蕴含的信息量很大,但是Connect只允许访问用户的Profile Information(个人资料)。而熟悉WordPress后台的读者都清楚,这个模块所包含的信息并不多,一般用户也会可以完善,因为有些是无法公开显示,缺乏社区基础也让这些信息变得更加没用。

如果Connect能够抓取用户的博文,那么还是有不小的价值的。比如可以开发一款App开集成WordPress.com上的博客内容,用户通过WordPress.com账号登录后可以授权这款App抓取内容,做成一个博文检索或社区系统还是挺有意思的。

本文转自:时空变幻

wordpress 3.6为我们带来什么新特色?

经过了近8个月的开发,WordPress 3.6今天正式发布了。WordPress 3.6开发代号为Oscar,带来了一款漂亮的博客样式的主题,还改善了文章修订、文章版本比较、登录过期处理、对自定义菜单功能的修改等。下面是一些主要特色说明。

新的用户创建菜单界面

许多用户经常发现创建菜单是费劲的。WordPress 3.6 采用了新的且简单的用户界面去创建和编辑站点菜单。有两个选项卡,一个用于编辑菜单,另一个用于管理位置。新的界面更加易于使用。

wordpress 3.6为我们带来什么新特色?-wordpress资讯-代码笔记 %

提升了自动保存功能

现在无需担心创作文章时丢失内容了。WordPress 3.6提升了自动保存功能。最令人注意的提升是 WordPress 现在实现了浏览器保存和wordpress数据库修订保存。 WordPress尽力匹配当前修订版本与浏览器保存内容,并找到他们的不同。这个功能的提升,让我们在创作文章的时候不用担心断网而导致内容的丢失了。

wordpress 3.6为我们带来什么新特色?-wordpress资讯-代码笔记 %

提升了修订比较

wordpress会自动保存文章,很多时候我们觉得这个功能不好。因为貌似只是多了一个保存功能,要看他们之间的不同还需要打开进行比较。但是如果多年后,再看不同的修订的时候,是很麻烦的。所以wordpress3.6对此进行了伟大的改变。就是采用了一个bar并用高亮的方式显示它们的不同。

wordpress 3.6为我们带来什么新特色?-wordpress资讯-代码笔记 %

登录通知

有时我们会发现wordpress登录过期了,这可能的原因是cookie过期或删除,管理员修改了安全密匙。这意味着你不得不返回重新登录。带来的严重后果就是丢失重要的内容如设置等。WordPress 3.6 现在解决了这个问题。他会以加黑背景及显示一个登录窗口的方式提醒你。

wordpress 3.6为我们带来什么新特色?-wordpress资讯-代码笔记 %

wordpress 3.6显然在3.5的基础上修改是不大的,我想这主要是为了保持wordpress的连续性。另外还有一些特色是需要主题支持的。

原文转载自:点金主题网(译)

wordpress网站更换域名的几种方法

越来越多的人开始使用wordpress建站了,有个人博客,也有CMS网站,各式各样的wordpress网站如春雨后的竹笋般争相冒头。建站时间长久了难免会遇到需要更换域名的情况。由于wordpress程序的特殊性,直接将新域名解析过去是行不通的,因为wordpress中所有的链接都使用的是绝对路径。

下面小V教大家如何为wordpress网站更换域名:(PS:在更换域名之前先要保证你的新域名和老域名都已经正确的解析好了,能访问到网站。)

方法一:使用wordpress常量定义网站域名

打开网站根目录下的wp-config.php文件,加入以下代码:

define('WP_HOME','http://www.v7v3.com');
define('WP_SITEURL','http://www.v7v3.com');

方法二:

登陆phpmyadmin,选择自己网站的数据库,然后点击SQL,将下面三行命令输入进去:

UPDATE wp_options SET option_value = replace(option_value, 'http://www.v7v3.com', 'http://v7v3.com') WHERE option_name = 'home' OR option_name = 'siteurl';
UPDATE wp_posts SET post_content = replace(post_content, 'http://www.v7v3.com', 'http://v7v3.com');
UPDATE wp_posts SET guid = replace(guid, 'http://www.v7v3.com','http://v7v3.com');

www.v7v3.com是老域名,v7v3.com是新域名。

另外有些站长可能希望自己的wordpress网站可以通过多个域名来访问,那么小V这里就一并写了,方法如下:

打开网站根目录下的wp-config.php文件,加入以下代码:

$domain = $_SERVER[ 'SERVER_NAME' ];
define( 'WP_HOME', 'http://' . $domain );
define( 'WP_SITEURL', 'http://' . $domain );

以上就是wordpress网站绑定多个域名的方法。

wordpress页面模板分配插件:page theme

今天小V要给大家介绍一款功能非常实用的wordpress插件:page theme。page theme的汉译为页面主题,从字面意思我们就不难看出该插件的作用。相信很多朋友会发现一些大网站在制作某些专题文章页面时会用一些比普通文章页面要绚丽很多的页面来编写文章。而page theme插件的功能就是可以单独的自定义某篇文章所启用的主题,也就是说你是用的是默认主题,但是你可以让文章页使用其他的主题样式,此功能非常实用。

各个版本的wordpress寿命

wordpress3.6正式版已经发布了有一段时间了,不过比官方团队预计的时间要晚很多。最初wordpress官方团队预计是在13年4月底发布3.6正式版的,然而却拖到了13年8月初才发布。据统计,wordpress V3.5.X版本的寿命为234天,那么和以前的wordpress版本的寿命做比较呢?根据维基百科上的数据来计算,平均每198天就会出现一个新的wordpress版本。最古老的wordpress是wordpress 2.0,并且一年多没有更新(2005年12月-2007年1月)。从2.1版本开始wordpress的更新步伐就开始加快了,每更新一个新的版本的时间间隔大约是4-6个月。

wordpress版本更新数据图:

各个版本的wordpress寿命-wordpress资讯-代码笔记

wordpress回到顶部插件:Dynamic To Top

今天小V给大家介绍一款比较实用的wordpress插件,Dynamic To Top返回顶部。这款返回顶部插件比一般的wordpress返回顶部插件更加强大,一般的回到顶部插件只能显示文字。而今天小V介绍的这款回到顶部插件Dynamic To Top不仅可以使用文字、图标、而且还加入了css3特效,可以自定义位置、图标的边框大小及宽度、颜色等等。

完美的wordpress网站10步加速优化曲

    之前有很多朋友问小V,v7v3.com用的是哪里的空间速度真不赖,刚开始小V说是美国洛杉矶的空间,有些朋友还不信,小V只好叫他们自己去ping一下咯。很多朋友知道v7v3用的是美国空间后又开始和小V讨教wordpress加速的方法来了,其实wordpress优化加速很简单,下面小V就来整理下自己所总结的wordpress加速优化方案。(PS:此篇教程只适合有wordpress建站基础的朋友借鉴,如果是刚使用wordpress的新人那么最好现在其他空间测试后再使用,以免造成网站出错!)

    一、压缩当前主题中的js与css文件,压缩工具随便百度谷歌一下,一大把的在线压缩工具。

    二、将压缩后的js与css文件上传至cdn,并替换掉主题中js与css文件的链接。(CDN注册地址

    三、将主题中不会经常变动的参数静态化。(如:网站名称、页面编码、页脚)

    四、使用相对链接结构,减少页面代码字符数量,wordpress中调用相对路径链接代码:(参考链接:wordpress加速优化教程:使用相对链接

    add_action( 'template_redirect', 'v7v3_urls' );
function v7v3_urls() {
    if ( is_feed() || get_query_var( 'sitemap' ) ) //判断是否为feed页面或者sitemap页面。
        return;
    $filters = array(
        'post_link',
        'post_type_link',
        'page_link',
        'attachment_link',
        'get_shortlink',
        'post_type_archive_link',
        'get_pagenum_link',
        'get_comments_pagenum_link',
        'term_link',
        'search_link',
        'day_link',
        'month_link',
        'year_link',
    );
    foreach ( $filters as $filter )
    {
        add_filter( $filter, 'wp_make_link_relative' );
    }
}

    五、使用WP-HTML-Compression插件去除HTML代码中的换行以及空格。(WP-HTML-Compression插件下载

    六、开启页面Gzip压缩,Gzip代码如下:

    function gzippy() {
ob_start('ob_gzhandler');
}

    七、开启静态文件缓存,设置文件缓存时间。

    八、优化整理数据库。(wordpress数据库优化教程(一) wordpress数据库优化教程(二)

    九、开启dns预取,加速网站页面解析。(wordpress Dns预取教程

    十、开启wordpress对象缓存,加快WordPress中php代码的解析速度,方法如下:

    1、memcached缓存:

    下载memcached缓存插件,下载地址:百度网盘

    将压缩包中的 object-cache.php 文件解压并上传至 wp-content 文件夹。(PS:插件会自动启用,无需设置。需要服务器支持memcached组件)

    

    2、eaccelerator缓存:

    下载eaccelerator缓存插件,下载地址:百度网盘

    将压缩包中的 object-cache.php 文件解压并上传至 wp-content 文件夹。(PS:插件会自动启用,无需设置。需要服务器支持eaccelerator组件)

    

    温馨提示:第四与第六条的代码是加入到主题的 functions.php 文件中,第十条的两种缓存只需要选择其中一种,依服务器配置而定(本站用的是eaccelerator缓存)。

解读为何搜索引擎蜘蛛对你的原创内容提不起劲头

对于我们的站点来说我们知道要获得搜索引擎的收录,第一步就要要获得搜索引擎蜘蛛的爬行,但是很多站长在现实的操作中都会发现网站有蜘蛛光临,但是蜘蛛好像都提不起劲,不想收录网站的内容。作为站长我们每天辛辛苦苦的写原创内容目的就是为了能够让蜘蛛爬行收录,但是假如蜘蛛提不起劲不收录,的确是让很多站长很苦恼。笔者也曾遇到过这种情况,在不断的处理与总结中笔者发现了几点细节,下面笔者就与大家分享这个问题的原因。

  来自自身网站的原因,具体可以从以下几个细节进行分析

  1:你的网站是个“新手”,我们知道搜索引擎知足总是喜欢欺负这个刚上线的“新手”,对于新手的不信任使得搜索引擎蜘蛛在收录上格外小心。针对这一问题站长大可不必担心,信任并不是一两天就可以获得的,只要我们的站点保持在一个稳定的环境并持续的更新内容,相信你的站点很快就会有收录了。

  2:站点被降权或者被K,假如我们的站点被搜索引擎降权或者被K,内容不被搜索引擎蜘蛛收录也是情有可原的。对于我们的站点来说我们要进行深入的检讨,找出问题并加以改正,相信搜索引擎蜘蛛会重新信任并收录你的站点。

  3:网站出于被降权的前兆。搜索引擎蜘蛛对于站点的收录提不起劲也有可能是站点可能出于被搜索引擎降权的前兆。此时我们需要更加谨慎的留意站点近期的情况,分析自己是否有什么错误的操作。同时我们也需要检查一下我们的友情链接,避免自己的站点被其他站点所牵连。

  搜索引擎对于原创内容提不起劲也有可能是来自内容本身,我们可以从以下几个细节进行分析。

  1:我们的内容与站点的主题不相符。举个例子,比如你是是一个书法网站,你需要提供的内容为是楷书字帖下载、行书字帖下载等内容,但是假如你提供的是一些娱乐资讯,与网站的主题相差十万八千里,那么搜索引擎蜘蛛自然而然对于你的内容提不起劲,因为搜索引擎蜘蛛也不是傻子。

  2:文章的质量有待提高。搜索引擎蜘蛛在爬行的过程中也会分析文章的质量,假如我们的文章是一些结构杂乱、主题混乱的文章,搜索引擎蜘蛛为了用户体验也会不喜欢这些内容的,粗制滥造的劣质文章已经不能入蜘蛛的“法眼”。

  3:文章中避免出现一个敏感字眼。这点尤其是对于国内大多数主要做百度优化的站长来说。我们知道作为国内最大的搜索引擎,其蜘蛛所爬行的内容肯定会更加的受到媒体及相关机关的关注。其在爬行一些页面中也会更加关注是否有敏感字眼,对此我们内容也需要尽量避免出现搜索引擎蜘蛛所感到敏感的字眼。

  一篇原创的内容并不是说搜索引擎蜘蛛就会百分百收录的,其中往往存在很多细节左右着搜索引擎蜘蛛是否收录,作为站长我们并不能说凭借着自己的一股蛮力,不断的推出原创的内容,有时我们更需要坐下来想想什么内容才能更加让搜索引擎蜘蛛起劲。

转自:A5站长网