推外网络专注营销型网站品牌策划与推广
FOCUS MARKETING WEBSITE BRAND PLANNING AND MARKETING PROMOTION
今天在洪波的博客中看到一篇文章:超链分析和PageRank的专利问题,才第一次知道百度总裁李彦宏曾经申请并获得对于超链接分析的专利,我们姑且称之为超链分析专利。而这个专利申请是在Google申请他们自己的PageRank专利之前。
我以前对中文搜索引擎没什么认识,真是孤陋寡闻。看到这篇文章,直觉是如果这两个专利是相似的或有抄袭嫌疑,这牵扯到两家公司的核心利益。对我这样的搜索引擎优化人员来说,也能从中了解百度算法的一些内幕。所以马上去看了李彦宏的专利申请,并再次阅读了GooglePR的专利申请。
我的理解是,这两个专利申请的区别在于,他们谈的根本就是两回事。要解决的问题和实施方法都不一样,虽然研究对象是一样的,都是链接。
超链分析要解决的是文件与搜索关键词的相关性。李彦宏提出的方法是,除了文件本身对关键词的引用外,还需要考虑反向链接中的关键词。
具体来说,一个文件被索引进数据库的时候,会连同指向这个文件的超链接,以及每个超链接当中使用的锚文字(链接文字),一同记录在案。而搜索词也会建立一个数据库,每个词连同含有这个词的超链接,以及这些超链接所指向的文件一同被记录在案。
当一个关键词被搜索的时候,含有以关键词为链接文字的反向链接数目最多的那个文件或网页,将被作为最相关的结果排在前面。
这是基本思路,当然还有其他变量考虑进去。比如说搜索字符串含有几个词的时候,每一个词都是搜索矢量的一个维度。
我比较感兴趣的是,在这篇专利申请中已经提到了词干技术,而且提到了不同文字文件的相关性。
而Google的PR专利显然是专注在已经应用了超链分析之后还不能解决的问题。在Google的专利申请中,明确提到即使在考虑了指向文件的链接及链接锚文字之后,搜索引擎还有重要问题需要解决,那就是来自不同文件的链接有不同的权重值。
你不能指望来自白宫网站的链接和非洲某小镇上一个学生的个人网站上的一个链接,投票值相同。而GooglePageRank就是衡量网页重要性的一个方法。指向一个网页的链接越多,而这些链接本身的权重越高,那么这个被指向的网页的重要性及PageRank就越高。
Google的专利申请当中给出了具体怎样计算这一重要性指标,他们取名为网页级别。网页级别的计算需要进行多个循环的替代计算,才能得到近似于最终结果的PR值。
GooglePR是与搜索词无关的,或者说与文件相关性无关的。它只描述某一个文件的重要性或地位。
就目前所有搜索引擎的表现来看,可以肯定这两个技术都已经被应用在排名算法中了,虽然可能名字不一样。尤其明显的是,虽然Google一直以PR为旗号,很少介绍它们的其他技术。但近一两年来,Google算法中对链接分析,锚文字分析,词干技术的重视越来越多。
这里做的分析完全是针对两篇专利申请所透露的技术问题,对谁先谁后,谁受谁启发等等,无意评论。
热门文章
联络方式:
电话:400-026-0708
邮箱:admin@whytui.com

-
震惊!商家被支付宝截图骗20余万,没想到竟让百度做了背锅侠!
骗子年年有,今年特别多。从P2P的庞氏骗局到互联网的各种诈骗,络绎不绝。可以说互联网改变了我们的生活方式,但是也给骗子创造了更多的骗人方式。有人薅羊毛专盯着一
-
SEO优化没有效果应该从哪几个方面分析
搭建自己或企业网站来进行seo推广,是快速通过网络获取精准客户的重要途径,随着SEO逐步向内容生态化方向发展,很多站长开始自己进行SEO优化,但是有些站长优化效果比较
-
如何做好外链
相信很多刚开始接触seo的朋友经常会听到这么一段话:内容为王,外链为后。耳熟吗?这句话很好理解,内容就是网站一个的灵魂,那么外链则是一个网站关键。今天中涛SEO优化师
-
H5响应式网站是什么?
随着搜索引擎技术的不断,同时也为了满足现代用户对体验的追求,H5网站逐步受到很多企业和站长的青睐。这是为什么呢?相比之前的简单企业展示站在seo优化推广中有哪些
-
网站TDK优化时要注意的问题
网站TDK就是在百度对网站进行抓取时告诉它这个页面是干什么的,会让百度对其了解。网站的质量好不好,都是可以通过网站的TDK看出来的,所以TDK的设置也是网站之中较为