背景知识:搜索引擎的质量指标一般包括相关性(Relevance)、时效性(Freshness)、全面性(Comprehensiveness)和可用性(Usability)等四个方面,今天我们要谈的索引量就属于完整性指标的范畴。
阅读全文:如何测试搜索引擎的索引量大小(前篇)
阅读全文:DB2 XML 全文搜索之为文本搜索做准备
本节简要讨论这两种任务,使用的示例针对 清单 1 中定义的 “product” 表。注意,“product” 表的 “description” 和 “comments” 列是 XML 类型的(换句话说,“description” 和 “comments” XML 文档原生存储在数据库中)。
其实上次Matt所透露的仅仅是其中一方面的内容。今天,Matt再次写了一篇非常详细的文章,解释了Google的各种bot是怎样抓取网页的,以及Google最新的BigDaddy在抓取网页方面有什么新的变化等等,内容非常的精彩,所以和大家分享一下。
阅读全文:Google工程师解释Googlebot抓取网页的原理
Google搜索引擎是怎样工作的?你可能已经会答:用户输入搜索词,Google从数据库里匹配相关内容,再将内容以搜索结果形式返回界面。
阅读全文:Google工作原理演示动画
如今的消费者在数码设备上面临越来越多的选择,如PC、PDA、DVR、iPod、MP3和DVD播放器。每一种设备所提供的程序设计都不易被其他设备享用。比如,你不可能在iPod上看博客,也不能在你的黑莓手机上看《黑道家族》。
阅读全文:搜索引擎服务的新商机
整理了一下Google对Blog文章在其搜索结果中排名的一些规则。这些规则不是凭空杜撰,而是来自一份Google所登记的专利文件。在这份文件中,Google描述了他们评价Blog的一些标准。理所当然,他们会成为Blog在Google中排名的依据。
阅读全文:Google是如何对Blog文章排名的
WEB结构化信息抽取就是将网页中的非结构化数据按照一定的需求抽取成结构化数据。是垂直搜索引擎和通用搜索引擎最大的差别。
阅读全文:WEB网页结构化信息抽取技术介绍
搜索做得好不好不仅仅是算法的事情,更重要的是对用户意图的理解,所以搜索引擎的竞争有两个点:1.破解用户之意 2.切返用户之需。
阅读全文:网页搜索引擎竞争分析
【摘要】:仅仅做到被搜索引擎收录并且在搜索结果中排名靠前还很不够,实际上并不一定能增加用户的点进率,更不能保证将访问者转化为顾客或者潜在故顾客。实现高层次的目标,还需要进一步对搜索引擎进行优化设计,设计从整体上对搜索引擎友好的网站。网站设计对搜索引擎友好,他所反馈的结果才更能吸引用户点击,网站才可以获得更多的访问量,取得最好的营销效果。
阅读全文:搜索引擎营销的目标层次及网站优化设计