Tag: 全文检索 搜索引擎 系统架构 |
  • 1
预览模式: 普通 | 列表

搜索引擎的系统架构
    这里主要针对全文检索搜索引擎的系统架构进行说明,下文中提到的搜索引擎如果没有特殊说明也是指全文检索搜索引擎。搜索引擎的实现原理,可以看作四步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索→对搜索结果进行处理和排序。  
 1、从互联网上抓取网页
利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集到服务器中。

查看更多...

Tags: 全文检索 搜索引擎 系统架构

北京线点科技 致力于以数据和搜索为核心的业务 (全文检索、舆情监控、搜索引擎产品)http://www.xd-tech.com

分类:全文检索 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 174
  • 1