开放源代码搜索引擎为人们学习、研究并掌握搜索技术提供了极好的途径与素材,推动了搜索技术的普及与发展,使越来越多的人开始了解并推广使用搜索技术。使用开源搜索引擎,可以大大缩短构建搜索应用的周期,并可根据应用需求打造个性化搜索应用,甚至构建符合特定需求的搜索引擎系统。搜索引擎的开源,无论是对技术人员还是普通用户,都是一个福音。
搜索引擎的工作流程主要分为三步:从互联网抓取网页→创建抓取网页的索引库→从索引库中进行搜索。
首先需要一个能访问网络的爬虫器程序,依据URL之间的关联性自动爬行整个互联网,并对爬行过的网页进行抓取收集。当网页被收集回来后,采用 ...
- 浏览: 11295 次
- 性别:

- 来自: 北京

- 详细资料
搜索本博客
最近加入圈子
最新评论
-
spring MVC
hi coreoak 有该spring mvc出处的链接地址吗?谢谢!代码部分有 ...
-- by feiyu367 -
HTML学习教程
我晕, 怎么下载还需要注册!郁闷, 准备换地方了!
-- by coreoak -
Xquery学习资料目录(目前 ...
感谢楼主,francis@foxmail.com
-- by apple -
Xquery学习资料目录(目前 ...
你好。楼主,麻烦帮我发一份:我的邮箱是:Huaqingfly@gmail.com ...
-- by Huaqingfly -
Xquery学习资料目录(目前 ...
发送过去了, 大家入可以查收!
-- by coreoak






评论排行榜