
产品概述:
中文名称:垂直搜索标准版
英文名称:Vertical Search Engine (Standard)
英文简称:VSE STD
当前版本:2.2
主要面向客户和应用领域:
大中型企业用户,建立中小型的垂直搜索网站系统、网站门户、内外网信息发布;商业情报采集和分析、企业竞争情报系统CIS(Competitive
Intelligence System)新闻监测和分析、情报采集和跟踪。同时,使用内置的从数据库获取索引技术也可以用于搭建站内搜索系统。
功能及特点:
(1)核心技术
| A.网络爬虫/Spider技术 |
|
| B.网页块分析正文抽取 |
|
| C.通过用户自定义分类,聚类 |
|
| D.网页非结构化信息抽取 |
|
| E.面向搜索基于词库的中文切分词 |
|
| F.url和标题去重 |
|
| G.多语言、编码格式自动识别 |
|
| H.搜索引擎与数据库无缝集成 |
|
| I.分布式系统、支持亿级数据检索 |
|
(2)功能列表
| A.常用功能 |
|
|
启动/停止采集
索引数据结构定义
采集规则定义
抽取规则定义
系统信息浏览
|
| B.数据采集 |
|
|
分类管理
网站管理
网站地址管理
URL发生器
地址过滤规则
采集规则定义
抽取规则定义
文件获取规则定义
|
| C.数据处理 |
|
|
数据库连接定义
字段映射关系
|
| D.索引系统 |
|
|
词库定义
登录新词
词库浏览
添加屏蔽词
屏蔽词列表
索引数据结构定义
|
| E.检索系统 |
|
|
分布式/单机开关
查询规则
查询设置
|
| F.分布式工具 |
|
|
分布式状态
|
| G.系统管理 |
|
|
修改密码
设置采集线程数
设置搜索深度
设置采集时间间隔
历史数据删除
日志管理
|
| F.二次开发接口 |
|
|
查询--按条件查询
查询--排序规则定义
查询--按时间排序查询
查询--按相关度排序查询
数据维护--新增一条索引数据
数据维护--修改一条索引数据
数据维护--删除一条索引数据
应用--获取分类列表
|
(3)特点
| A.产品稳定 |
|
|
该版本使用的是2006年公司的垂直搜索标准版的内核,经过长期的测试、销售和使用,该版本已经成熟,产品的功能和性能都已非常稳定。 |
| B.操作简易 |
|
|
该版本经过一年多的销售,吸收了很多客户的合理化的建议,界面美观,简洁,大方,特别在易用性方面提供了非常人性化的操作,在各种操作中都有友好的提示和帮助语句,用户无须太多的专业知识即可熟练使用本产品。 |
| C.多数据库支持 |
|
|
支持各种主流数据库,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等。 |
| D.搜索引擎与数据库技术无缝集成 |
|
垂直搜索普及版支持将采集的数据直接存入用户的数据库中,也支持直接从用户数据库获取数据建立索引,将站内与站外搜索统一起来。更适应当前行业网站的需求。 |
| E.文件自动下载 |
|
如果需要采集图片、Flash、视频等二进制文件,经过简单设置就可以把任意类型的文件保存到本地。 |
| F.自动登录采集 |
|
对于需要登录才能看到信息内容的网站,搜索引擎可以实现轻松登录并采集,甚至即使有验证码也可能穿过登录采集到您需要的信息。 |
| G.分布式支持 |
|
分布式系统支持,可承受更大数据量。达10TB级别。 |
服务器要求:
(1)CPU: P4 2.8以上
(2)内存:2G以上
(3)硬盘:160G以上
(4)网络分配带宽:共享百M,或者独享5M以上
性能指标:
(1)支持分布式多台部署
(2)支持数据量千万级
(3)查询效率 平均0.5s以内
(4)每天可抓取并更新数据量 100万以上
其它服务:
(1)免费mail,QQ,MSN技术支持服务
(2)免费技术论坛支持服务
(3)免费5x8小时电话支持服务
(4)免费二次开发技术支持
(5)免费系统部署服务
(6)一年内免费版本升级服务
(7)终身免费补丁服务
相关链接:
(1)
产品白皮书
(2)
产品操作演示
(3)产品安装说明书(
windows
/
linux)
(4)产品操作说明书
(5)
url发生器API手册(java版)
(6)
url发生器开发手册(js版)
(7)
二次开发API手册
报价:
欢迎来人来电咨询。电话:010-82894756
Email:tianyu@xd-tech.com.cn
咨询论坛
备注:产品描述以产品购买合同的产品白皮书为准,线点科技也可能会根据用户需求对功能进行相应的调整,同时本公司也提供定制开发服务,具体价格根据需求协商。
产品版本比较