以接入一个应用类 App 的应用搜索为例。通过该示例将展示如何完成一个搜索服务,并了解应用接入的流程。
在 腾讯云搜 TCS 产品介绍页 单击立即申请,进入“腾讯云搜内测申请”页面,提交内测申请。申请审核通过的用户可直接进入腾讯云搜控制台,然后根据系统提示创建应用。
创建应用
创建应用的目的是需要开发者告诉我们应用的基本信息、用于搜索的字段是哪些,并设置好每个字段的搜索属性。
填写基本信息
- 应用名称:应用的名称,例如,XX公司_XX产品_XX应用。
- 应用描述:填写所创建的应用信息、需求信息等,以便于管理员审核。
定义应用结构
开发者需要在“定义应用结构”页面配置用于搜索服务的数据。这些数据将用于搜索结果的召回、排序、筛选等。用户可以采用“用户自定义”模板或其他内置模板。其中资讯类模板、小说类模板和应用类模板为典型的数据模板,相对于用户自定义模板,融合了大量纠错、排序方面的经验与模型。
配置文本域字段:
文本域适合于文本类型的数据,是希望被用户搜索到的字段,主要用于搜索结果的召回。
- 字段名称:数据字段名,仅支持英文和下划线,必填。
- 字段描述:描述该字段代表的含义,选填,对搜索结果无影响。
- 数据长度:指该字段文本的最大长度,允许设置一个长文本字段。
- 重要性:对影响搜索结果排序的因子“文本相关性”造成影响。主要有不重要、一般、重要、很重要和非常重要五种层级。
如应用网站的应用名、应用别名、开发者名、app描述均属于文本域字段。详见下图:
配置数值域字段:
数值域字段适用于数值类型的数据。如评分、下载量、大小、评论量等。该字段中的字符串值必须可以转化为数字,主要用于搜索的排序。
数值域字段必须包含一个主键和权威字段。
- 主键:用来唯一标识一条数据,该字段用于向您返回结果时使用。此字段必须为可转化为数字的值,该值建议在 uint64_t 的范围内,采用 Hash 值等产生。
- 权威字段:数值域中最能代表一条数据好坏的数值字段。例如,视频可以以播放量衡量好坏,商城以交易量衡量。云搜排序模块会给予权威数值高的结果进行打分调权,提升排序,权威度低的适当降低排序。
- 数据类型:用户根据该数值可能的最大范围来选择,如果实际值超过配置的范围,将会出错。经纬度只能选择浮点型。
如应用网站中 appid、下载量、装机量、应用评分数属于数值域字段。其中 appid 属于主键;五星评分数属于权威,最能代表一个应用的重要程度。详见下图:
分类域字段配置:
用于分类检索的字段,主要满足对搜索结果按照分类筛选的需求,不用于搜索。将不进行分词处理,整体创建索引。字段可根据需要添加,如下图,添加完成后,单击保存并下一步。
确认明细
明细展示应用之前所填写的所有信息,包括应用基本信息、应用结构等,以便于用户确认。根据页面提示完成确认信息后,由于需要为您配置服务,因此需花费一些时间。
创建成功
创建成功后,如果您是首次使用,建议您选择体验版,可以免费试用一段时间,最多可以拥有5个体验版应用。单击【现在试用】进行试用。如果您已经试用过,也可以直接购买搜索服务,购买流程详见 购买指导。
单击现在试用后,您已获得试用权限,将进入如下页面。
数据上传
搜索先要有数据,您需要按照创建应用时设置的字段及属性,提供相应的数据。腾讯云搜现阶段支持 API、SDK、页面文件上传三种方式。
通过 API、SDK 上传数据,请参照 API 使用手册。本文通过页面文件上传的方式体验此功能。接口使用方法详见 API 使用说明。
在应用管理 > 基本信息中,单击上传数据。
数据格式为 json 格式,可参考数据模板添加。如果您的配置为:
则您可以按照如下提供数据:
{
"content":{
"TA":"新闻一",
"TB":"小王家种出了新型可食用植物",
"NA":"12304",
"NB":"民生类",
},
{
"TA":"新闻二",
"TB":"娱乐圈新出一女生组合",
"NA":"12305",
"NB":"娱乐类",
},
"op_type":"add"
}
搜索
上传数据后,可在应用管理 > 体验测试中体验搜索服务。腾讯云搜还可以通过 API、SDK 检索接口进行搜索,接口使用方法详见 API 使用说明。单击高级搜索可体验更多搜索参数配置。
至此,您已经享受了基本的搜索服务。如果您对搜索服务有更高的需求,可以参照高级组件部分进行配置。同时,可以在应用管理中修改上面创建应用过程中的配置。