首先,要制作搜索引擎,我们首先要了解,什么是正排索引,什么是倒排索引,这是一个搜索引擎的关键。
1.正排索引
就比如这个表格,我们每一个网站对应了一个id,我们通过这个id,就可以访问到对应的网站。
文档id | 文档 |
---|---|
1 | 小米汽车 |
2 | 小米手机 |
3 | 小米家具 |
4 | 小米公司 |
2.倒排索引
关键词 | 文档id |
---|---|
小米 | 1,2,3,4 |
手机 | 2 |
然后我们再根据文档id去找到文档,从而实现了一个正排倒排索引的配合,达到我们搜索的目的。
这里的倒排索引我们可以用一个关键词匹配到的文档id用一个vector来存储,然后关键词对应着一个vector,那我们就可以想到用unordered_map来存储,
建立关键词<->文档id的一个映射关系。