求解答 学习搜索引擎

如题所述

1.拿到收据后对数据进行相关性算分,对于每一个网页分配一个docID,对所有查询词建立倒排链,倒排链由所有包含这个词的网页的docID构成。
2.粗排:按DF和pangeRank等指标从查询词相关的几条倒排链中海选出质量比较好的几万个doc,供下一轮精排用。
3.精排:对粗排选出的doc惊醒相关性算分,把分数好的前几百条结果返回给用户。等
温馨提示:答案为网友推荐,仅供参考