贵阳小蚊子网络科技有限公司

 /uploads/allimg/190116/1-1Z1161KP30-L.jpg
 /uploads/allimg/190116/1-1Z1161JH20-L.jpg

SEO网站优化:网站优化内容处理和牵引(二)

Time:2019-01-12 Author:焦文
网站优化内容处理和牵引(二)
 
(5)去除重复内容
同一篇文章出现在不同网站及同一网站不同网址,搜索引擎并不喜欢这样重复的内容,这样大大降低了用户的体验度,搜索引擎即可屏蔽这样的网页。搜索引擎希望只是希望在返回到相同的页面,所以在进行搜索引擎需要对于页面的识别去重。
(6)正向牵引
经过文字提取、分司、消噪、去重后,搜索引擎得到的就是独特的,能反应页面主体内容、以词为单位的内容。接下来搜索引擎索引程序就可以提取关键按照分词程序划分好的词把页面转负为由关健同组成的集合,同时记录每个词在页面上的出现频率,出现次数、格式(如标题标签,用体、H标签、铺文字位置(如页面第1段文字等)。这样,每一个页而都可以记录为串关键词的集其中每个关键词的词频、格式、位置等权重信息也都记录在案。
(7)倒排牵引
正向素引还不能直接用于排名。假设用户搜索关键词“2",如果只存在正向牵引,那么排名程序需要扫描所有索引库中的文件,找出包含关键词“2" 的文件,再进行相关性计算。这样的计算量无法满足实时返回排名结果的要求。因此需索引擎将正向索引数据库重新构造成倒排索引,把文件到关键词的映射转换为词到文件的映射。