运营推广

布尔代数与搜索引擎的文献检索
2016-05-13 14:16:40
来源:一心网络
摘要:世界上不可能有比布尔代数运算更简单的计算方式了,它只有“0”和“1”两个数字组成。搜索引擎是世界上最复杂的系统之一,而其最重要文献检索却不能离开最简单的布尔代数运算!
布尔代数与搜索引擎的文献检索

世界上不可能有比布尔代数运算更简单的计算方式了,它只有“0”和“1”两个数字组成。搜索引擎是世界上最复杂的系统之一,而其最重要文献检索却不能离开最简单的布尔代数运算!

布尔代数运算元素只有两个:1(TURE,真)和0(FALSE,假)。基本的运算只有“与”(AND)、“或”(OR)、“非” (NOT)。在“与”(AND)运算中,当且只有两个“1”(真)时,其结果才为“1”(真),即:1 and 1 =1 , 0 and 1 =0, 0 and 0 = 0。在“或”(OR)运算中,只要有一个为“1”时,其结果即为“1”,即:1 or 1 =1 ,0 or 1 = 1 , 0 or 0 = 0。在“非”(NOT)运算中,“1”取非后即为“0”,“0”取非后为“1”。

现在看看文献检索和布尔运算的关系。对于一个用户输入的关键词,搜索引擎要判断每篇文献是否含有这个关键词,如果一篇文章含有这个词,我们就给这篇文献一个逻辑词——真(TRUE 或 1),否则,给这这篇文章一个逻辑词——假(FALSE 或者 0)。

比如要找关于”原子能应用的文献,但是不想知道如何制造原子弹。搜索引擎将从通过以下查询语句 “原子能 AND 应用 AND (NOT 原子弹)”,表示符合要求的文献必须同时满足三个条件:包含原子能,包含应用,不包含原子弹。

一个文献对应上面的每个条件都会得到一个TURE 或者 FALSE结果,根据上述真值表就能判断每篇文献是否是要找的。

布尔代数的主要作用是把连续的信息转换成离散信息,从而能对这些信息进行深度处理。搜索引擎在文献检索中同样应用了布尔代数的这个特征把一个个具体的句子拆分成可供参考分析的关键词序列。

中国香港一心网络为您的网站提供全球IDC资源
立即咨询