如何实现涉及多个表的多个字段的全文检索功能(oracle)?

我正在做一个信息系统,数据库用oracle,共有四张表,想实现任意关键字的智能检索,用于检索的关键字涉及四张表的多个字段,是不是要用到全文检索技术?该如何实现?

oracle可以支持多个字段上的全文索引,但如果还涉及到多张表的话,就只能在每张表上建一个全文索引。但这样的话,查询时很不方便。而且如果涉及到的表或者字段发生变化,需要重新建全文索引,可扩展性不佳。

另一个思路是专门建立一张中间表,其中包括以下字段:表名,字段名,字段值,对象ID。在字段值这个字段上建立全文索引。然后定时的将原来四张表中须检索的字段同步到此中间表(可考虑用物化视图)。查询时,直接对此中间表进行查询即可。

举个例子:假设原表是文章表,其中有如下一条数据:
ID 标题 内容 作者
1 德川家康为什么能统一日本? 请教一下,为什么最后是德川家康统一日本呢? 德川家康粉
现在需要检索在标题,内容或作者字段中存在“德川家康”的数据。

首先,需要将原数据同步到中间表,变成以下三条数据:
表名 字段名 字段值 对象ID
文章表 标题 德川家康为什么能统一日本? 1
文章表 内容 请教一下,为什么最后是德川家康统一日本呢? 1
文章表 作者 德川家康粉 1
通过在字段值这个字段上全文检索“德川家康”,可以筛选出以上三条数据。这三条数据都指向文章表中的ID=1的文章。从文章表里取出这条数据,检索就成功结束了。

此方法的优点:一是检索的速度比较快;二是可以兼容指定表或指定字段的检索;三是需要检索的表或字段可以动态删减,可扩展性好。

主要的缺点一是需要一张中间表,并定时同步,消耗额外的服务器资源,二是同步的过程会造成延时,即新修改但尚未同步的数据会暂时检索不到。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2014-02-13
如果这个的话 不建议你用oracle自带的了。
如果你的nvvarchar2貌似最大的字符是4000个。
存大数据的话你得用clob.但是它是2进制的。
检索会有一堆问题的。
建议你集成lucnce.
oracle放数据。
搜索数据用lucnce单独处理。追问

lucnce应该是个不错的方案,但对lucnce不熟悉,时间比较紧,没办法,还是谢谢你。

第2个回答  2014-02-13
大幅度换个房间和规划局和空间来看了