PostgreSQL分词zhparser自定义词典2.0

项目地址:https://github.com/amutu/zhparser
这里不在过多表述,大家看github就可以,主要描述下2.0版本的自定义词典的功能

** 自定义词库2.0 增加自定义词库的易容性, 并兼容1.0提供的功能 **

自定义词库需要superuser权限, 自定义库是数据库级别的(不是实例),每个数据库拥有自己的自定义分词

test=# SELECT * FROM ts_parse(‘zhparser’, ‘保障房资金压力’);
tokid | token
——-+——-
118 | 保障
110 | 房
110 | 资金
110 | 压力

test=# insert into zhparser.zhprs_custom_word values(‘资金压力’);
–删除词insert into zhprs_custom_word(word, attr) values(‘word’, ‘!’);
–\d zhprs_custom_word 查看其表结构,支持TD, IDF
test=# select sync_zhprs_custom_word();

sync_zhprs_custom_word

(1 row)

test=# \q –sync 后重新建立连接
[lzzhang@lzzhang-pc bin]$ ./psql -U lzzhang -d test -p 1600
test=# SELECT * FROM ts_parse(‘zhparser’, ‘保障房资金压力’);
tokid | token
——-+———-
118 | 保障
110 | 房
120 | 资金压力

文章浏览总量 1,625 次

要发表评论,您必须先登录