一、ngram and MeCab full-text parser插件

全文检索在MySQL里面很早就支持了,只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符,而对于中文来讲,显然用空格就不合适,需要针对中文语义进行分词。但从MySQL 5.7开始,MySQL内置了ngram全文检索插件,用来支持中文分词,并且对MyISAM和InnoDB引擎有效。


二、必要的参数设置

在使用中文检索分词插件ngram之前,先得在MySQL配置文件里面设置他的分词大小(默认是2),比如,

[mysqld] 
ngram_token_size=2


三、添加全文索引

创建表的时候添加

CREATE TABLE article ( 
    id BIGINT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, 
    title VARCHAR(200), 
    body TEXT, 
    FULLTEXT (title,body) WITH PARSER ngram 
) ENGINE=InnoDB CHARACTER SET utf8mb4;

也可以修改表

alter table 表名 add fulltext index 索引名(列1,列2...) with parser ngram;


四、全文搜索


1.按自然语言搜索模式查询 (默认)

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('关键词' IN NATURAL LANGUAGE MODE)

2.按布尔全文搜索模式查询 

(1)匹配既有管理又有数据库的记录 

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('+数据库 +管理' IN BOOLEAN MODE)

(2)匹配有数据库,但是没有管理的记录 

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('+数据库 -管理' IN BOOLEAN MODE)

(3)匹配MySQL,但是把数据库的相关性降低

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('>数据库 +MySQL' IN BOOLEAN MODE)





赞助本站,网站的持续发展离不开你们的支持!一分也是爱ヾ(◍°∇°◍)ノ゙
 本文链接: ,花了好多脑细胞写的,转载请注明链接喔~~
登陆
      正在加载评论