在MySQL字段中使用逗号分隔符的方法分享

更新时间：2012年06月17日 19:59:54 作者：

大多数开发者应该都遇到过在mysql字段中存储逗号分割字符串的经历，无论这些被分割的字段代表的是id还是tag，这个字段都应该具有如下几个共性

被分割的字段一定是有限而且数量较少的，我们不可能在一个字符串中存储无限多个字符
这个字段所属的表与这个字段关联的表，一定是一对多的关系
比如下面这个表结构所代表的content与tag这两个对象

 
mysql> SELECT * FROM content; 
+----+------+| id | tags | +----+------+| 1 | 1,2 | | 2 | 2,3 | +----+------+ 
2 rows in set (0.01 sec) 
mysql> SELECT * FROM tag; 
+----+-------+| id | name | +----+-------+| 1 | php | | 2 | mysql | | 3 | java | +----+-------+ 
3 rows in set (0.00 sec) 

这些原则问题，相信大家在开发过程中已经很熟悉了。但是你在使用这种方法来处理实际问题时，内心一定还是有些许忐忑，因为这种方法或多或少看上去有点像野路子。在那本厚厚的《数据库》教材中，也没有提到这种设计方法，标准的方法似乎是应该使用一个关系映射表在这两个表之间插一杠子，尽管这样会使用效率低下的连接查询。

每个开发者都曾纠结于标准与效率，但我想我们的努力能使这种方法的使用看起来更加标准。注意，以下讨论的使用方法仅限于mysql，但其它数据库应该可以移植。

相关性检索
很多开发者还在使用古老的LIKE方法来实现相关性检索，比如上面那个数据库结构中，content表中的两条记录都有2这个tag，那么怎样在我取出记录1时，把与它tag相关的记录也显示出来呢。其实这也是CMS需要面对的一个基本问题，也就是相关内容的查询。

如果你是一个菜鸟，你可能只会想到LIKE方法，比如先把记录1取出来，然后再把tags字段按逗号分割，最后做一个循环用LIKE检索content表中所有tags字段中包含2的记录，类似这样

复制代码代码如下:

SELECT * FROM content WHERE tag LIKE '%2%' AND id <> 1

但这种方法实在是太慢了，查询次数多不说，LIKE查询本来就是一个比较慢的方法。而且你还要处理前后逗号的问题，总之麻烦是一大堆。

所以让我们静下心来翻翻mysql手册，看看有没有什么惊喜。这个时候，一个名为FIND_IN_SET的函数，会闪着金光映入你的眼帘。让我们看看这个函数的定义

复制代码代码如下:

 
FIND_IN_SET(str,strlist) 
Returns a value in the range of 1 to N if the string str is in the string list strlist consisting of N substrings. A string list is a string composed of substrings separated by “,” characters. If the first argument is a constant string and the second is a column of type SET, the FIND_IN_SET() function is optimized to use bit arithmetic. Returns 0 if str is not in strlist or if strlist is the empty string. Returns NULL if either argument is NULL. This function does not work properly if the first argument contains a comma (“,”) character. 

哦，PERFECT! 简单说来就是寻找一个字符串是否在另一个以逗号分割的字符串中存在的函数，这简直是为我们量身定做的。那么我们的sql就变成

复制代码代码如下:

SELECT * FROM content WHERE FIND_IN_SET('2', tags) AND id <> 1

在翻这些函数的过程中，你应该已经深深地体会到mysql的设计者对以逗号分割存储字段方法的肯定，因为有很多方法就是设计用来处理这种问题的。

这样看起来好多了，一切似乎完美了，是这样吗？其实还没有，如果你的tag比较多，你需要创建多个sql语句，而且有的记录关联的tag比较多，有的比较少，怎么能按照相关性进行排列呢。

这个时候，你可以关注mysql的全文检索功能。这个词你肯定看见过无数回了，但是这么使用的肯定很少，让我们直接看语句吧

复制代码代码如下:

SELECT * FROM content WHERE MATCH(tags) AGAINST('1,2') AND id <> 1

这个语句的优势是显而易见的，你不需要对tags字段做再次分割。那么这种查询的原理是什么呢，稍微了解下MATCH AGAINST的用法就知道，全文检索的默认分隔符是标点符号和stopwords，其中前者正是我们需要的特性。全文检索按照逗号将MATCH和 AGAINST里的字符串做分割，然后将它们匹配。

需要注意的是上面sql仅仅是个例子，如果你直接这么执行，是无法得到任何结果的。原因在以下

你需要对tags字段建立fulltext索引（如果仅仅是测试，可以不做，建索引只是提高性能，对结果没有影响）
每个被标点符号分割的word长度必须在3个字符以上，这才是关键，我们的tag id太短了，会被自动忽略掉，这个时候你可以考虑让id从一个比较大值开始自增，比如1000，这样它就够长了。
你撞到了stopwords，比如你的tags字段是这样的'hello,nobody'，nobody是mysql的一个默认的stop words，它会被自动忽略。stop words是英文中的一些无意义词，搜索的时候不需要它们，类似汉语中的助词等等。但在我们的使用中显然不是用来做搜索的，因此可以在my.cnf文件里，加上ft_stopword_file=''来禁用它

随着WEB技术的发展，相关搜索走SQL的情况越来越少，很多时候只需要用搜索引擎就可以了。但本文的目的并不只是讨论这种方法，而是体现实现这一结果的过程。

您可能感兴趣的文章:

逗号分隔符

Can''t connect to MySQL server的解决办法
ERROR 2003 (HY000): Can't connect to MySQL server on '*.*.*.*' (113)的解决办法
2010-06-06
mac os10.12安装mysql5.7.18教程
这篇文章主要为大家详细介绍了mac os10.12下mysql5.7.18的安装教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-04-04
Centos MySQL 5.7安装、升级教程
这篇文章主要为大家详细介绍了Centos MySQL 5.7安装、升级教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-01-01
MySQL中使用SHOW PROFILE命令分析性能的用法整理
这篇文章主要介绍了MySQL中使用show profile命令分析性能的用法整理,show profiles是数据库性能优化的常用命令,需要的朋友可以参考下
2015-11-11
MySQL系列理解运用union(all)与limit及exists关键字教程
这篇文章主要为大家介绍了MySQL系列中union(all)、limit及exists关键字的教程示例讲解，通过本篇文章就可以理解MySQL中的这些关键字的概念以及实际的运用
2021-10-10
详解Mysql中tinyint与int的区别
本文详细讲解了Mysql中tinyint与int的区别，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-12-12
DDL数据库与表的创建和管理深入讲解使用教程
这篇文章主要介绍了DDL数据库与表的创建和管理，系统架构的层面来看，数据库从大到小依次是数据库服务器(上面安装了DBMS和数据库)、数据库(也称database或者schema)、数据表、数据表的行与列
2023-04-04
windows 10下解压版MySql安装配置方法教程
这篇文章主要为大家详细介绍了windows 10下解压版MySql安装配置方法教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-11-11
mysql-connector-java与Mysql、Java的对应版本问题
这篇文章主要介绍了mysql-connector-java与Mysql、Java的对应版本问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-11-11
全面详解MySQL单行函数分析
MySQL常见的函数分为单行函数和分组函数,单行函数包含字符函数、数学函数、日期函数、流程控制函数等,下面就详细的来介绍一下MySQL单行函数
2023-10-10