MySQL FIND_IN_SET 详解：如何正确搜索逗号分隔的值

1 1. 介绍
2 2. FIND_IN_SET 函数的基本语法与行为
3 3. 实际案例
4 4. Comparing FIND_IN_SET with Other Search Methods
5 5. Important Notes and Best Practices
6 6. 常见问题解答 (FAQ)
7 7. 结论

1. 介绍

在 MySQL 中搜索逗号分隔数据的挑战

在使用数据库时，可能会遇到多个值存储在同一列且以逗号分隔的情况。例如，一列可能包含类似 "1,3,5" 的字符串，而你希望只提取包含值 “3” 的记录。

在这种情况下，使用标准的 = 运算符或 IN 子句往往得不到预期的结果。这是因为逗号分隔的字符串被视为单个字符串值，比较是针对整个字符串进行的，而不是针对其中的单个元素。

什么是 FIND_IN_SET 函数？

在这种情形下，MySQL 的 FIND_IN_SET 函数 非常有用。
该函数可以轻松判断指定的值是否存在于逗号分隔的字符串中。

例如，考虑下面的 SQL 语句：

SELECT * FROM users WHERE FIND_IN_SET('3', favorite_ids);

在此查询中，你可以提取 favorite_ids 列（例如 "1,2,3,4"）中包含值 “3” 的记录。

本文目的及受众

本文将从基础到进阶，结构化、清晰地讲解如何使用 FIND_IN_SET 函数。涵盖基本语法、实用示例、与其他搜索方法的对比、重要注意事项以及常见问答，提供 面向真实开发的实用知识。

本文面向的读者包括：

经常使用 MySQL 的 Web 工程师和后端开发者
必须处理已有系统中逗号分隔数据的开发者
在部分匹配和基于值的搜索上遇到困难的 SQL 初学者

2. FIND_IN_SET 函数的基本语法与行为

FIND_IN_SET 的语法

FIND_IN_SET 是 MySQL 用于判断特定值是否存在于逗号分隔字符串中的函数。基本语法如下：

FIND_IN_SET(search_value, comma_separated_string)

例如：

SELECT FIND_IN_SET('3', '1,2,3,4'); -- Result: 3

在此示例中，由于 “3” 出现在第三个位置，函数返回数值 3。

返回值规则

FIND_IN_SET 函数遵循以下规则：

Condition	Result
The search value exists in the list	Its position in the list (starting from 1)
The search value does not exist	0
Either argument is NULL	NULL

示例（返回位置）

SELECT FIND_IN_SET('b', 'a,b,c'); -- Result: 2

示例（未找到值）

SELECT FIND_IN_SET('d', 'a,b,c'); -- Result: 0

示例（包含 NULL）

SELECT FIND_IN_SET(NULL, 'a,b,c'); -- Result: NULL

在 WHERE 子句中的示例用法

该函数最常用于 WHERE 子句中的过滤条件。

SELECT * FROM users WHERE FIND_IN_SET('admin', roles);

在此示例中，仅返回 roles 列包含字符串 “admin” 的行。如果该列的值为 "user,editor,admin"，则会匹配成功。

关于数字与字符串的重要说明

FIND_IN_SET 以字符串形式 进行比较，这意味着它的行为如下：

SELECT FIND_IN_SET(3, '1,2,3,4');     -- Result: 3
SELECT FIND_IN_SET('3', '1,2,3,4');   -- Result: 3

虽然它既可以处理数值也可以处理字符串，但数据类型不明确时可能导致意外行为。因此，最佳实践是尽可能将值显式处理为字符串。

3. 实际案例

在存储逗号分隔字符串的列中搜索

在实际系统中，常会出现多个值（如 ID 或权限）以逗号分隔的形式存储在单一列的情况。例如，下面的 users 表：

id	name	favorite_ids
1	Taro	1,3,5
2	Hanako	2,4,6
3	Jiro	3,4,5

当你想要 “检索包含 3 的用户” 时，FIND_IN_SET 函数极其方便。

SELECT * FROM users WHERE FIND_IN_SET('3', favorite_ids);

执行上述 SQL 将返回 “Taro” 与 “Jiro” 两条记录。

Works Fine Even When Values Look Numeric

即使 favorite_ids 看起来像是数字，FIND_IN_SET 仍然执行 基于字符串的比较，因此最安全的做法是将参数作为带引号的字符串传递。

-- OK
SELECT * FROM users WHERE FIND_IN_SET('5', favorite_ids);

-- Works, but strictly speaking not recommended
SELECT * FROM users WHERE FIND_IN_SET(5, favorite_ids);

为了保持查询的可读性和行为的可预测性，建议显式地将值指定为字符串。

Dynamic Searches (Placeholders and Variables)

在 Web 应用程序中动态生成 SQL 时，通常会使用变量或绑定参数。

如果使用 MySQL 变量，它的写法如下：

SET @target_id = '3';
SELECT * FROM users WHERE FIND_IN_SET(@target_id, favorite_ids);

在应用层（如 PHP、Python 或 Node.js）进行绑定时，也可以使用占位符以类似方式处理。

How to Handle Searching for Multiple Values

不幸的是，FIND_IN_SET 一次只能搜索一个值。
如果想检索包含 “3 或 4” 的记录，必须使用 OR 多次编写查询。

SELECT * FROM users
WHERE FIND_IN_SET('3', favorite_ids) OR FIND_IN_SET('4', favorite_ids);

如果条件变得更复杂，您应该在应用程序中动态构建 SQL，或考虑迁移到规范化的表结构。

4. Comparing FIND_IN_SET with Other Search Methods

Common Alternatives: IN and LIKE

在 MySQL 中，除了 FIND_IN_SET，您还可能看到使用 IN 子句或 LIKE 子句来检查值是否包含。然而，每种方法的行为不同，使用错误的方式可能导致 查询结果不正确。

下面我们来阐明它们与 FIND_IN_SET 的区别以及何时使用每种方法。

Comparison with the IN Clause

IN 子句通常用于检查一个值是否匹配 多个常量值中的任意一个。

-- Example of IN (this does NOT search inside "favorite_ids" for the value 3)
SELECT * FROM users WHERE favorite_ids IN ('3');

在这种情况下，只有 favorite_ids 完全等于 “3” 的记录才会被返回。这意味着像 "1,3,5" 这样的值不会匹配——只有列值恰好为 "3" 的行才会匹配。

相比之下，FIND_IN_SET 检查元素在逗号分隔列表中的位置，能够准确检索包含 “3” 的记录，例如：

SELECT * FROM users WHERE FIND_IN_SET('3', favorite_ids);

✅ 关键使用指南：

IN : 适用于规范化表（例如 SELECT * FROM posts WHERE category_id IN (1, 3, 5) )
FIND_IN_SET : 适用于非规范化的逗号分隔字符串

Comparison with the LIKE Clause

从技术上讲，您可以使用 LIKE 进行部分匹配，但这会带来重要的陷阱。

-- A common mistake with LIKE
SELECT * FROM users WHERE favorite_ids LIKE '%3%';

该查询并不真正表示 “包含值 3”——它会匹配任何包含字符 “3” 的字符串，这可能错误地匹配 "13"、"23" 或 "30" 等。

因此，无法可靠地判断 3 是否作为独立值存在。

✅ 关键使用指南：

LIKE : 适用于模糊文本搜索，但无法识别逗号分隔的边界
FIND_IN_SET : 能准确检查逗号分隔列表中独立值的匹配

Performance Differences

Method	Uses Index	Search Target	Speed
`IN`	Yes	Number or single value	◎ Very fast
`LIKE`	Depends on pattern	Text scan	△ Can become slow depending on conditions
`FIND_IN_SET`	No	Full scan	× May be slow

尤其是，FIND_IN_SET 无法使用索引，常常导致全表扫描。如果您处理的是大数据集，可能需要重新考虑数据模型。

5. Important Notes and Best Practices

Not Compatible with Values Containing Commas

The FIND_IN_SET 函数假设 一个由逗号分隔的简单值列表。因此，如果列表中的某个元素本身包含逗号，函数将无法按预期工作。

错误示例：

SELECT FIND_IN_SET('1,2', '1,2,3,4'); -- Result: 1

以这种方式使用可能会产生错误的匹配，因为整个字符串被不正确地评估。
只有在能够确保 各个值不包含逗号 时才应使用此函数。

性能关注点

由于 FIND_IN_SET 不能使用索引，它会执行 全表扫描。因此，在大表上使用时，查询性能可能会显著下降。

解决方案：

与其存储逗号分隔的值，不如 规范化关系 并在单独的表中管理。
在性能关键的环境中，考虑 临时表展开 或 基于 JOIN 的策略。

例如，如果创建一个中间表如 user_favorites，即可利用索引实现更快的搜索：

SELECT users.*
FROM users
JOIN user_favorites ON users.id = user_favorites.user_id
WHERE user_favorites.favorite_id = 3;

可读性与可维护性

虽然 FIND_IN_SET 看似方便，但它存在若干缺点：

查询不直观（它返回位置值）
添加或删除值比较繁琐
数据完整性难以保证（单列中包含多种含义）

因此，当可维护性和数据完整性重要时，修改模式本身通常是最佳实践。

当必须使用 FIND_IN_SET 时

在某些情况下，你别无选择只能使用逗号分隔的列——例如遗留系统或第三方产品。此时，请考虑以下预防措施：

先应用其他过滤条件以缩小搜索范围
防止格式错误，如双逗号或前后空格
在可能的情况下，在应用层进行补充处理

6. 常见问题解答 (FAQ)

FIND_IN_SET 能使用索引吗？

不能，FIND_IN_SET 不能使用索引。它在内部会拆分并评估字符串，因此无法受益于 MySQL 的索引优化。

因此，在大表上使用可能会 降低查询性能。对于性能关键的系统，建议重新设计模式或对数据进行规范化。

它在数字和字符串混合时能正确工作吗？

一般来说是可以的——但请记住 比较是按字符串进行的。如果数字和字符串混合，可能会出现意外行为。

例如，以下两种写法都会匹配 3：

SELECT FIND_IN_SET(3, '1,2,3,4');     -- Result: 3
SELECT FIND_IN_SET('3', '1,2,3,4');   -- Result: 3

然而，在 FIND_IN_SET('03', '01,02,03') 这种情况下，前导零的格式可能会影响匹配行为。
最安全的做法是 统一值的格式。

如何一次搜索多个值？

由于 FIND_IN_SET 只接受 单个搜索值，如果想搜索包含 “3 或 4” 的记录，需要使用 OR 多次调用它：

SELECT * FROM users
WHERE FIND_IN_SET('3', favorite_ids)
   OR FIND_IN_SET('4', favorite_ids);

如果条件更复杂，考虑在应用层动态构造 SQL，或迁移到规范化的表结构。

FIND_IN_SET 导致性能问题。该怎么办？

以下策略较为有效：

切换到规范化的表设计
先应用过滤条件以缩小搜索范围
仅在处理小数据集时使用
考虑迁移到结构化格式，如全文搜索或 JSON 数据类型

现代 MySQL 版本支持 JSON 数据类型。例如，如果您将 roles 列管理为 JSON 数组，则可以使用 JSON_CONTAINS() 进行灵活且高效的搜索。

FIND_IN_SET 将来会被弃用吗？

截至 MySQL 8.0，FIND_IN_SET 并未正式被弃用。然而，不推荐使用非规范化的数据结构（逗号分隔的列），因此该函数的实际使用预计会随时间而减少。

在重新设计数据库时，理想的做法是采用 规范化结构或基于 JSON 的设计。

7. 结论

回顾 FIND_IN_SET 的特性与优势

FIND_IN_SET 函数在 MySQL 中 在搜索逗号分隔的字符串时极其有用。当您需要在单个列中存储多个值并提取包含特定值的记录时，它尤其方便。

凭借其简洁的语法，它能够检查 独立值匹配，而这在使用 LIKE 或 IN 子句时往往难以准确实现。能够在逗号分隔的列表中检测到独立元素是它最大的优势。

使用时的关键注意事项

与此同时，存在若干 限制和重要注意事项，因此不应在未慎重考虑的情况下过度使用它：

索引无法使用（可能导致搜索变慢）
不兼容包含逗号的值
假设使用的是非规范化结构
仅支持单值搜索（多值搜索需要使用 OR 条件）

了解这些特性对于正确使用该函数至关重要。

何时应该——以及不应该——使用它

Situation	Should You Use It?	Reason
Small dataset, infrequent searches	✅ Yes	Easy to implement and low development cost
Dependent on a legacy system structure	✅ Use selectively	Useful when refactoring is difficult
Large dataset, high-frequency access	❌ Not recommended	Performance degradation becomes significant
Schema can be normalized	❌ Avoid	JOINs or intermediate tables are more efficient

在实践中如何应用

将其视为在现有数据库结构中工作的灵活工具
在决定未来是否采用规范化数据设计时，将其作为参考点
与其把它当作快速修复，不如明确了解该函数的实际作用

对于注重 可维护性和可读性 的开发者来说，最好将其视为一种“暂时使用——最终需要淘汰”的函数。