sql拆分字符串实现一行变多行
创始人
2024-11-11 03:05:46

一、需求

1 某一个字段中的数据为字符串拼接,要求按照特定分隔符分割成多行

2 例如(movies)表

拆分结果为:

一、pg数据库中一行变多行

1 在pg数据库中实现这种拆分有指定的函数:UNNEST(STRING_TO_ARRAY(字段,'分隔符'))。

2 STRING_TO_ARRAY(字段,‘分隔符’);将字符串 -----> {字符串} 数组。

3 UNNEST 将数组拆分

4 代码

	 SELECT  		id,name,hobbies, 		UNNEST(string_to_array(hobbies, '、')) as tmp 	FROM movies

二、mysql数据库中一行变多行

注:mysql 中没有指定的函数来实现数据库中一行变多行。

2.1  实现方式

(1)利用递归不停的循环拆分 -- (mysql版本必须在5.8+ 才可以用)

(2)利用一个临时表。要求:临时表中某一个字段的值必须是int类型且是联系递增的。

2.2 递归方式

1 代码实现

	WITH RECURSIVE m(id,name,hobbies,str) AS ( 	 		SELECT id,name,substr(hobbies,1,instr(hobbies,'、')-1),suubstr(concat(class,'、'),instr(class,'、')+1)  		FROM movies m 		UNION ALL 		SELECT id,name,substr(str,1,instr(str,'、')-1),suubstr(str,instr(class,'、')+1)  		FROM m 		WHERE instr(str,'、')>0 	) 	SELECT * FROM m ORDER BY id;

2.3 方式二  

 1 实现思路:我们利用substring_index函数按照指定分隔符截取字符串。

2 substring_index(str,delimiter,number) 返回从字符串 str 的第 number 个出现的分隔符 delimiter 之前的子串。

3 如果 number 是正数,那么就是从左往右,返回第 number 个分隔符的左边的全部内容;number为负,则相反。例如 substring_index(hobbies,'、',2),获得的结果为:

idnamehobbiessub
1千与千寻动画、剧情、奇幻动画、剧情
2阿甘正传剧情、爱情剧情、爱情
3唐伯虎点秋香喜剧、古装、爱情喜剧、古装

4 问题:hobbies 中每个字符串的长度是未知的,因此我们如何判断要截取几次?我们应该正向截取还是反向截取? 

以 id=1 为例:

(1)经过分析可知,反向截取会更容易。

第一次:substring_index('动画','、',-1) --- 得到:动画

第二次:substring_index('动画、剧情','、',-1) --- 得到:剧情

第三次:substring_index('动画、剧情、奇幻','、',-1) --- 得到:奇幻

结束分割。

(2)若想实现上述步骤,需要动态的自动改变字段hobbies的值,将本次得到的数据给截取掉。问题:① 如何动态截取hobbies。② 截取到什么时候结束。

5 解决:

问题一:仍然利用string_index 函数进行截取

substring_index(hobbies, '、', 1) --- '动画'

substring_index(hobbies, '、', 2) --- '动画、剧情'

substring_index(hobbies, '、', 3) --- '动画、剧情、奇幻'

第一次:substring_index(substring_index(hobbies, '、', 1), '、', -1) --- 得到:动画

第二次:substring_index(substring_index(hobbies, '、', 2), '、' ,-1) --- 得到:剧情

第三次:substring_index(substring_index(hobbies, '、', 3), '、' ,-1) --- 得到:奇幻

这里的1、2、3 可以换成临时表(tmp)中的自增id 即: substring_index(substring_index(hobbies, '、', id), '、' ,-1)。

问题二:截取多少次为止?

(1)我们可以看到有几个分隔符,就截取 分隔符数+1次。比如:'动画、剧情、奇幻' 有 2 个分隔符,根据上述描述可以看出需要分割3次。同理 '剧情、爱情' ,有 1 个分隔符,但是需要分割2次。

(2)因此需要截取多少次为止的问题,就转化为了求字符串中有几个分隔符的问题。

(3)解决:利用原始字符串的长度 - 除去分隔符的字符串的长度 = 所有分隔符的长度 = 分隔符个数 * 分隔符所占字节【LENGTH(hobbies)-LENGTH(REPLACE(hobbies, '、', ''))】。注意:中文分隔符占两个字节,因此一般我们可以现将分隔符转为英文字符,之后在进行计算,这样直接得到分隔符个数。即:LENGTH(REPLACE(hobbies, '、', ','))-LENGTH(REPLACE(hobbies, '、', '')) = n。

(4)因此每一行拆分的结束条件:temp.id

6 代码

SELECT  	m.id,m.name,m.hobbies, 	SUBSTRING_INDEX(SUBSTRING_INDEX(m.hobbies,'、',b.help_topic_id+1),'、',-1) as tmp 		FROM `movies`m 	 inner join mysql.help_topic b 	 on b.help_topic_id

这里用的临时表是mysql 自带的help_topic表。由于该表 id 是从 0 开始的,因此在进行判断时要 +1。

注意:当我们系统上线后,可能由于权限或者其他问题导致我们不能访问 mysql 中自带的表。因此为了保险起见,可以自己创建一个临时表。 (只要保证其中一个字段是int类型,且连续自增即可)

相关内容

热门资讯

裸辞做“一人公司”,我后悔了 去年这个时候,一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品,一个让任...
南京建成国内首个Pre-6G试... 4月21日,2026全球6G技术与产业生态大会在南京开幕。全息互动技术展台前,一名远在北京的工作人员...
超梵求职受邀参加“2025抖音... 超梵求职受邀参加“2025抖音巨量引擎成人教育行业生态大会”,探讨分享优质内容传播,服务万千学员。 ...
摩托罗拉Razr 2026(R... IT之家 4 月 22 日消息,摩托罗拉宣布新一代 Razr 折叠手机将于 4 月 29 日在美国发...
库克卸任,特纳斯领航:苹果新纪... 苹果首席执行官蒂姆·库克将卸任,硬件工程主管约翰·特纳斯将接任,苹果公司今天宣布此事。 库克将在夏季...