MySQL9.0新特性向量存储的使用

 更新时间:2024年08月01日 11:34:05   作者:不剪发的Tony老师  
MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文主要介绍了MySQL9.0新特性向量存储的使用,感兴趣的可以了解一下

MySQL 9.0 正式版已经发布,其中一个亮点就是向量(VECTOR)数据类型的支持,本文给大家详细介绍一下这个新功能。

向量类型

MySQL 9.0 增加了一个新的向量数据类型:VECTOR。它是一种可以存储 N 个数据项的数据结构(数组),定义方式如下:

VECTOR(N)

其中,每个数据项都是一个 4 字节的单精度浮点数。默认的数据项为 2048 个,最大值为 16383。

向量类型的数据可以使用二进制字符串或者列表分隔的字符串表示,例如:

CREATE TABLE t(id int, rgb vector(3));

INSERT INTO t VALUES (1, to_vector('[255,255,255]'));
INSERT INTO t VALUES (2, to_vector('[128,255,0]'));
INSERT INTO t VALUES (3, to_vector('[0,65,225]'));

向量函数

MySQL 9.0 同时还增加了一些用于操作 VECTOR 数据的向量函数

首先,STRING_TO_VECTOR 函数用于将字符串形式的向量数据转换为二进制,例如:

SELECT HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"));

HEX(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
------------------------------------------+
6666863F66668EC100000042                  |

STRING_TO_VECTOR 函数的参数是一个字符串,包含一组由逗号分隔的浮点数,并且使用方括号([])进行引用。

TO_VECTOR 函数是 STRING_TO_VECTOR 函数的同义词。

其次,VECTOR_TO_STRING 函数用于将向量数据转换为字符串,例如:

SELECT VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"));

VECTOR_TO_STRING(STRING_TO_VECTOR("[1.05, -17.8, 32]"))|
-------------------------------------------------------+
[1.05000e+00,-1.78000e+01,3.20000e+01]                 |

SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);

VECTOR_TO_STRING(0x00000040000040400000A0400000E040)|
----------------------------------------------------+
[2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00]   |

输出结果中的浮点数使用科学计数法表示。

FROM_VECTOR 函数是 VECTOR_TO_STRING 函数的同义词。

最后,VECTOR_DIM 函数用于返回向量数据的维度,也就是数据项的个数。例如:

SELECT VECTOR_DIM(rgb) FROM t;

VECTOR_DIM(rgb)|
---------------+
              3|
              3|
              3|

使用限制

VECTOR 数据类型存在以下限制:

  • VECTOR 数据不能和其他类型的数据进行比较,VECTOR 数据只能和其他 VECTOR 数据进行等值比较。
  • VECTOR 类型的字段不能作为任何类型的键值,包括主键、外键、唯一键以及分区键。
  • VECTOR 类型的字段不能作为直方图的统计源。
  • 一些 MySQL 字符串函数可以使用 VECTOR 数据作为参数,包括 BIT_LENGTH()、CHAR_LENGTH()、HEX()、LENGTH() 以及 TO_BASE64()。其他字符串函数不支持 VECTOR 类型的参数。
  • VECTOR 数据可以作为以下加密函数的参数:AES_ENCRYPT()、COMPRESS()、MD5()、SHA1()、SHA2()。其他加密函数不支持 VECTOR 类型的参数。
  • VECTOR 数据可以作为 CASE 运算符和 COALESCE()、IFNULL()、NULLIF() 以及 IF() 函数的参数。
  • VECTOR 数据可以作为 CAST(expression AS BINARY) 的参数,结果返回 VECTOR 数据的二进制字符串。CAST 函数不支持将数据转换为 VECTOR 类型,推荐使用 STRING_TO_VECTOR 函数。
  • 除了COUNT 函数之外,VECTOR 数据类型不能作为其他聚合函数或者窗口函数的参数。
  • VECTOR 数据不能作为以下函数或运算符的参数:数字函数和运算符、时间函数、全文检索函数、XML 函数、位操作函数以及 JSON 函数。

总结

首先,对于向量数据的支持是一个重大的改进,可以为 MySQL 增加向量存储功能。

不过,目前 MySQL 9.0 只有简单的 VECTOR 数据类型和转换函数,还没有提供向量相似度(余弦相似性、欧氏距离、内积相似性等)检索功能,以及优化查询性能的向量索引,距离一个实用的向量数据库还有一些差距。

到此这篇关于MySQL9.0新特性向量存储的使用的文章就介绍到这了,更多相关MySQL 9.0 向量存储内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • MySQL子查询中order by不生效问题的解决方法

    MySQL子查询中order by不生效问题的解决方法

    ORDER BY 语句用于根据指定的列对结果集进行排序,在日常工作中经常会用到,这篇文章主要给大家介绍了关于MySQL子查询中order by不生效问题的解决方法,需要的朋友可以参考下
    2021-07-07
  • MySQL之MyISAM存储引擎的非聚簇索引详解

    MySQL之MyISAM存储引擎的非聚簇索引详解

    这篇文章主要为大家详细介绍了MySQL之MyISAM存储引擎的非聚簇索引,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-03-03
  • mysql binlog 回滚示例解析

    mysql binlog 回滚示例解析

    严格来说mysqlbinlog 不能算回滚,他只是将过去的数据修改记录 重新执行一遍,但是从结果上来看,他也算把数据恢复到任意时间点了,这篇文章主要介绍了mysql binlog回滚示例解析,需要的朋友可以参考下
    2023-08-08
  • MySQL数据库查看数据表占用空间大小和记录数的方法

    MySQL数据库查看数据表占用空间大小和记录数的方法

    这篇文章主要介绍了MySQL数据库查看数据表占用空间大小和记录数的方法,如果想知道MySQL数据库中每个表占用的空间、表记录的行数的话,可以打开MySQL的information_schema 数据库查询,本文就讲解查询方法,需要的朋友可以参考下
    2015-04-04
  • MySQL 5.7.18 release版安装指南(含有bin文件版本)

    MySQL 5.7.18 release版安装指南(含有bin文件版本)

    这篇文章主要介绍了MySQL 5.7.18 release版安装指南,本文只谈论release版,即含有bin文件版本,需要的朋友可以参考下
    2017-04-04
  • CentOS下将MySQL 5.1升级到MySQL 5.5的步骤

    CentOS下将MySQL 5.1升级到MySQL 5.5的步骤

    这篇文章主要介绍了CentOS下将MySQL 5.1升级到MySQL 5.5的步骤,需要的朋友可以参考下
    2015-08-08
  • MySQL数据库之索引详解

    MySQL数据库之索引详解

    大家好,本篇文章主要讲的是MySQL数据库之索引详解,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2021-12-12
  • MySql中的IFNULL、NULLIF和ISNULL用法详解

    MySql中的IFNULL、NULLIF和ISNULL用法详解

    本文主要介绍了MySql中的IFNULL、NULLIF和ISNULL用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • SQL计算timestamp的差值的方法

    SQL计算timestamp的差值的方法

    这篇文章主要介绍了SQL计算timestamp的差值的方法的相关资料,需要的朋友可以参考下
    2017-05-05
  • 利用mysql的inet_aton()和inet_ntoa()函数存储IP地址的方法分享

    利用mysql的inet_aton()和inet_ntoa()函数存储IP地址的方法分享

    当前很多应用都适用字符串char(15)来存储IP地址(占用16个字节),利用inet_aton()和inet_ntoa()函数,来存储IP地址效率很高,适用unsigned int 就可以满足需求,不需要使用bigint,只需要4个字节,节省存储空间,同时效率也高很多
    2012-03-03

最新评论