什么是Vector Database?

news/2024/7/7 21:14:12

此为看完视频What is a Vector Database?后的笔记。

作者首先对数据库做了分类,其中RTweb表示real time web app。

然后对用例做了分类,最后一个就是适合于AI的近似搜索。

好处,包括灵活性,可扩展性和性价比。

本视频最重要的是讲向量数据库的特征,即vector和embedding。

这两个特征是配合工作的。在这里插入图片描述
vector就是向量,就是数组,就是一组数,就是一组浮点数。可以看OpenAI的例子。

在OpenAI的文档中,embedding的定义为:

Get a vector representation of a given input that can be easily consumed by machine learning models and algorithms.
获取给定输入的向量表示,机器学习模型和算法可以轻松使用该表示。

vector和embedding经常互换使用,但既然这里分开了,也可以说下他们的细微区别。

vector是名词,是一组数;embedding是动词,是向量化的过程,或将数据表示为向量的技术,以捕获有意义的信息、语义关系或上下文特征,按照(What are vector embeddings?)的说法,虽然嵌入和向量可以在向量嵌入的上下文中互换使用,但“嵌入”强调以有意义和结构化的方式表示数据的概念,而“向量”指的是数字表示本身。

在OpenAI的例子中,输入一个对象(如文本),OpenAI返回向量,然后你可以存入向量数据库中,如Oracle 23c或SingleStore。
在这里插入图片描述
如果你订阅了OpenAI,可以试下这个通过API实现embedding的例子。

最后,说下好处。

  1. 灵活性:关系型,文档,Graph等,任何类型的数据都可以向量化
  2. 可扩展性:这里指的是数据的扩展/增长
  3. 性价比:指搜索性能很好

http://lihuaxi.xjx100.cn/news/2105708.html

相关文章

PHP反序列化--_wakeup()绕过

一、漏洞原理&#xff1a; 二、靶场复现: 进入靶场&#xff0c;分析源代码&#xff1a; <?php error_reporting(0); class secret{var $fileindex.php;public function __construct($file){$this->file$file;}function __destruct(){include_once($this->file);ech…

蓝桥杯-Sticks-DFS搜索

题目 样例输出是 6 5 题目中给错了&#xff0c;不知道什么时候会改。 思路 --剪枝&#xff0c;否则时间复杂度和空间复杂度过大&#xff0c;会超时。 --注意有多组测试样例时&#xff0c;需要将bool数组重新赋值为false。 --函数类型不是void&#xff0c;return语句不能省…

记一次由于e2fsprog升级引起文件系统挂载失败

现像&#xff1a; mount -t ext4 /dev/mmcblk0p17 /var/backups 执行时报错EXT4-fs (mmcblk0p17): Couldnt mount because of unsupported optional features (2000)&#xff1b; 要如何解决&#xff1f; 首先明确一个问题&#xff0c;文件系统特性仅与软件有关&#xff0c;…

电机学(笔记二)

负载与电流对应&#xff0c;电枢电压与转速对应。 电动机的输入功率P1 电磁功率Pm 铜损功率 Pcu 轴上输出机械功率P2 空载功率P0&#xff08;包括铁损耗&#xff0c;机械损耗和附加损耗&#xff09; 铜损耗Pcu 发电机的机械功率P1 电磁功率Pm 空载功率P0&…

代码随想录阅读笔记-字符串【翻转字符串中单词】

题目 给定一个字符串&#xff0c;逐个翻转字符串中的每个单词。 示例 1&#xff1a; 输入: "the sky is blue" 输出: "blue is sky the" 示例 2&#xff1a; 输入: " hello world! " 输出: "world! hello" 解释: 输入字符串可以在前…

Linux学习笔记-Linux学习方法

Linux建议学习路线 计算机概论与硬件相关知识&#xff1a; 因为既然想要走Linux这门路&#xff0c;信息相关的基础技能也不能没有啊&#xff01; 所以先理解一下基础的硬件知识&#xff0c;不用一定要全懂&#xff0c;又不是真的要你去组计算机&#xff0c;但是至少要“听过、有…

Springboot自动校验@NotBlank@NotNull@NotEmpty

1、依赖问题&#xff1a; 查看搭建的SpringBoot项目中 NotEmpty 是否可以引用&#xff0c;查询资料发现从SpringBoot 2.3.0之后放弃了默认对javax.validation 的支持。 <dependency> <groupId>org.springframework.boot</groupId> …

3月第2周精选#ComfyUI爱好者中文社区

社群精华周报&#xff08;3月第2周&#xff09;截止至3.17日 &#xff0c;感谢 WritterGPT ML2627 的记录。 分享者 / 奥特曼 自动将漫画转录为文字并生成剧本 Magi 模型由牛津大学工程科学系的视觉几何组开发&#xff0c;它可以全自动地为漫画页生成剧本&#xff0c;包括谁说了…