前言:向量数据库有什么用?
RGA向量数据库是AI时代的基础设施,它通过将非结构化数据转化为向量并高效检索,构建了连接数据与智能应用的桥梁,广泛应用于搜索、推荐、风控等领域,是支撑现代AI系统实时决策和个性化服务的核心技术。
- 为大模型提供长期记忆或知识库,增强生成式AI的准确性和可解释性。
- 支持检索增强生成(RAG),减少大模型幻觉。
- 智能客服:基于知识库的精准问答。
一、向量数据库:可选内置,也可选外置
1. 内置向量数据库(推荐)

如果选择内置向量数据库,启用内置向量数据库即可,下面的参数都不用设置,推荐使用
2. 外置向量数据库(不推荐)
(1). 安装PostgreSQL + pgvector (Docker最方便)
docker run -d \
-p 5432:5432 \
-e POSTGRES_USER=ai \
-e POSTGRES_PASSWORD=ai123456 \
-e POSTGRES_DB=vectordb \
--name pgvector \
ankane/pgvector
(2). 两种配置向量数据库的方式任选其一
一是在autMan主文件夹创建文件config_postgres.yaml,并填写配置文件名
# config_postgres.yaml
store_type: postgres
log_level: info
postgres:
connection_string: "postgres://ai:ai123456@192.168.31.49:5432/vectordb"
max_connections: 20
max_idle_conns: 5
conn_max_lifetime: 3600s
default_collection: "documents"
embedding_dimension: 1536
auto_migrate: true

二是不用yaml文件,直接填写配置参数
填写要素:连接字符串、最大连接数、空闲最大连接数、连接最大生命周期、默认文档集合、向量化维度、是否自动迁移。不会填的话,只填写连接字符串就行,其他不填均为默认。

二、接入向量化模型(以模力方舟平台为例)
注册地址:https://moark.com/serverless-api
注册即可获得访问令牌,每天有100次的免费调用机会

要使用的向量化模型为:Qwen3-Embedding-8B,支持的最大向量化维度为4096

接入时均按下图填写,注意要选择的
地址:https://api.moark.com/v1
接口类型:openAI兼容接口
类别为:嵌入模型
模型名称:Qwen3-Embedding-8B
嵌入维度:1536
密钥:填写在注册平台后拿到的访问令牌
请求头:X-Failover-Enabled=true

三、 向量知识库灌入长文本知识
元数据:格式为key=value;key=value,例如:category=overview;entity=autMan
内容:长文本,后期会支持上传文件,例如:autMan是机器人牵引的可扩展的一站式解决方案。一是原生支持对接qq框架、qq频道、微信框架(酷V西瓜可爱猫千寻鲲鹏)、 内置微信、微信客服、公众号、钉钉、飞书、tg客户端、tg机器人、Discord、Slack、Kook、Poe、Messenger、Synology Chat Bot、Pagemaid-Pyro等。也支持自己编写适配器接入其他社交媒体。二是支持关键词处理回复和事件处理操作,支持SSE连接,实时监听所有对接IM的消息。具备日志实时显示功能,方便调试。三是支持多语言插件,如html、ECMAScript5、nodejs、typescript、python3、php、shell、golang等,不仅限这些编程语言,内置了插件市场,即装即用。四是内置脚本运行容器,支持python3、javascript、shell、typescript 等多种语言脚本的定时任务管理,支持虚拟多容器,同时支持单脚本不同变量的并发和同变量分组并发,也支持对接青龙面板并进行管理。五是内置全可视化代理池,维护可用代理,支持代理源自动休眠。支持隧道代理服务和API获取代理IP服务。六是支持京东、淘宝、拼多多、外卖等返利(查询当前价格,历史价格,平台比价)支持二维码扫码购买,收益查询。七是支持用户管理。八是支持自定义路由路径的微服务,即自定义路由,并自行编写处理逻辑。九是完善的API开放接口,可将autMan集成到自己的系统中。

四、 应用到智能体
