百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Oracle SelectAI RAG - 数据库自动化RAG整个过程

moboyou 2025-03-24 15:36 10 浏览

RAG的过程

实现一个RAG,自己需要写代码实现这样的两个阶段:

  1. 数据加载阶段:文件加载 -> 文件分片 -> 内容向量化 -> 存入向量库 -> 建立向量索引
  2. 检索阶段:用户问题 -> 向量化用户问题 -> 向量语议检索出相关内容 -> 问题增强(提示词) -> 提交给大语言模型 -> 返回结果。

Oracle 23ai RAG

RAG是一个面向数据的检索方法,因此,由数据层面的基础设施完成数据相关的工作是比较合理的。

Oracle 23ai 推出了 SelectAI RAG,用户不再需要写代码就可以实现整个RAG的过程,直接用SQL语句就可以返回RAG的结果:

详细配置步骤

主要包括以下这些步骤(前面六步是数据加载(Data Loading)的配置)。

  1. Data Loading Step1: Whitelist the provider for API access
BEGIN
   -- allow connecting to outside hosts
    DBMS_NETWORK_ACL_ADMIN.APPEND_HOST_ACE(
        host => '*',
        ace => xs$ace_type(privilege_list => xs$name_list('connect'),
                           principal_name => 'OUSER',
                           principal_type => xs_acl.ptype_db));
END;
/
  1. Data Loading Step2: Create Credential for Vector Embedding
declare
  jo json_object_t;
begin
  jo := json_object_t();
  jo.put('user_ocid','ocid1.user.oc1..aaaaaaaaxxxxxxx');
  jo.put('tenancy_ocid','ocid1.tenancy.oc1..aaaaaaaaxxxxxx');
  jo.put('compartment_ocid','ocid1.compartment.oc1..aaaaaaaapxxxxxxx');
  jo.put('private_key','private key content string');
  jo.put('fingerprint’,’xx:xx:xx:…');

  dbms_vector.create_credential(
    credential_name   => 'VECTOR_OCI_GENAI_CRED',
    params            => json(jo.to_string));
end;
/
  1. Data Loading Step3: Create Embedding Profile
BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'OCI_TEXT_TRANSFORMER',
    attributes   => '{"provider": "oci",
                      "credential_name": "VECTOR_OCI_GENAI_CRED",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1"
                      }');
END;
/
  1. Data Loading Step4: Create Credential for Object Storage and OCI LLM Service
begin
    DBMS_CLOUD.CREATE_CREDENTIAL (
      credential_name => 'OCI_GENAI_CRED',
      user_ocid => 'ocid1.user.oc1..aaaaaaaaxxxxxx',
      tenancy_ocid => 'ocid1.tenancy.oc1..aaaaaaaaxxxxxx',
      private_key => 'private key string',
      fingerprint => 'xx:xx:xx……' );
end;
/
  1. Data Loading Step5: Create Vector Index For Files in Object Storage
BEGIN
  DBMS_CLOUD_AI.CREATE_VECTOR_INDEX(
    index_name  => 'DEMO_VECTOR_INDEX',
    attributes  => '{"vector_db_provider": "oracle",
                     "location": "https://objectstorage.{region}.oraclecloud.com/n/{namespace}/b/{bucket}/o/{folder}",
                     "object_storage_credential_name": "OCI_GENAI_CRED",
                     "profile_name": "OCI_TEXT_TRANSFORMER",
                     "vector_dimension": 1024,
                     "vector_distance_metric": "cosine",
                     "chunk_overlap":128,
                     "chunk_size":1024,
                     "refresh_rate":120}');
END;
/
-- refresh_rate 这里设成了120分钟,表示每隔2小时数据库会自动检查对象存储中的内容变化及自动更新数据
  1. Data Loading Step6: Create SelectAI Profile
BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B',
    attributes   => '{"provider": "oci",
                      "credential_name": "OCI_GENAI_CRED",
                      "vector_index_name": "DEMO_VECTOR_INDEX",
                      "temperature": 0,
                      "max_tokens": 4000,
                      "model": "meta.llama-3.3-70b-instruct",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1",
                      "enable_sources": true }');
END;
/

完成前面六步数据加载的配置后,上传相关的一些文档到指定的对象存储目录,就可以通过SQL语句直接查询RAG结果了,比如:

“什么是 ADB Schema Advisor?” 这个问题,通过 SQL 可以直接查看:

EXEC DBMS_CLOUD_AI.SET_PROFILE('PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B’);
                               
SELECT AI NARRATE '什么是 ADB Schema Advisor?’;

得到如下结果:

非常简单方便,数据库直接帮我们做了整个RAG的过程,应用程序就只要像执行传统的SQL一样获取结果就行了。

相关推荐

记一次前端逻辑绕过登录到内网挖掘

前言在测试一个学校网站的时候发现一个未授权访问内网系统,但是这个未授权并不是接口啥的,而是对前端js的审计和调试发现的漏洞,这里给大家分享一下这次的漏洞的过程文章中涉及的敏感信息均已做打码处理,文...

陕西普通话等级查询网的开发者被指将考生数据直接写入源码里

据报道,陕西普通话等级查询网站突然引起大量程序员关注。有人晒出该网站的源代码的打码截图,图中显示,所有考生数据都被直接写在该网站的源代码里。这表示任何人不需要经过任何验证直接查看源代码即可访问考生信息...

PHP8知识详解:PHP是什么?

PHP是什么?PHP服务网从下面几点为你讲清楚什么是PHP。1、PHP最开始是PersonalHomePage(个人主页)的缩写,已经正式更名为“PHP:HypertextPreproces...

PHP紧急更新修复漏洞:自5.x以来所有版本均受影响

IT之家6月8日消息,PHP项目维护团队昨日发布新补丁,修复了存在于PHPforWindows中的远程代码执行(RCE)漏洞,并敦促用户尽快更新至6月6日发布的8.3.8、...

OA协同办公系统源码解析

在如今的信息化时代,PHPOA软件承当着为企事业单位提供安全、稳定、开源的信息化安全系统,在当今信息化时代,协同办公系统成为了企业管理的重要工具。OA(OfficeAutomation)协同办公系统...

附源码:PHP实现查询汉字笔画、笔画排序

有时候我们在开发中可能会用到和汉字有关的方法,例如笔画排序之类的,但是直接进行sort排序往往得不到我们想要的结果,因为内部并没有预留这些排序方法。因此我们需要自己动手,今天就教大家实现汉字笔画的...

StrongShop跨境电商系统源码 | 支持多语言多货币

StrongShop跨境电商系统源码|支持多语言多货币StrongShop是一款免费开源的跨境电商商城网站。基于PHPLaravel框架开发的一款Web商城系统。该项目在没有对Lar...

源代码的定义

源代码是程序员在开发程序时(通常是在字处理程序中)编写的人类可读指令的列表。源代码通过编译器将其转换为机器代码,也称为目标代码,计算机可以理解和执行。目标代码主要由1和0组成,所以它是不可读的。源代码...

2077年了,PHP语言现在怎么样啦?

“PHP是世界上最好的语言!”这句话一出来,编程界的鄙视链一触即发,程序员的键盘世界大战就爆发了。那么,本文就简单讨论PHP语言,笔者作为创业小公司小团队的角度来妄议一下PHP。首先直接说明观点:新手...

开源直播系统源码—为什么要使用PHP语言

开展开源直播系统源码的的开发工作的时候,开发人员们碰到的最多问题便是使用什么语言开发的,回答大多是PHP语言。而对于没有的开发经验的人而言,难以理解PHP语言究竟代表着什么,又有哪些作用。实际上,PH...

手游平台源码搭建使用的PHP是什么?有什么优点吗?

PHP即“超文本预处理器”,是在服务器端执行的脚本语言,尤其适用于Web开发并可嵌入html中。PHP结合了C语言、java和perl多个语言的特色发展出自己的特色语法,并依据它们的长项持续改进提升自...

PHP直播源码,直播系统源代码功能有哪些?

PHP直播源码究竟是什么?其实所谓的PHP直播源码就是用PHP语言开发的直播系统源代码。PHP是什么?PHP原始为PersonalHomePage的缩写,已经正式更名为“PHP:Hyperte...

盘点如何利用PHP生成PDF文件

在PHP代码中生成PDF文件是一项非常耗时的工作,早期的程序员通常是在PHP代码中利用FPDF生成PDF文件。但在如今,有很多的函数库可以使用,借助它们你可以从你提供的HTML文档生成PDF文件,从而...

PHP低代码开发平台 V5.0.7新版发布

注意:本版变更:此版本增加租户内测模式,同时增加软删除及数据回收功能。Sfdp更新6.0.5版本Tpflow更新6.0.7版本1.[修复]修复数据为空的时桌面方案报错修复了在桌面组件删除时,由于用户...

「sabre/dav」只要十行代码让你的网站获得WebDav网盘能力

如今网盘已经成为我们日常中很重要的工具了,不仅仅可以和别人分享,更重要的是可以在我们不同的设备之间读取资料.那什么是WebDav呢?WebDav是一个Http上封装的一个文件系统,就像ftp,nfs之...