1.引言
随着数据量的爆炸性增长和数据分析需求的日益复杂化,将自然语言文本转化为结构化查询语言(SQL)的能力变得至关重要。生成式决策智能体(以下简称GDA)技术作为一种将自然语言查询转化为SQL查询的解决方案,极大地提升了用户从文本中提取信息的效率和便捷性。
2.简介
生成式决策智能体(GDA)产品致力于解决在大模型与数据库交互过程中的私密数据保护和环境控制问题,确保数据的自主可控性,项目提供了一套完整的私有大模型解决方案,支持本地部署,适用于独立私有环境,并可根据业务需求进行模块化部署,确保大模型的私有性、安全性和可控性。
3.架构设计
GDA项目采用FastChat作为大模型运行环境的基础,集成了LangChain技术,以提供私域知识库问答能力。项目设计支持插件模式,并原生兼容Auto-GPT插件,增强了系统的灵活性和扩展性。
RAG:检索式增强生成方法(retrieval-augmented generation)
4.私域问答&数据处理
GDA产品支持多种自定义知识库构建方式,包括内置、多文件格式上传和插件自抓取等,实现对海量结构化和非结构化数据的统一向量存储与检索。
5.支持的数据源
MySQL
PostgresSQL
Spark
DuckDB
Sqlite
MSSQL
ClickHouse
6.多模型支持与管理
海量模型支持,包括API代理等几十种大语言模型,如LLaMA/LLaMA2、Baichuan、ChatGLM等。
支持多种大语言模型, 当前已支持如下模型(列举几个常用):
Vicuna
vicuna-13b-v1.5
LLama2
baichuan2-13b
baichuan-7B
chatglm-6b
chatglm2-6b
7.案例实践
在卓世科技的天津中水项目中,成功打造了数字专家“库博士”和数字助理“库助手”。这两个数字角色充分利用了水库领域的知识储备,整合了结构化和非结构化数据,为水库管理运营提供了强有力的决策支持。数字员工“库助手”特别针对水库运营的实际操作,为基层水库管理人员提供了智能知识问答服务。目前,该项目已在POC阶段成功交付,并获得了客户的一致认可。
作者:万家欢