11月18日消息,在2025 Oceanbase年度发布会上,Oceanbase发布并开源了其首款AI数据库Oceanbase seekdb(简称seekdb)。
该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架,是Oceanbase自启动“Data×AI”战略以来的一份答卷。
Oceanbase CEO杨冰表示,AI的真正瓶颈不在模型,而在数据。尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。
“seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库。”杨冰表示,“它继承Oceanbase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合等方向加速迭代、大胆创新。”
据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%。但MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。seekdb带来三大核心突破:
一是AI原生混合搜索能力。seekdb支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID 一致性,并兼容MySQL 生态。此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。
二是极简部署,开箱即用。seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。
三是更开发者友好。seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展。产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本。
作为 Oceanbase“Data×AI”战略的关键一环,seekdb既可独立使用,也可融入新发布的Oceanbase 4.4一体化融合版本。该版本首次将TP、AP与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,帮助企业避免后期架构重构风险。商用LTS版本将于2026年2月2日推出。
数据显示,自2010年由蚂蚁集团自主研发以来,Oceanbase已服务全球4000余家企业,覆盖金融、政企、能源、通信、零售、制造、互联网等关键领域。其云服务OB Cloud是全球唯一同时支持阿里云、华为云、腾讯云、百度智能云、AWS、GCP、Azure七大主流云厂商的数据库产品,业务遍及全球16个国家和地区、60多个地域、240多个可用区。
杨冰强调:“未来数据库必须同时服务‘人’与‘智能体’。在一个数据库中支撑事务、分析与AI混合搜索,在数据源头驱动实时、可信的智能。”seekdb现已在GitHub开源,新域名oceanbase.ai同步启用,全球开发者可免费下载使用。





京公网安备 11011402013531号