类别:其他 出处:网络整理 发布于:2025-07-24 16:25:07 | 201 次阅读
IBM正在从根本上简化面向AI的数据堆栈。IBM在Think大会上预览watsonx.data的重大演进,以帮助组织做好数据准备为AI所用,同时提供一个开放的混合数据基础架构和企业级的结构化和非结构化数据管理。
测试结果显示,与传统RAG相比,IBM watsonx.data的AI准确性提高了40%。IBM于6月推出的产品和功能包括:
watsonx.data integration(集成),该软件可在单个界面中编排不同集成样式和格式的数据访问和工程设计,其核心是灵活性和规模
watsonx.data intelligence(智能),该软件可改变组织处理、管理和利用有意义数据的方式,利用AI的力量简化数据治理
在Meta的Llama Stack中增加watsonx作为API提供商,增强了企业大规模部署生成式AI的能力,并以开放性为核心
watsonx.data集成和watsonx.data智能将作为独立产品提供,部分功能也将通过watsonx.data提供,从而限度地提高客户选择和模块化程度。
为了补充这些产品,IBM近期宣布了收购DataStax的意向,DataStax擅长将非结构化数据用于生成式AI。借助DataStax,客户可以访问其他矢量搜索功能。
基于内部测试,对比使用watsonx.data Premium Edition检索层与仅矢量RAG在三个常见用例中AI模型输出答案的准确性,测试使用IBM专有数据集,采用相同的选定开源通用推理、评估和嵌入模型以及额外变量。测试结果可能因具体情况而异。
这一重大演进的背景
企业正面临着实现准确且高性能的生成式AI——尤其是具有自主决策能力的智能体AI人的重大障碍,但该障碍并非如大多数企业所想。
问题不在于推理成本或难以捉摸的“完美”模型。问题在于数据。
企业需要可信且具有公司特性的数据,才能让智能体AI真正创造价值——这些数据存在于电子邮件、文档、演示文稿和视频等非结构化数据中。据估计,2022年企业产生的数据中90%是非结构化数据,但IBM预测其中仅有1%为大型语言模型(LLMs)所用。
非结构化数据的利用往往面临巨大挑战。这类数据分布广泛且动态变化,存储于多种格式中,缺乏清晰的标签,且常需额外上下文才能完整解读。传统检索增强生成(RAG)技术难以有效提取其价值,也无法妥善整合非结构化与结构化数据。
与此同时,各类孤立的工具会使AI数据处理架构变得复杂且繁琐。企业需要同时管理数据仓库、数据湖以及数据治理和数据集成工具。数据架构可能与它本应管理的非结构化数据一样令人困惑。
许多组织并未解决根本问题。它们仅关注生成式AI的应用层,而非其下方的核心数据层。除非组织修复其数据基础架构,否则AI智能体和其他生成式AI计划将无法充分发挥其潜力。
帮助组织实现数据的AI就绪
IBM提供的新功能将使组织能够采集、治理和检索非结构化(及结构化)数据——在此基础上,实现准确、高性能的生成式AI的规模化应用。
凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。
本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。