报告:数据质量是实施生成式人工智能的最大障碍
**划重点:**
- 📊 **数据领导者的调查:** 一项由Informatica进行的数据领导者调查表明,数据质量是实施生成式人工智能(GenAI)时面临的最大障碍。
- 🛠️ **数据管理工具和数据源:** 企业使用的数据管理工具数量以及大量企业应对1000多个独立数据源的情况也对GenAI项目产生了影响。
- 📈 **GenAI的实施和挑战:** 据调查,45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。
Informatica最新的CDO Insights2024报告揭示,对于实施生成式人工智能(GenAI),数据质量是最大的障碍。该报告基于对全球大型企业中600名数据领导者的调查,发现45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。对于几乎没有人在14个月前知晓的技术而言,只有2%的公司表示GenAI不适用于他们,这是一个非常低的数字。
然而,要成功实施GenAI并不像注册一个OpenAI账户,让GPT自由运行那么简单。尽管今天的预训练大型语言模型(LLMs)比过去的自然语言处理技术更易于使用,但拥有良好的数据仍然对于使一切正常运行至关重要,无论是从头开始训练模型、微调预构建模型,还是在运行时提示LLM。糟糕的数据将同样摧毁GenAI项目,就像它会摧毁任何类型的人工智能或机器学习项目一样。
在这方面,Informatica的调查发现,正在部署GenAI或计划部署GenAI的数据领导者中有42%(约600人中的588人)将数据质量列为GenAI成功的头号关切。报告显示,其他GenAI的关切包括数据隐私和保护、AI伦理、用于培训和微调语言模型的数据数量以及AI治理。
这些数据管理工具在Informatica的调查基础上被广泛使用。实际上,这家总部位于加利福尼亚州Redwood City的公司报告说,100%的调查参与者表示他们正在投资于支持数据战略和优先事项的数据管理能力,这无疑是一个很好的迹象。
然而,对Informatica来说,这个100%的数字也有一线曙光。该公司发现,58%的受访者使用了五种或更多种数据管理工具。此外,这些数据管理工具中的大多数在49%的受访者中并非作为云托管服务提供。
更多的数据通常意味着更多的洞察和更好的信号。但根据Informatica的说法,五分之二的公司表示他们正在处理1000个或更多个数据源。近80%的受访者表示他们预计2024年数据源的数量将增加。
39%的数据领导者报告称,在2024年,改善GenAI用例的数据可靠性和一致性是优先事项。另有39%的人将在2024年设定建立数据驱动文化和提高数据素养的目标,而38%的人将在2024年设定改善对数据和数据流程的治理的目标。
数据管理已经成为GenAI的关键推动因素并非令Jitesh Ghai,Informatica的首席产品官感到惊讶。
Ghai在新闻稿中说:“毫不奇怪,无论地区还是行业,生成式人工智能的实施和成功所需的数据策略仍然主导着大多数数据领导者的带宽。”他表示:“虽然这些领导者必须克服许多技术和组织上的障碍,但很明显,对于解锁GenAI的巨大潜力并使企业完全掌控其不断扩大的数据资产,全面、高度集成的数据管理能力的投资是关键。”
科大讯飞:讯飞星火大模型已首批顺利完成备案
科大讯飞表示,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》要求,旗下大模型已首批顺利完成备案。首批通过备案的企业名单,预计将在1周内陆续由各地方相关管理部门通知大家。站长网2023-08-31 10:28:460000阿里云大规模降价 核心产品最高降幅达50%
今日,阿里云宣布史上最大规模降价,核心产品价格全线下调15%至50%,存储产品最高降幅达50%。阿里云表示,此次降价空间来自于规模效应和今年飞天操作系统的大规模技术升级。据悉,此次价格调整包括云服务器ECS、云数据库RDS、云存储OSS及云安全产品等。购买时间越长折扣越高,两年七折,三年五折。站长网2023-04-26 10:41:240001开源论文查询工具DocsGPT登顶GitHub热榜 支持多种文档类型
要点:DocsGPT是一个开源论文查询工具,支持多种文档类型,包括TXT、PDF、ZIP、MD和RST,使用大型模型、Meta相似性搜索库Faiss和LangChain技术来驱动。DocsGPT提供多种模式供用户选择,包括默认的GPT-3.5模式和需要购买Pro的GPT-4模式,还有专门优化的DocsGPT-7b模型。站长网2023-10-07 14:14:530000开源中国获7.75亿元B+轮战略融资
据36氪消息,2023年6月,开源中国/Gitee(开源共识(上海)网络技术有限公司)完成了B轮战略融资。此轮融资由天际资本领投,浦东科创联合泰达投资、浦东软件园、张江科创、君联资本、上海国际创投、瑞力资本、容亿资本、中移动、中网投、国调科改、联想创投及上海科创等机构共同出资,融资总额达7.75亿元。站长网2023-06-28 15:35:270000“天猫精灵”拟更名XGENIE 将千万终端升级接入“大模型”
据上证报消息,9月15日,有消息称阿里巴巴旗下“天猫精灵”将更名,已有XGENIE品牌字样的新品在部分渠道露出。对此,内部人士处确认,9月19日确实将发布新品牌新产品。该负责人处表示,新品发布同时,天猫精灵已发售产品服务不受影响,还会有至少千万量级的已发售终端,通过线上升级接入“大模型”和多项AIGC能力。站长网2023-09-15 16:17:280000