百度推出通用图像关键信息抽取工具PP-ChatOCR 基于文心大模型打造
近日,百度飞桨团队宣布推出基于文心大模型的通用图像关键信息抽取工具——PP-ChatOCR。它结合了 OCR 文字识别和大模型技术,可以在多种场景下提取图像中的关键信息。
PP-ChatOCR 的核心思想是利用大模型的泛化能力和规则化处理,将 OCR 识别结果传递给文心大模型进行信息提取。PP-ChatOCR 的技术框架包括 OCR 推理、场景判别、Prompt 构造和后处理等步骤。
百度表示,使用 PP-ChatOCR 可以快速搭建通用的图像关键信息抽取系统,降低开发成本。对于个性化的需求,可以针对业务场景进行优化,包括微调 OCR 模型和调整大模型输出。PP-ChatOCR 已经在多个场景中取得了良好的精度和稳定性。

据悉,PP-ChatOCR 目前正式上线飞桨 AI 套件 PaddleX,开发者可以在 PaddleX 中对 PP-OCRv4做训练微调。同时 PaddleX 还支持 PP-ChatOCR 的高性能部署。
PaddleX 支持10 任务能力,包括图像分类、目标检测、图像分割、3D、OCR 和时序预测等;内置36种飞桨生态特色模型,包括 PP-ChatOCR、PP-OCRv4、RP-DETR、PP-YOLOE、PP-ShiTu、PP-LiteSeg、PP-TS 等。
AI Studio 应用中心体验 PP-ChatOCR:
https://aistudio.baidu.com/aistudio/projectdetail/6488689
飞桨 AI 套件 PaddleX 中的 PP-ChatOCR:
https://aistudio.baidu.com/aistudio/modelsdetail?modelId=332
PaddleOCR GitHub:
https://github.com/PaddlePaddle/PaddleOCR
Astra Starter Templates 集成 ZipWP AI 网站生成器,能在 60 秒内创建整个网站
站长之家(ChinaZ.com)12月12日消息:BrainstormForce的AstraStarterTemplates,一款拥有超过一百万活跃安装量的网站模板,宣布整合ZipWPAI网站构建器,使用户能够创建整个网站,包括内容和图像。0000比Model Y便宜3万!乐道L60开启预售:21.99万元起 9月上市交付
快科技5月15日消息,今日晚间,蔚来举办乐道品牌发布会,正式发布蔚来子品牌乐道,以及乐道首款车型L60。乐道L60即日开启预售,预售价格21.99万元,(支付2000元定金可抵6000元购车款),新车将于9月份上市交付。乐道汽车总裁艾铁成表示,乐道L60预售价比ModelY便宜3万。0000Facebook和Instagram全球死机:Meta已成功修复问题
周二,Meta宣布已成功解决其旗下Facebook、Instagram和Threads服务的中断问题,此前这些问题导致部分美国用户长时间无法登录这些平台。在周二上午的服务中断期间,Meta通信总监安迪·斯通在X上发布帖子承认并致歉,他表示:“我们了解到用户在访问我们的服务时遇到了困难,并已经尽快为所有受影响的人解决了这个问题。”站长网2024-03-06 10:22:200000北京消协发布618消费提示:切莫贪图低价忽视商家信誉和售后服务
北京市消费者协会发布“618”消费提示称,“618”网络购物节之际,为引导广大消费者科学理性消费,规避购物陷阱和消费风险,进一步保护消费者的合法权益,营造安全放心的网络消费环境,北京市消费者协会发布提示,提醒广大消费者科学理性消费。站长网2023-06-16 20:15:050000公域持续获得流量的核心框架
各位村民好,我是村长想要做私域,就一定要学会从公域中获取流量。大家以为在公域获取流量,就是发内容就行了。看起来好像很简单,但整个公域流量的获取是一个很全面的操作流程。今天村长就先和大家一起来分享,从公域持续引流的基本框架和流程。01先做定位从公域引流随便发发也是可以的,但是这种东一枪、西一炮的做法不长久。想要长久的从公域获取流量,就要做账号,做定位。0001