百度推出通用图像关键信息抽取工具PP-ChatOCR 基于文心大模型打造
近日,百度飞桨团队宣布推出基于文心大模型的通用图像关键信息抽取工具——PP-ChatOCR。它结合了 OCR 文字识别和大模型技术,可以在多种场景下提取图像中的关键信息。
PP-ChatOCR 的核心思想是利用大模型的泛化能力和规则化处理,将 OCR 识别结果传递给文心大模型进行信息提取。PP-ChatOCR 的技术框架包括 OCR 推理、场景判别、Prompt 构造和后处理等步骤。
百度表示,使用 PP-ChatOCR 可以快速搭建通用的图像关键信息抽取系统,降低开发成本。对于个性化的需求,可以针对业务场景进行优化,包括微调 OCR 模型和调整大模型输出。PP-ChatOCR 已经在多个场景中取得了良好的精度和稳定性。

据悉,PP-ChatOCR 目前正式上线飞桨 AI 套件 PaddleX,开发者可以在 PaddleX 中对 PP-OCRv4做训练微调。同时 PaddleX 还支持 PP-ChatOCR 的高性能部署。
PaddleX 支持10 任务能力,包括图像分类、目标检测、图像分割、3D、OCR 和时序预测等;内置36种飞桨生态特色模型,包括 PP-ChatOCR、PP-OCRv4、RP-DETR、PP-YOLOE、PP-ShiTu、PP-LiteSeg、PP-TS 等。
AI Studio 应用中心体验 PP-ChatOCR:
https://aistudio.baidu.com/aistudio/projectdetail/6488689
飞桨 AI 套件 PaddleX 中的 PP-ChatOCR:
https://aistudio.baidu.com/aistudio/modelsdetail?modelId=332
PaddleOCR GitHub:
https://github.com/PaddlePaddle/PaddleOCR
单场直播卖不到10万,晚晚接不住“晚学”的泼天流量
在无人注意的互联网角落,“晚学”又双叒悄悄复兴了。晚学,互联网上一门研究豆瓣早期网红艺术家晚晚(原名:雷宛萤)及其跨越政、商、文三界的丈夫林瀚的“学科”。乍一看,晚晚和林瀚是对豪门夫妇,但晚学家们钻研发现,两人的豪门生活经不起考究,反而透露出一种“没钱硬装”的尴尬。站长网2024-08-21 18:05:410001ViTMatte:采用最新抠图技术 提供快速、高质量的抠像功能
ViTMatte是由NielsRogge开发的基于HuggingFaceTransformers库的图像抠像工具,旨在为用户提供快速、高质量的图像抠像功能。这个工具能够帮助用户将图像中的前景与背景进行有效分离,以便在各种视觉应用中进行后续处理和编辑。ViTMatte采用了先进的视觉注意力Transformer(ViT)模型,为用户提供了出色的图像抠像性能和结果。站长网2023-09-21 11:44:300000波士顿动力推出 AI 集成的机器人狗 Spot:打造未来互动导游
站长之家(ChinaZ.com)10月27日消息:波士顿动力公司近日推出了其新一代机器人狗Spot,这是一种配备了聊天机器人技术的智能导游机器人。Spot不仅能走动和交谈,还能以其独特的英国口音为游客提供场所导游服务。通过与ChatGPT及其他开源大型语言模型(LLMs)的集成,Spot能够精准地训练其响应,为人们呈现出一个全新的互动体验。站长网2023-10-27 22:14:540001又一个本土茶饮品牌火了,这次出圈竟然是靠“敲木鱼”!
近日,一个诞生于2020年的广东本土茶饮品牌,在520期间,凭借买茶赠木鱼的周边营销走进消费者的视野。据网友种草笔记上分享的购买规则,当天凡是购买当家茶饮,3.8元即可获得一款桃花木鱼:“每天敲一敲,心想事成,功德无量”这款周边让不少消费者心甘情愿掏出钱包,为其买单。站长网2023-05-25 18:20:130000抖音:自建配送团队为不实消息 主攻即时零售
7月19日消息,抖音外卖最近开启邀请部分商户进行自配送,目前已经在武汉、郑州、南京、西安、苏州等城市试点。不过,与其他配送模式不同,自配送的下单全流程都在抖音平台内部完成,无需跳转饿了么等抖音小程序,用户端显示商家自配”。有传言称抖音已经正式组建配送团队,配送团队组织架构已于6月完成调整。0000