合合信息用AI 抢救古彝文 发布业内首个编码数据库
站长网2023-09-27 09:54:390阅
据第一财经消息,近日,合合信息联合上海大学、华南理工大学,发布了业内首个古彝文基础编码数据库。该数据库通过人工智能技术,对云贵地区流传的古彝文字符进行数字化编码,编制成类似“大字典”的数据库,以帮助相关人士更便捷地查询古彝文的读音和释义。

图源备注:图片由AI生成,图片授权服务商Midjourney
据介绍,古彝文指民间流传使用的原生态彝文,有87046个字符,远多于汉字。其中,《西南彝志》是目前发现的篇幅最长、内容最丰富的古彝文典籍。但由于古彝文异体字繁多,一个字可有几十种不同写法,给古籍数字化带来巨大挑战。
为突破难点,项目组采用智能图像处理、文字识别等人工智能技术,对7万6千余个样本进行训练,建立古彝文统一的数字编码。数据库发布后,相关用户只需输入一串编码,就可查询到字的读音、释义等信息,大大降低了阅读古籍的门槛。
合合信息表示,数据库的发布是基础性工作,有助更多人认识、研究古彝文,也为语言文明的保护提供了新路径。当前,数字化已成为文化传承的重要途径。数据库项目表明,人工智能可以发挥重要作用,助力传统文化走向数字化。
0000
评论列表
共(0)条相关推荐
UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
要点:UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY,该模型具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。通过与3D环境的交互,MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中,表现出比当前技术水平更高的性能。站长网2024-01-22 14:16:280001百度智能云千帆大模型平台推出千帆SDK开源版本
百度智能云千帆大模型平台再次升级,推出千帆SDK,全面开源并免费下载使用。该SDK提供了从数据集管理、模型训练、模型评估到服务部署等一系列功能,用户可以通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现LLMOps全流程的落地,快速构建自己的大语言模型应用。SDK的优势在于快速使用API能力、提供实践案例和应用场景的cookbook、拓展了LLM应用的基础能力。站长网2023-11-08 08:36:060000一人研发、2周收入近3000万,他实现了游戏人最疯狂的梦想
今年独游这么卷,结果还有高手?自5月9日上架Steam以来,关于类银河恶魔城独游《动物井(AnimalWell)》的讨论就没有停止过。它几乎被捧上了神坛,包括我身边一些朋友都表示“这游戏已经提前锁定年度最佳独游。”VGInsights预估,截至5月23日,《动物井》已售出22万份,收入达400万美元(折合人民币约2898万元)。站长网2024-06-05 20:10:260000Deep Nostalgia:通过AI技术让老照片动起来
DeepNostalgia是一项使用机器学习来动画静态图像的技术。它可以通过给静态照片中的人脸添加动画效果,让你的家族历史变得更加生动。你只需要上传照片,DeepNostalgia会将预设的动作模板应用到人脸上,创建出高质量、逼真的视频。这些视频能够让你看到你的祖先笑、眨眼和转头,为你的照片增添活力。站长网2023-08-01 11:31:300001索尼同意与微软签订为期 10 年的《使命召唤》协议
据theverge报道,索尼同意与微软签订为期10年的《使命召唤》协议,保证该系列游戏将继续留在PlayStation上。这意味着微软和索尼之间的《使命召唤》争夺战结束了。站长网2023-07-18 16:35:030000