LP-MusicCaps:基于 LLM 的伪音乐字幕生成方法
站长网2023-08-03 18:16:430阅
LP-MusicCaps 是一种基于 LLM 的伪音乐字幕生成方法。该项目的目标是为音乐生成字幕。它通过将大型语言模型应用于标签数据集,生成了一个大规模的音乐字幕数据集,为研究者们提供了更多的训练数据,以便成功训练音乐字幕生成模型。

项目地址:https://github.com/seungheondoh/lp-music-caps
其核心功能包括:
1. 标签到字幕:利用现有标签,使用 OpenAI 的 GPT-3.5Turbo API 生成高质量、上下文相关的音乐字幕。
2. 音频到字幕:使用音乐音频和伪字幕对,训练端到端的跨模态编码器 - 解码器模型,用于音乐字幕生成。
3.系统性评估方案:LP-MusicCaps 提出了一种系统性评估方案,通过多种定量评估指标和人工评估来评估大规模音乐字幕数据集的质量。
4.零样本学习和迁移学习支持:LP-MusicCaps 训练的模型在零样本学习和迁移学习场景下表现良好,证明了基于大型语言模型的伪字幕的有效性。

0000
评论列表
共(0)条相关推荐
小红书能直接跳转微信了!
见实发现小红书可以直接跳转微信小程序了!前几年还是只在大品牌上试水,如今已经开始在普通品牌上开放。在见实2023年的年度大调研中就提到:7成企业已经在加大全域的布局。如今小红书的微信小程序跳转更是推进了全域通路的打通。站长网2024-03-11 12:08:280003国产存储站起来了!长江存储在美国起诉美光侵犯专利 专家称基本可赢
快科技11月12日消息,据国内媒体报道称,中国最大闪存芯片制造商长江存储在美国起诉美光,后者侵犯了专利。长江存储在起诉书中提到,美光使用长江存储的专利技术,以抵御来自长江存储的竞争,并获得和保护市场份额。诉讼旨在解决以下问题的一个方面:美光试图通过迫使长江存储退出3DNANDFlash(闪存)市场来阻止竞争和创新。站长网2023-11-12 10:20:050001鲸灵AI每日生产营销文案7000余条和视频素材1200余条
近日,鲸灵上线私域电商领域首创AI视频素材功能,通过AI能力一键抓取商品详情图信息,自动生产视频素材,同时匹配私域流行风格推广文案,大幅提高商品销售转化效率。据鲸灵集团介绍,针对每日主推品牌,鲸灵AI每日生产营销文案7000余条,视频素材1200余条,每日覆盖线上5000余件在售商品,上线以来已累计生产AI视频素材100000余条,AI素材与人工制作素材的相似度更是高达90%。站长网2023-06-26 00:57:360000AI魔镜来了!BMind智能镜基于生成式AI可识别人类情绪
**划重点:**-🪞**情感分析智能镜:**Baracoda的BMind智能镜搭载生成式人工智能和自然语言处理,通过分析用户的表情、手势和语调,调整情绪并提供光疗、引导冥想和自我肯定。-🌐**CareOS平台:**该技术基于CareOS平台,允许第三方提供商将其应用连接到镜子的界面,通过语音检测、4K超高清摄像头和FaceID等规格实现。站长网2024-01-09 15:51:050000模型混合新方法SegMoE 无需训练即可混合多个SD模型
SegMoE是一种无需训练就可以混合多个SD模型组成一个新的模型,类似LLM的MoE模型。据称,他们提供了三个已经混合好的模型,分别由2个SDXL、4个SDXL和4个SD1.5模型组成。项目地址:https://top.aibase.com/tool/segmoe站长网2024-02-05 10:20:510000