B站UP主用1300条B站热门标题训练AI 自制“赛博主编”
站长网2023-09-12 14:19:000阅
近日,B站UP主“差评君”发布了一条名为“我们用1300条B站热门视频,做了一个能读懂B站的取标题机器人”的视频。视频中,他通过训练生成了一个能自动生成标题的AI“赛博主编”,该AI能够根据过往的热门视频内容和观众口味生成符合B站观众口味的标题。
据了解,为了解决取标题的难题,“差评君”选择了使用B站过往的热门视频作为语料,经过人工数据处理和清洗后,将其投喂给千帆大模型平台进行训练。经过训练后的AI能够生成符合B站观众口味的标题。这一应用引起了广泛关注,截至目前,该视频播放量达72.4万,获赞2.1万。
类似这样的“专用AI”正成为不少玩家和开发者青睐的应用。然而,对于普通玩家来说,“如何获得训练AI的数据”是整个过程最大的难点。往往项目中需要的数据无法直接喂给AI,需要大量的预处理工作,会花费很多功夫。而“差评君”在视频中提到,1300条的样本量还是比较少,只是略微超过了标注数据的参考阈值。
但随着大模型预置的数据集越来越丰富,训练AI的门槛将会越来越低。相信未来,还有更多网友训练出不同玩法的AI应用。这种技术的出现将极大地方便了人们的生活和工作,同时也为AI技术的发展提供了新的可能性。
0000
评论列表
共(0)条相关推荐
中国 AI 研究提出全新多模态学习框架Meta-Transformer
传统的深度学习模型在处理不同数据形式时存在巨大的模态差异,需要进行大量的工作来构建一个能够处理各种输入形式的统一网络。不同数据模态之间存在显著差异,通常使用不同的网络拓扑来独立编码每种数据模态。然而,这需要耗费时间和精力。站长网2023-07-24 15:44:460000SambaNova发布全新AI芯片SN40L 可运行5万亿参数模型
文章概要:-SambaNova发布了一款智能AI芯片SN40L,可运行高达5万亿参数的模型,实现快速可扩展的推理和训练,而不损害模型准确性。-这款由TSMC制造的SN40L芯片可以在单个系统节点上为5万亿参数模型提供256k的序列长度,这是通过整合技术的新突破,大大提高了模型质量、推理速度,并降低了总拥有成本。站长网2023-09-26 16:28:510000Cradle的AI蛋白质编程平台获得2400万美元融资
要点:利用生成式方法进行蛋白质设计的生物技术和人工智能初创公司Cradle成功地吸引了大客户,获得了2,400万美元的新投资。Cradle采用生成式AI方法,将蛋白质设计比喻为一种“外星编程语言”,通过此方法大大缩短了从零开始创建有用且功能性蛋白质所需的时间和实验数量。该技术不仅局限于药物开发,还可在食品和工业应用中使用,且不需要专业的机器学习工程师操作,可直接交给科学家和实验室使用。站长网2023-11-28 15:55:260000PixelPlayer:能自动从视频中识别和分离不同的声音源
PixelPlayer是MIT研究团队开发的项目,能够自动从视频中识别和分离出不同的声音源,并与画面位置匹配。这种能力使得系统能够识别视频中的不同声音来源,如不同乐器的声音,分别提取和分离这些声音源的声音,而无需人工标注数据。项目地址:https://top.aibase.com/tool/pixelplayer站长网2024-02-22 11:36:000001小米618:仅用时4小时2分钟 全渠道支付金额破41亿元
据小米公布的618数据显示,小米618的开门红非常火爆,仅用时12分55秒,全渠道支付金额就突破了10亿元!而仅用时1小时30分钟后,全渠道支付金额已经突破了30亿元!截至今日凌晨4点02分(即242分钟之后),小米官方更新的618战报显示,小米618全渠道支付金额已经突破了41亿元。站长网2023-06-01 14:31:290000