浙大校友联手微软开源LLaVA-1.5,硬刚GPT-4V
站长网2023-10-08 14:07:230阅
要点:
LLaVA-1.5在11项基准测试实现了SOTA,使用8块A100GPU,LLaVA-1.5的训练仅需1天时间即可完成。
LLaVA-1.5在多模态理解上超越GPT-4V,可对其形成有力竞争。
LLaVA-1.5采用最简单的架构和公开数据集,性能显著提升。
LLaVA-1.5是来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源的一款全新的端到端多模态大模型,可与OpenAI的GPT-4V形成正面竞争。LLaVA-1.5在11项基准测试中都实现了新的状态最优(SOTA)成绩,包括视觉问答、图像 caption等任务,展现出了强大的多模态理解能力。
论文地址:https://browse.arxiv.org/pdf/2310.03744.pdf
相比之前的版本LLaVA,LLaVA-1.5采用了更高分辨率的图像输入、更大规模的语言模型(13B参数),以及面向学术任务的视觉问答数据集,从而获得了显著的性能提升。研究人员发现,与额外的大规模预训练相比,视觉指令微调对提高多模态能力更为关键。
值得一提的是,LLaVA-1.5采用了最简单的架构设计,只需要在公开可取得的6百万图像文本配对上训练一个全连接层,就能在多项基准测试中打败复杂的SOTA系统,刷新记录。使用8块A100GPU,LLaVA-1.5的训练仅需1天时间即可完成。LLaVA-1.5展示了开源大模型可以通过简单的设计和公共数据取得竞争力,为未来的研究提供了有价值的经验。LLaVA-1.5以其出色的多模态理解能力,向业内掀起了一股“硬刚GPT-4”的新风潮。
0000
评论列表
共(0)条相关推荐
微软工程师工资曝光!AI部门平均270万远超其他部门
快科技8月25日消息,据媒体报道,数百名微软员工自愿分享了他们的薪资和晋升信息,其中包括超过500名美国员工的详细数据。分析这些数据后发现,微软软件工程师的平均薪酬范围很广,从148436美元到1230000美元不等,对应着从Level59到Level69的职位级别。0000小米 Civi3 将推出迪士尼100周年草莓熊限定版
站长之家(ChinaZ.com)12月20日消息:小米手机今日宣布,将与迪士尼再度合作,携手草莓熊推出小米Civi3迪士尼100周年限定版。这款手机此前已经推出过迪士尼100周年限定版,主角为经典卡通形象“米奇”。站长网2023-12-20 15:05:440000这个搞钱的生意太绝了!
各位村民好,我是村长。普通人绝对想不到或看不上这个生意!就算脑海里有这样的念头,也是一闪而过,最终没有落地。今天就和大家简短的聊一聊,文章不长。核心目的还是启发大家,做些思路延展,不要思维定式,多思考别人为什么能行。01大量真实的小需求今天要分享的这个生意是提供各种合同模板工具的,比如收入证明、工作证明、租房合同、离职证明、承诺保证书、授权委托等等。1、收入模式站长网2024-06-01 21:38:300001高合高管邀请贾跃亭下周回国:看看中国的新能源发展
法拉第未来近日对陷入“破产边缘”的高合汽车提起诉讼,同时贾跃亭公开发文猛烈抨击,指责丁磊和高合汽车涉嫌盗窃及侵犯FF的知识产权、技术数据和商业机密。贾跃亭在最新的文章中再次猛烈攻击高合汽车,并附上视频证据,坚称高合汽车的外观设计是剽窃而来。他强调,任何明眼人都能看出高合的行为是在剽窃、说谎、蒙蔽用户和欺骗投资人。贾跃亭进一步指责高合汽车已经到了需要用一个谎言来掩盖另一个谎言的地步。站长网2024-03-06 17:24:310000马云持股公司获食品销售许可 此前马云成立农业品牌“一米八”
近日,一米八食品科技(浙江)有限公司获得新的行政许可,可以销售预包装(普通)食品、散装食品(不含熟食制品)以及保健食品,这一许可由杭州市西湖区市场监督管理局颁发。站长网2024-01-23 14:11:270003