Clip4Cir开源:基于参考图像和文字描述搜索图片
站长网2023-08-26 16:04:500阅
Clip4Cir采用了一种搜索图片的方法,图片看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的 CLIP 模型。该方法在流行的图像搜索数据集 FashionIQ 和 CIRR 上表现更佳。
项目地址:https://github.com/ABaldrati/CLIP4Cir
CLIP 模型是一个多模态视觉模型,它可以理解自然语言描述与图像的复杂对应关系。通过在标题中描述变化,可以更精确地寻找符合用户需求的图像。这一改进将有助于提高图像搜索的准确性和用户体验。
主要内容包括:
项目目标:实现基于参考图像和文字描述的图像检索任务
模型框架:先微调CLIP encoder,再训练Combiner网络进行多模态融合
数据集:使用FashionIQ和CIRR两个流行的数据集
用法:提供了CLIP微调、Combiner训练、评估等多个脚本
效果:验证结果表明,相比复杂的SOTA方法,该方案可以获得更好的性能
特点:代码清晰易于理解,便于研究
总体来说,本项目提供了一个基于CLIP的图像检索任务强大且易于使用的解决方案,值得关注和参考。
0000
评论列表
共(0)条相关推荐
百度百家号上线创作者标注拍摄时间地点功能 AI创作需勾选声明
近日,百度上线创作者标注拍摄时间地点的功能。创作者在发布涉及公共政策等信息时,需要标注内容的来源和拍摄时间地点等信息。此外,创作者如使用AI创作的话,需勾选AI创作声明。具体功能详情如下:一、标注事件来源说明如是创作者自行拍摄的信息,需要说明事件所发生的时间及地点信息。如果创作者发布的内容来源为旧闻旧事,同样需要说明该事件发生的时间和地点。作者后台示例图片如下:站长网2023-09-09 15:31:050000iPhone 16系列4款机型曝光:屏幕尺寸、重量变了
快科技9月30日消息,据爆料,iPhone16系列也是4款机型,分别是iPhone16、iPhone16Plus、iPhone16Pro和iPhone16ProMax。对比iPhone15系列,iPhone16系列屏幕尺寸、重量有所变化。其中iPhone16和iPhone16Plus屏幕尺寸跟上一代保持不变,重量增加了约2g,分别是6.1英寸、173g和6.7英寸、203g。站长网2023-09-30 09:05:230000Intel推出Aurora genAI大模型 将应用于科学计算领域
Intel推出了AuroragenAI大模型,具有1万亿的参数量。AuroragenAI模型主要用于科学计算领域,包括生物学、癌症、大气科学、天文学、高分子化学等多个领域。AuroragenAI模型是为美国Argonne阿拉贡国家实验室开发的Aurora超算的配套模型,性能达到了200亿亿次,是当前全球百亿亿次超算冠军Frontier的2倍。站长网2023-05-23 11:27:590001什么值得买“AI问答机器人”通过备案 对话式机器人“小值”将上线
近日,值得买科技主营业务什么值得买App的“AI问答机器人”新功能,正式通过国家《生成式人工智能服务管理暂行办法》备案许可。据介绍,什么值得买“AI问答机器人”是一款消费领域垂类产品,将通过对话形式与用户进行交互,旨在为用户提供智能的消费辅助决策服务,根据用户需求指令,帮助用户快速甄选全网优质好物链接。站长网2024-01-25 11:04:540000百度搜索专项严打落地页色情博彩广告
昨日,百度搜索资源平台宣布将专项严打落地页色情博彩广告。百度表示,百度搜索一贯重视对含有色情博彩广告页面的打压,通过策略主动识别、清理含有害广告的搜索结果。通过冰桶算法对此类行为进行打击,尤其是4.5版本,更是加大了打击色情动图、露骨文本、非法博彩等恶劣诱导类的力度。面对最近有所抬头的博彩色情广告,百度搜索将加大打击力度,一旦发现将立即采取措施严肃处理,请各位站长尽快切换为合法合规的变现广告。站长网2023-07-08 17:01:040003