清华开源最懂表情包的中文开源大模型 最低只需要8.7G显存
站长网2023-05-22 09:42:050阅
最近,来自清华的一个叫VisualGLM-6B的大模型在网上热传。原因是有网友发现它似乎对表情包的解读有一手。无论是腊肠犬版蒙娜丽莎还是出租车后熨衣斗的男子,它都能准确解读。
值得注意的是,虽然VisualGLM-6B连gif也能看懂,但目前测试的结果来看,它的解读都太多正经,带有文字的表情包它则无法解读出原本要传达的情绪。
目前,VisualGLM-6B已经推出了网页端的试玩版。用户只需要在Hugging Face的试玩界面上传图片,并与其进行“对话”,它就可以生成对图片的理解结果。
实际上,VisualGLM-6B并不是专门为“表情包解读”而开发的。它由智谱AI和清华大学KEG实验室开发的开源多模态对话模型,主要用于中文图像理解。解读表情包只不过是该模型的“副业”之一。
VisualGLM-6B最大的特点在于结合模型量化技术,可以让用户在消费级的显卡上进行本地部署,在INT4量化级别下,最低只需要8.7G显存。
VisualGLM-6B试玩地址:
https://huggingface.co/spaces/lykeven/visualglm-6b
0000
评论列表
共(0)条相关推荐
微信已经不是私域平台了!
各位村民好,我是村长。微信已经越来越不像私域平台了,微信现在越来越百度化、抖音化了。面对抖音集团强有力的竞争,微信现在似乎也在慢慢妥协。除了现在微信添加好友一对一私聊外,微信在其他许多场景中,都逐渐在公域化,包括朋友圈。所以接下来,对于在私域生态做生意的朋友来说,既是机会也是挑战。今天就和大家一起盘点一下,微信近期基于公域化做的一些改变。01公众号文章推荐站长网2023-08-22 12:01:090001最基础的Python知识,学会这些已足够你开始写Python代码了
本章主要内容缩进和代码块构建识别注释给变量赋值对表达式求值使用常见数据类型获取用户输入选用正确的Python式编码风格本章介绍最基础的Python知识,包括如何使用赋值和表达式、如何输入数字或字符串、如何在代码中标明注释等。首先将介绍Python如何组织代码块,这与其他的所有主流语言都不一样。站长网2023-05-24 22:07:190000南洋理工大学研究人员推出研究人员发布Upscale-A-Video:利用文本提示提升视频超分辨率
**划重点:**1.🌐视频超分辨率面临多种挑战,NTU研究人员采用潜在扩散框架中的本地-全局时间一致性策略,通过文本提示引导纹理创作,实现真实细节的卓越提升。2.🔄通过本地微调和全局潜在传播模块,研究团队解决了CNN模型在生成真实纹理方面的限制,提高了视频局部和整体结构的稳定性。站长网2023-12-18 17:09:140000苹果开源图像新技术ml-mgie 可通过指令修改图片
苹果开源了一种新的技术,名为多模态大语言模型引导的编辑(MGIE),这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。MGIE采用多模态大型语言模型(MLLMs)进行图像编辑指令的生成,通过端到端训练,模型不仅捕捉视觉想象力,还执行图像处理操作。该方法在ICLR'24上取得了Spotlight成果。站长网2024-02-05 09:45:390002老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
【新智元导读】刚刚,英伟达发布了目前世界最强的AI芯片H200,性能较H100提升了60%到90%,还能和H100兼容。算力荒下,大科技公司们又要开始疯狂囤货了。英伟达的节奏,越来越可怕了。就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200!较前任霸主H100,H200的性能直接提升了60%到90%。站长网2023-11-14 08:59:500000