上海AI实验室开源图文混合创作大模型浦语灵笔
要点:
浦语灵笔是基于书生·浦语大语言模型的多模态创作模型,能够接受视觉和语言输入,生成图文并茂的文章。
浦语灵笔具有强大的多模态理解能力,能够进行流利的中英文图文对话,准确识别图像内容,尤其是中国文化相关的知识。
浦语灵笔已开源其中的智能创作和对话及多任务预训练版本,并提供免费商用,支持多种类型文章的图文生成。
上海人工智能实验室(上海AI实验室)近日推出了首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。
浦语灵笔是基于书生·浦语大语言模型(InternLM)的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B(InterLM-7B)及20B(InternLM-20B)版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。
项目地址:https://github.com/InternLM/InternLM-XComposer
浦语灵笔不仅能够进行流利的中英文图文对话,准确理解图像内容,还具备了图文并茂文章创作的全新能力。
用户仅需提供主题或图片,便可一键生成涵盖历史沿革、主要景点文物介绍等方面的长篇文章,并在适当位置自动插入与文字信息对应的图片。除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容。
目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力,适应更多样化任务需求。
浦语灵笔为图文文章创作设计了“三步走”的算法流程。首先,根据用户输入的主题或图片,浦语灵笔利用其强大的写作能力,创作出文采斐然的文章。其次,浦语灵笔自动分析文章内容和段落布局,规划需要插图图片的位置,并生成对图片内容需求的描述。最后,采用从粗筛到精选的配图策略,利用多模态大模型强大的图像理解能力,从海量图库中选择出最符合文章上下文内容和整体图像风格的图片,完成文章的自动配图。
浦语灵笔出色的图文创作效果,得益于其多任务预训练模型(InternLM-XComposer-VL-7B)强大的多模态理解能力。
研究人员采用5个主流的多模态大模型评测对InternLM-XComposer-VL-7B进行了详细测试,包括MME Benchmark、MMBench、MMBench-CN、Seed-Bench和CCBench等中英文评测。
评测结果显示,在上述5项评测中,浦语灵笔均体现出卓越性能,尤其是在中国文化理解方面,表现出深厚的知识积淀。
浦语灵笔现已开源,同时上线GitHub、Hugging Face及魔搭社区(ModelScope),欢迎开发者下载试用。
微软应用商店 AI 摘要功能开始向 Windows Insider 提供预览版
站长之家(ChinaZ.com)7月25日消息:自从微软推出了面向开发者的AI中心以来已经过去了一段时间。其中最受期待的功能之一是在MicrosoftStore上的AI摘要器,它可以在几秒钟内将数百甚至数千条在线评论总结成一个简洁的段落。站长网2023-07-26 08:59:160000新规来了!探店视频挂链接将视为广告,乱象该停止了......
监管之风,吹向了乱象丛生的探店内容赛道。近日,有消息称,《互联网广告管理办法》即将在5月1日实施,其中提到“通过知识介绍、体验分享、消费测评等形式推销商品或者服务,并附加购物链接等购买方式的,广告发布者应当显著标明‘广告’”,而大众所熟悉的达人探店类短视频内容,属于该规定范围内。这意味着,以后探店视频要么不再能挂上链接,要么就变成广告。站长网2023-04-26 09:05:250000马斯克脑机接口人体临床研究获批 开颅只需15分钟
脑机接口公司Neuralink在推特上表示,Neuralink的N1植入式设备已获得美国食品和药物管理局(FDA)的批准,即将启动其首次人体临床研究。Neuralink的N1植入式设备是一种植入大脑并连接到电极的小型芯片,可以检测大脑信号并将其传输到计算机或智能手机。该设备旨在帮助瘫痪患者用意念控制电脑和智能手机,让他们可以打字、浏览互联网,甚至可以使用智能家居设备控制他们的环境。站长网2023-05-29 12:10:020001Altman力推GPT-4新应用:让GPT-4能穿梭时空,过目不忘的私人AI助理
【新智元导读】Rewind是一款结合了GPT-4能力的时空搜索工具。每个月只要12刀,就能获得一个过目不忘的AI助理。最近一个GPT-4的应用火了!甚至Altman本人都亲自给他站台!这是一款名叫Rewind的应用。网友给它起了一个略显中二的名字「人生搜索引擎」。简单来说,这个APP最主要的功能就是帮你寻找到自己在iPhone和Mac上以前看过的所有数据,并以此为基础回答你的所有问题。站长网2023-08-16 11:28:450000重磅,Meta开源“次世代”大模型Llama 2,扎克伯格:免费可商用
站长网2023-07-19 20:14:440001