Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数,100毫秒极速响应
要点:
1. Transformer一作Ashish Vaswani所在的AI公司Adept发布了Fuyu-8B,一个多模态大模型,拥有80亿参数,能够理解各种图像类型,包括照片、图表、PDF和界面UI。
2. Fuyu-8B采用了一种纯解码器Transformer架构,不使用图像编码器,支持任意图像分辨率,表现在多项任务中优于其他大型模型。
3. Adept的目标是打造一个AI Copilot,具备强大的图像理解能力,能辅助人类完成工作,如阅读网页、PPT、PDF和图表等,该公司已经完成B轮融资,估值超过10亿美元。
Transformer一作Ashish Vaswani所在的AI公司Adept发布了多模态大模型Fuyu-8B。这一模型具有80亿参数,可理解各种图像类型,包括照片、图表、PDF和界面UI。
Demo试玩:
https://huggingface.co/spaces/adept/fuyu-8b-demo
不仅如此,Fuyu-8B还能以出色的速度进行图像处理,提供快速响应。与其他大型模型不同的是,它采用了一种纯解码器Transformer架构,不需要图像编码器,可以支持任意图像分辨率,从而在多项任务中表现更加出色。
Adept公司的目标是打造一个AI Copilot,这意味着大模型需要具备出色的图像理解能力,能够理解用户屏幕上的内容,帮助人类快速完成各种工作,如阅读网页、PPT、PDF和图表等。
该公司已经获得4.15亿美元的融资,并估值超过10亿美元,展现出其巨大的潜力。
这一新工作的团队由业内大佬共同创立,包括Transformer一作Ashish Vaswani、前OpenAI工程副总裁以及其他资深专业人士。他们已经在多个项目中展现出强大的技术实力,包括GPT-2、GPT-3、CLIP和DALL-E等模型的开发。
此外,Adept公司还非常注重开源工作,推出了多个开源项目,包括Persimmon-8B和Fuyu-8B。这一创新团队的目标是利用大模型的能力来提升人机合作,使得人类能更高效地完成各种任务。
YouTube在最新测试中使用人工智能总结视频
根据7月31日支持页面上的通知,谷歌正在尝试使用人工智能自动生成YouTube视频摘要。这些摘要只会出现在有限数量的英语视频旁边,并且只能由有限数量的用户观看。它们将出现在YouTube的观看和搜索页面上,旨在简要概述视频内容,而不取代人工编写的现有描述。站长网2023-08-02 10:04:010000开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
刚刚,谷歌杀入开源大模型。开源领域大模型,迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比Gemini,Gemma更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。Gemma官方页面:https://ai.google.dev/gemma/站长网2024-02-22 09:07:140000北京发布互联网信息服务算法推荐合规指引
据网信北京微信公众号消息,随着人工智能、大数据等新型信息技术的发展,算法广泛应用于互联网,为用户提供个性化、精准化、智能化的信息服务。与此同时,算法的不合理应用也影响了正常的信息传播秩序、市场秩序和社会秩序,给维护社会公平公正和网民合法权益带来挑战。站长网2023-04-27 10:45:370000Meta更新AI模型Code Llama70B 准确性更高
Meta最新更新了其代码生成AI模型,CodeLlama70B,这是“目前最大、最优秀的模型”。CodeLlama工具于2023年8月推出,无论是研究还是商业用途,都是免费的。根据Meta的AI博客上的一篇文章,CodeLlama70B能够处理比以前版本更多的查询,这意味着开发者可以在编程时输入更多的提示,而且它的准确性也更高。站长网2024-01-30 08:42:260000分析数百个涨粉新星,我找到了小红书内容赛道的3个趋势
2023拉下帷幕,昨天,知名商业智能数据服务商QuestMobile发布了《2023中国移动互联网年度报告》。报告显示,在经历了十多年的持续增长之后,中国移动互联网使用粘性2023年出现了轻微下滑。2023年12月,移动互联网月人均时长为165.9小时,同比下降了近12小时、约7%;月人均使用次数为2559.6次,同比微降了近3%;月人均使用APP个数则同比继续微涨。站长网2024-02-01 09:08:050000