首页站长资讯Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数，100毫秒极速响应

Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数，100毫秒极速响应

站长网2023-10-19 15:01:420阅

要点:

1. Transformer一作Ashish Vaswani所在的AI公司Adept发布了Fuyu-8B，一个多模态大模型，拥有80亿参数，能够理解各种图像类型，包括照片、图表、PDF和界面UI。

2. Fuyu-8B采用了一种纯解码器Transformer架构，不使用图像编码器，支持任意图像分辨率，表现在多项任务中优于其他大型模型。

3. Adept的目标是打造一个AI Copilot，具备强大的图像理解能力，能辅助人类完成工作，如阅读网页、PPT、PDF和图表等，该公司已经完成B轮融资，估值超过10亿美元。

Transformer一作Ashish Vaswani所在的AI公司Adept发布了多模态大模型Fuyu-8B。这一模型具有80亿参数，可理解各种图像类型，包括照片、图表、PDF和界面UI。

Demo试玩:

https://huggingface.co/spaces/adept/fuyu-8b-demo

不仅如此，Fuyu-8B还能以出色的速度进行图像处理，提供快速响应。与其他大型模型不同的是，它采用了一种纯解码器Transformer架构，不需要图像编码器，可以支持任意图像分辨率，从而在多项任务中表现更加出色。

Adept公司的目标是打造一个AI Copilot，这意味着大模型需要具备出色的图像理解能力，能够理解用户屏幕上的内容，帮助人类快速完成各种工作，如阅读网页、PPT、PDF和图表等。

该公司已经获得4.15亿美元的融资，并估值超过10亿美元，展现出其巨大的潜力。

这一新工作的团队由业内大佬共同创立，包括Transformer一作Ashish Vaswani、前OpenAI工程副总裁以及其他资深专业人士。他们已经在多个项目中展现出强大的技术实力，包括GPT-2、GPT-3、CLIP和DALL-E等模型的开发。

此外，Adept公司还非常注重开源工作，推出了多个开源项目，包括Persimmon-8B和Fuyu-8B。这一创新团队的目标是利用大模型的能力来提升人机合作，使得人类能更高效地完成各种任务。

Transformer一作公司Adept发布多模态大模型Fuyu8B 80亿参数100毫秒极速响应

0000

评论列表

共(0)条

相关推荐

站长资讯
从0到4万在线只用1个月：游戏蹿红，但作者跑路了？
最近一个多月，一款名为《PokéRogue（宝可梦肉鸽）》宝可梦同人网页游戏悄悄蹿红(游戏链接可见文末或阅读原文)。游戏在今年3月下旬发布，最初的人气并不高，只是在宝可梦社区慢慢发酵，但也吸引了一些宝可梦圈的爱好者在油管和X特上直播和发视频，这也让游戏的注册人数，在4月上旬逐渐来到10万的规模。“游戏初期没多少人关注，所以我做个视频（推广下）”
站长网2024-06-11 17:20:33
0000
滴滴程维：柳青升任永久合伙人不再设总裁岗位
快科技5月19日消息，滴滴创始人、董事长兼CEO程维与滴滴联合创始人、董事兼总裁柳青联合发布内部全员信，宣布柳青升任公司永久合伙人。同时，柳青不再任董事和总裁，而在未来，滴滴公司也不再设置总裁岗位。升任永久合伙人后，柳青分管的部门和职责不变，并继续担任公司首席人才官，专注在公司人才、组织建设及社会责任工作上，并继续向董事长兼CEO程维汇报。
站长网站长资讯2024-05-20 10:39:16
0000
站长资讯
苹果发布新款iPad Air：新iPad Pro从M2直接跃升至M4
5月7日晚10点苹果公司举行了盛大的新品发布会，其中最引人注目的无疑是全新iPadPro的亮相。这款平板电脑搭载了引领行业的M4系列芯片，采用3nm工艺，配备10核心CPU，性能相比M2提升高达50%。同时，M4芯片还配备了10核GPU和16核神经网络引擎，为用户带来前所未有的计算与处理能力。
站长网2024-05-08 21:42:49
0000
站长资讯
Stable Diffusion母公司CEO称：AI是一个1万亿美元的投资机会
据CNBC报道，开源人工智能公司StabilityAI的首席执行官表示，人工智能将是有史以来最大的泡沫。上周，StabilityAI的首席执行官EmadMostaque在与UBS分析师的电话会议上说，关于人工智能:“我认为这将是有史以来最大的泡沫。”他补充说，它仍处于非常早期的阶段，还没有准备好在银行等行业进行大规模的应用。“我称之为‘点AI’机遇，它甚至还没有开始，”他说。
站长网2023-07-18 00:04:34
0000
站长资讯
阿里达摩院发布多癌影像分析通用模型
阿里达摩院发布了一款多癌影像分析通用模型，可以检测、分割和诊断八种主要的高发致死癌症。这个模型通过使用MaskTransformer语义分割和肿瘤表示学习方法，解决了多种肿瘤图像统一检测的难题，适用于肺、结直肠、肝、胃、乳腺、食管、胰腺和肾等癌症类型。
站长网2023-08-17 09:06:54
0000