AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
谷歌最新文生图小型模型:MobileDiffusion
【AiBase提要:】
🌟专门为手机开发的文生图模型
🌟0.5秒内生成高质量512x512图像
🌟参数大小:共5.2亿参数
产品入口:https://top.aibase.com/tool/mobilediffusion
产品介绍:https://www.chinaz.com/2024/0201/1594690.shtml
Midjourney测试“风格一致性”功能
【AiBase提要:】
🌟可以从多张图片学习对应的风格然后结合提示词生成图片
🌟提供一个或多个图像的链接,用以描述想要的统一风格。
🌟该功能支持 V6和 Niji V6版本(不支持 V5等旧版本)
🌟未来将增加“一致性角色”特性
设置教程:https://www.chinaz.com/2024/0201/1594716.shtml
字节跳动推“Coze扣子”AI Bot开发平台
【AiBase提要:】
🤖 支持用户搭建自己的Chatbot
🔌 提供Bots商店和插件
🌐 功能丰富,包括无限拓展的能力集
官网地址:https://top.aibase.com/tool/coze
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
【AiBase提要:】
📈 浦语·灵笔2具有海量图文知识
🔍 输入图片和简短的文字生成图文混排长文章
📉 浦语·灵笔2基于书生·浦语2-7B模型
项目地址:https://top.aibase.com/tool/internlm-xcomposer2
Meta 推ReplaceAnything3D可用文本引导3D场景编辑
【AiBase提要:】
👉提出Erase-and-Replace方法
👉展示了RAM3D的多样性
👉解决了替换3D场景中的挑战
论文网址:https://arxiv.org/pdf/2401.17895.pdf
AI智能剪辑软件——AIMIX
【AiBase提要:】
🌟支持短视频批量混剪生产源源不断的短视频
🌟可以提取视频或音频里的文案,生成视频字幕
🌟提供了十几种真人语音配音,也支持源视频配音
🌟可通过简单的拖动进行场景排序,生成新的短视频脚本
产品入口:https://top.aibase.com/tool/aimixzhijian
产品介绍:https://www.chinaz.com/2024/0201/1594744.shtml
智能海报生成平台嗨AI海报30秒批量生成带货海报
【AiBase提要:】
⭐ 提供免费AI智能海报生成平台
⭐ 一键生成多种设计风格和模板
⭐ 支持快速生成节日海报、邀请函、日签等
官网地址:https://top.aibase.com/tool/heiaihaibao
免费AI换脸网站Change Face 一键玩转动漫名人变脸
【AiBase提要:】
⭐ 免费AI换脸网站
⭐ 利用人工智能算法实现面部交换
⭐ 支持换脸图片和视频
官网地址:https://top.aibase.com/tool/changeface-ai
Media2Face:支持语音等多模态引导生成3D面部动态表情
【AiBase提要:】
🧠 引入广义神经参数化面部资产(GNPFA),高度概括的表达潜在空间解耦表情和身份
🌈 创造 M2F-D 数据集,接受来自音频、文本和图像的多模态引导,拓展了3D面部动画的表现力和风格适应性
💡 Media2Face在共语面部动画领域取得了令人瞩目的成果,为面部动画合成的逼真度和表现力开辟了新的可能性。
产品项目入口:https://sites.google.com/view/media2face
📰🤖📢AI新鲜事
OpenAI着手研发GPT-4的早期预警系统
【AiBase提要:】
🤖 一项研究表明GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果不显著
🌐 研究限制,仅评估信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献
🏥 对100名参与者进行的研究,根据五个结果指标评估了参与者的表现,部分指标有所改善,但效果不足以在统计学上具有显著性
小米小爱同学AI助手通过大模型备案
【AiBase提要:】
⭐ 小爱同学AI助手通过国家备案
⭐ 小爱同学拥有更强大的大脑
⭐ 小爱同学AI助手将面向更广泛用户群体开放体验
谷歌计划推出高级订阅服务Bard Advanced
【AiBase提要:】
⭐ 谷歌计划推出高级订阅服务Bard Advanced
⭐ Bard Advanced将被锁定为订阅模式
⭐ Bard Advanced将由Gemini Ultra提供支持,预计将在“2024年初”发布
LLaVA-1.6来了!赶超Gemini Pro 提升推理性能
【AiBase提要:】
⭐ LLaVA-1.6提升了推理、OCR能力,支持更多场景和广泛用户。
⭐ LLaVA-1.6在多项基准测试中超越了Gemini Pro,并优于Qwen-VL-Plus。
⭐ LLaVA-1.6展现出强大的零样本中文能力,取得了SOTA性能。
Shopify发布“Magic”图像编辑器等AI增强功能,助力商家智能经营
【AiBase提要:】
🤖 "Magic"图像编辑器,自动生成产品描述、常见问题解答等营销文案,大幅提升效率
🤖 “Smart Sidekick”AI商业顾问,提供个性化建议,传递Shopify专业经验
🔍 利用AI改进搜索体验,语义搜索功能通过自然语言处理更好地理解搜索意图,搜索到购买转化率增加了7%
微软 Edge 浏览器内的 Bing Chat 将具备聊天记录功能
微软广告和网络服务首席执行官MikhailParakhin在回答网友的提问时表示,微软Edge浏览器内的BingChat将支持聊天记录功能。一位推特用户询问Parakhin:“如果Edge侧边栏上的必应也能记录对话内容,那真的太好了。”Parakhin回答:“是的,这个功能即将推出。”站长网2023-07-12 14:30:190000周鸿祎回应程前道歉:未来属于不断进步和反思的年轻人
在近期结束的“2023年风马牛年终秀”活动中,一场意外的事件成为了网友们热议的焦点。在圆桌论坛环节中,主理人程前与冯仑、王石、周鸿祎三位嘉宾的对话出现了火药味,引发了广泛的关注和讨论。站长网2024-01-11 09:05:060000安恒信息发布“恒脑”安全垂域大模型
今日下午,安恒信息正式发布“恒脑・安全垂域大模型”,恒脑安全大模型具备恶意代码检测、威胁情报分析、自动化安全编排响应和安全教育等能力,可降低安全运营门槛,提升效率,帮助填补安全专家短缺问题。据悉,“恒脑・安全垂域大模型”后续将为安恒信息数据安全战略、MSS战略和人才战略三大战略提供发展源动力。站长网2023-08-28 17:55:040000全球最快AI芯片WSE-3发布 性能碾压H100!
要点:1.全球最强AI芯片WSE-3发布,单机可训24万亿参数的模型,性能远超英伟达H100GPU。2.WSE-3采用4万亿晶体管5nm制程,具备90万个AI核心和44GB片上SRAM存储,峰值性能达到125FP16PetaFLOPS,并实现了单芯片集群级性能。站长网2024-03-15 09:42:450000苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在2024苹果股东大会上,苹果CEO蒂姆・库克表示,今年将在GenAI领域实现重大进展。此外,苹果宣布放弃10年之久的造车项目之后,一部分造车团队成员也开始转向GenAI。站长网2024-03-16 13:45:350001