AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
谷歌最新文生图小型模型:MobileDiffusion
【AiBase提要:】
🌟专门为手机开发的文生图模型
🌟0.5秒内生成高质量512x512图像
🌟参数大小:共5.2亿参数
产品入口:https://top.aibase.com/tool/mobilediffusion
产品介绍:https://www.chinaz.com/2024/0201/1594690.shtml
Midjourney测试“风格一致性”功能
【AiBase提要:】
🌟可以从多张图片学习对应的风格然后结合提示词生成图片
🌟提供一个或多个图像的链接,用以描述想要的统一风格。
🌟该功能支持 V6和 Niji V6版本(不支持 V5等旧版本)
🌟未来将增加“一致性角色”特性
设置教程:https://www.chinaz.com/2024/0201/1594716.shtml
字节跳动推“Coze扣子”AI Bot开发平台
【AiBase提要:】
🤖 支持用户搭建自己的Chatbot
🔌 提供Bots商店和插件
🌐 功能丰富,包括无限拓展的能力集
官网地址:https://top.aibase.com/tool/coze
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
【AiBase提要:】
📈 浦语·灵笔2具有海量图文知识
🔍 输入图片和简短的文字生成图文混排长文章
📉 浦语·灵笔2基于书生·浦语2-7B模型
项目地址:https://top.aibase.com/tool/internlm-xcomposer2
Meta 推ReplaceAnything3D可用文本引导3D场景编辑
【AiBase提要:】
👉提出Erase-and-Replace方法
👉展示了RAM3D的多样性
👉解决了替换3D场景中的挑战
论文网址:https://arxiv.org/pdf/2401.17895.pdf
AI智能剪辑软件——AIMIX
【AiBase提要:】
🌟支持短视频批量混剪生产源源不断的短视频
🌟可以提取视频或音频里的文案,生成视频字幕
🌟提供了十几种真人语音配音,也支持源视频配音
🌟可通过简单的拖动进行场景排序,生成新的短视频脚本
产品入口:https://top.aibase.com/tool/aimixzhijian
产品介绍:https://www.chinaz.com/2024/0201/1594744.shtml
智能海报生成平台嗨AI海报30秒批量生成带货海报
【AiBase提要:】
⭐ 提供免费AI智能海报生成平台
⭐ 一键生成多种设计风格和模板
⭐ 支持快速生成节日海报、邀请函、日签等
官网地址:https://top.aibase.com/tool/heiaihaibao
免费AI换脸网站Change Face 一键玩转动漫名人变脸
【AiBase提要:】
⭐ 免费AI换脸网站
⭐ 利用人工智能算法实现面部交换
⭐ 支持换脸图片和视频
官网地址:https://top.aibase.com/tool/changeface-ai
Media2Face:支持语音等多模态引导生成3D面部动态表情
【AiBase提要:】
🧠 引入广义神经参数化面部资产(GNPFA),高度概括的表达潜在空间解耦表情和身份
🌈 创造 M2F-D 数据集,接受来自音频、文本和图像的多模态引导,拓展了3D面部动画的表现力和风格适应性
💡 Media2Face在共语面部动画领域取得了令人瞩目的成果,为面部动画合成的逼真度和表现力开辟了新的可能性。
产品项目入口:https://sites.google.com/view/media2face
📰🤖📢AI新鲜事
OpenAI着手研发GPT-4的早期预警系统
【AiBase提要:】
🤖 一项研究表明GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果不显著
🌐 研究限制,仅评估信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献
🏥 对100名参与者进行的研究,根据五个结果指标评估了参与者的表现,部分指标有所改善,但效果不足以在统计学上具有显著性
小米小爱同学AI助手通过大模型备案
【AiBase提要:】
⭐ 小爱同学AI助手通过国家备案
⭐ 小爱同学拥有更强大的大脑
⭐ 小爱同学AI助手将面向更广泛用户群体开放体验
谷歌计划推出高级订阅服务Bard Advanced
【AiBase提要:】
⭐ 谷歌计划推出高级订阅服务Bard Advanced
⭐ Bard Advanced将被锁定为订阅模式
⭐ Bard Advanced将由Gemini Ultra提供支持,预计将在“2024年初”发布
LLaVA-1.6来了!赶超Gemini Pro 提升推理性能
【AiBase提要:】
⭐ LLaVA-1.6提升了推理、OCR能力,支持更多场景和广泛用户。
⭐ LLaVA-1.6在多项基准测试中超越了Gemini Pro,并优于Qwen-VL-Plus。
⭐ LLaVA-1.6展现出强大的零样本中文能力,取得了SOTA性能。
Shopify发布“Magic”图像编辑器等AI增强功能,助力商家智能经营
【AiBase提要:】
🤖 "Magic"图像编辑器,自动生成产品描述、常见问题解答等营销文案,大幅提升效率
🤖 “Smart Sidekick”AI商业顾问,提供个性化建议,传递Shopify专业经验
🔍 利用AI改进搜索体验,语义搜索功能通过自然语言处理更好地理解搜索意图,搜索到购买转化率增加了7%
抖音开展“厚黑学”“伪成功学”专项治理行动
抖音宣布《开展“厚黑学”“伪成功学”专项治理》。抖音表示,近期平台在巡查中发现,有少数“自媒体”利用普通人想迅速成功的心理,针对性策划内容和开设矩阵号,将取得成功的方式简单化、套路化甚至“厚黑化”,并通过开设私董会、培训班等方式变现。也有部分“自媒体”,利用技术大爆炸时代普通人担忧“落伍”的正常心态,渲染社会焦虑并贩卖“解药”,通过大量矩阵号将用户引流至第三方以卖课、入群等方式变现。站长网2024-03-25 18:21:510000革命性视频合成工具MAGVIT-v2 将视觉内容转化为大模型的标记
最近,卡内基梅隆大学、Google研究以及乔治亚理工学院联合推出了一项名为MAGVIT-v2的视频标记工具,它成功地将图像和视频输入转化为大型语言模型(LLM)可识别的标记。项目地址:https://magvit.cs.cmu.edu/站长网2023-10-12 12:09:020007马斯克成立AI公司「xAI」 此前表示将推出TruthGPT
今日,特斯拉CEO马斯克宣布成立xAI。据介绍,xAI的目标是理解宇宙的真实本质。xAI团队由特斯拉和SpaceX的首席执行官伊隆·马斯克领导。站长网2023-07-13 21:47:390000直播电商走入深水区,如何穿越风暴?
2023年的双11已经过去,当消费者们纷纷收到商品的同时,直播电商行业也逐渐琢磨出了深藏在用户行为、行业脉动中的变化:头部直播间仍然火爆,但无论是消费者还是品牌主,对直播间的要求都更高了;新直播间很难崛起,今年双11京东采销的出圈背后有着巨大的资源投入以及舆论争议的推波助澜;“店播”在平台的猛推之下站到舞台C位,“达播”对于品牌的价值正在被全面重估,大批明星主播停播。站长网2023-11-17 17:55:470000田渊栋给OpenAI神秘Q*项目泼冷水:合成数据不是AGI救星,能力仅限简单数学题
Q*猜想,持续在AI社区火爆。大家都在猜测,Q*是否就是「Q-learningA*」。AI大牛田渊栋也详细分析了一番,「Q*=Q-learningA*」的假设,究竟有多大可能性。与此同时,越来越多人给出判断:合成数据,就是LLM的未来。不过,田渊栋对这种说法泼了冷水。我部分不同意「AGI只需通过放大合成数据就能解决」的说法。站长网2023-11-28 17:42:220000