今日AI:GPT4强敌Inflection-2.5模型发布;Midjourney要推中国版APP;MovieLLM一句话生成电影
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
📰🤖📢AI新鲜事
媲美GPT4!InflectionAI发布Inflection-2.5版本模型高智商加高情商
【AiBase提要:】
⭐Inflection-2.5在性能上媲美GPT4,仅使用四成训练计算量
⭐结合高智商和高情商,提升编程数学能力同时保持同情心
⭐支持多平台使用,具备实时网络搜索能力,大大提高用户体验
详情:https://top.aibase.com/tool/inflection-2-5
Midjourney计划推出中国版MidjourneyDesktopApp
【AiBase提要:】
⭐与Slack类似的中国版MidjourneyDesktopApp即将推出
⭐新版本应用在总体设计上与官方版一致,但在内容组织和社交功能上有差异
⭐增加更多管理功能以适应当地监管需求
Midjourneyv6版本describe功能上线生成的提示词更长更详细
【AiBase提要:】
⭐️上传图片后会生成更长更详细的提示词
⭐️更符合V6模型的倾向
⭐️不会写提示词也能根据参考图生成类似的图片
Adobe将生成式AI技术Firefly引入移动端 Express应用
【AiBase提要:】
⭐️ Adobe在移动设备上推出Firefly GAI功能
⭐️ 用户只需输入文本提示即可生成所需图像
⭐️ Express移动应用还支持视频编辑和社交内容调度
Firefly产品入口:https://top.aibase.com/tool/adobe-firefly
研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
【AiBase提要:】
⚙️CyberDemo在各种操作任务中表现更高成功率,尤其在处理未见过的物体时表现出色。
🌐CyberDemo的方法挑战了依赖真实示范数据的传统观念,展示了模拟数据的潜力。
🤖CyberDemo利用模拟人类示范数据完成真实世界机器人操纵任务,提高任务性能和泛化能力。
论文地址https://arxiv.org/abs/2402.14795
项目地址:https://top.aibase.com/tool/cyberdemo
Meta计划到2026年推出生成式AI模型,为Reels等提供支持
【AiBase提要:】
⭕Meta计划推出新AI模型,支持视频内容领域。
⭕目标是提高用户推荐参与度,转变为整体生态系统。
⭕Meta扩大模型规模,希望成为一站式娱乐服务平台。
🤖📱💼AI应用
MyShell多语言、多口音文本转语音库MeloTTS开源
【AiBase提要:】
⭐MeloTTS支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
⭐生成速度贼快,秒级转录
⭐开发人员可以自由使用和修改MeloTTS,还有小部件生成器可扩展功能。
试玩地址:https://top.aibase.com/tool/melotts
MovieLLM:一个词或一句话就能合成电影级视频
【AiBase提要:】
⭐️MovieLLM框架可以从简单文本提示中生成高质量、电影级别视频数据。
⭐️MovieLLM结合GPT-4和文本到图像模型生成详细剧本和视觉内容。
⭐️MovieLLM为AI模型提供训练材料,推动长视频内容生成和理解。
项目地址:https://top.aibase.com/tool/moviellm
NaturalSpeech3:可克隆音色和感情的语音合成系统
【AiBase提要:】
🚀使用神经编解码器进行语音波形分解,实现细致入微的语音建模。
📈NaturalSpeech3在质量、相似度、韵律和可懂度方面优于现有TTS系统。
🔍通过分解扩散模型生成自然语音,在LibriSpeech和Ravdess基准测试上表现出色。
项目网址:https://top.aibase.com/tool/naturalspeech-3
Design2Code:提供设计图,让多模态LLM自动生成前端代码
【AiBase提要:】
⭐️生成AI在多模态理解和代码生成方面取得显著进展,为前端开发带来全新范式。
⭐️研究人员对设计转换为代码任务进行系统研究,提出自动评估指标。
⭐️GPT-4V表现出色,生成网页在视觉和内容方面有望取代原始参考网页。
项目入口:https://top.aibase.com/tool/design2code
——————————-
今日Midjourney提示词分享:3.8女神特辑
3D cartoon style rendering, A beautiful woman stands behind a tulip flower, perfect facial details and exquisite character details. Panorama, large aperture, trendy fashion clothes, new trend portraits, vibrant colors, popMart production, delicate gloss, clean background,8K gradient translucent glass melt, frosted glass --niji6
横版:
图源备注:图片由AI生成,图片授权服务商Midjourney
竖版:
Mastercard推AI购物助手“Shopping Muse”:帮消费者挑礼物
划重点:🤖基于个人消费者的独特档案和喜好,Mastercard推出了ShoppingMuse,这是一款使用人工智能提供个性化礼物建议的服务。⚙️ShoppingMuse由DynamicYield提供支持,这是Mastercard在2022年4月从麦当劳收购的个性化平台和决策引擎。该AI工具通过对话转化消费者的请求为定制的产品建议,并考虑其个人档案、购物意图和偏好。站长网2023-12-01 11:16:500000李嘉诚布局大模型
当房地产商高喊向科技领域转型之际,往往也是其核心地产业务陷入危机之时。为寻找新增长曲线,2018年,许家印通过投资贾跃亭的法拉第未来,正式进军新能源汽车,随后又走上自主造车之路;同年,杨国强开始投资建筑机器人研发以及打造高科技农业生态圈。站长网2023-10-09 17:46:370000雷军公布第二批小米汽车交付中心候选名单:网友投票选出10个城市
快科技3月22日消息,小米首款汽车SU7将于3月28日正式上市,目前多地交付中心已经准备完善。据爆料,全国29城、59家门店将于3月25日提前开启品鉴,首批城市包括北京、上海、广州、深圳、宁波、无锡、重庆、武汉、杭州、郑州、厦门等。今天上午,雷军又发文征集第二批小米汽车交付中心城市,公布了一批候选名单,希望网友投票选出10个城市。站长网2024-03-23 03:46:440001字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。在使用相同的数据集和训练方案时,ViTamin在ImageNet零样本准确率上比ViT提高了2.0%。此外在分类、检索、开放词汇检测和分割、多模态大语言模型等60个不同基准上都表现出了良好的结果。站长网2024-04-27 18:52:08000115万美国汽车人罢工!马斯克炫耀:我发的工资比你们要的还多
9月16日消息,全美汽车工人联合会(UnitedAutomobileWorkers,UAW)针对美国汽车三巨头通用、福特、标致雪铁龙母公司Stellantis的大罢工已经开始。业内人士称,同时对三大公司进行罢工,对于UAW尚属首次。鹬蚌相争,渔翁得利。可能受益于该起事件的特斯拉CEO埃隆马斯克随后发布消息炫耀说,我发给工人的工资,比UAW想要的还高。”站长网2023-09-16 12:07:310000