首页站长资讯每日AI：谷歌推AI视频VideoPrism；ChatGPT新增文本朗读功能；Stability AI推图片放大工具Creative Upscaler；Stable Diffusion安卓版客户端来了

19223

每日AI：谷歌推AI视频VideoPrism；ChatGPT新增文本朗读功能；Stability AI推图片放大工具Creative Upscaler；Stable Diffusion安卓版客户端来了

站长网2024-02-26 15:33:553阅

欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

追赶Sora?谷歌推通用视频编码器——VideoPrism

【AiBase提要:】

⭐️ VideoPrism在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成训练，性能刷新30项SOTA。

⭐️ 谷歌团队推出全能通用视觉编码器VideoPrism，可处理视频理解任务，如分类、定位、检索、字幕和问答。

⭐️ VideoPrism的预训练利用了视频文本描述和上下文自监督，在各种视频理解任务上表现出色。

论文地址:https://arxiv.org/pdf/2402.13217.pdf

Stability AI推图像高清放大工具Creative Upscaler

【AiBase提要:】

⭐️ 分辨率提升至4K，无论原始图像大小如何

⭐️ 创造新细节，结合输入图像和文本提示

⭐️ 调整创造力水平，创造更多或更少新细节

产品入口:https://top.aibase.com/tool/creative-upscaler

Stable Diffusion安卓版客户端AllenTom/diffusion-client来了手机也可以玩SD

【AiBase提要:】

⭐ 项目目标是为Android用户提供与Stable-Diffusion-WebuUI服务交互的解决方案。

⭐ 客户端支持多种功能和模型，包括文本到图像、图像到图像、面部交换等。

⭐ 用户可以轻松进行图像处理和编辑，满足不同需求和创意。

项目地址:https://top.aibase.com/tool/diffusion-client

ChatGPT代码库变更:新增文本朗读功能 DALL·E3新增67种图像风格

【AiBase提要:】

⭐️ DALL·E3更新67种图像风格，提供更多选择和更强控制能力。

⭐️ 新增文本朗读功能，方便用户将文字转化为语音使用。

⭐️ 启动新聊天的创意提示，提高ChatGPT交互效率和质量。

元象推出高定制语音方案克隆语音最快只需5分钟数据

【AiBase提要:】

⭐ 多重技术手段实现高自然度语音交互体验

⭐ 可应用于客服、虚拟IP、直播、有声书、语音助手等领域

⭐ 通过文本处理、语义情感建模实现高自然度语音合成

出门问问开放大模型“序列猴子”开源数据集

【AiBase提要:】

🐵 公开出门问问的超大规模语言模型“序列猴子”的部分训练数据集。

📚 数据集包括中文通用文本、古诗今译和文本生成语料。

🌐 公司采用宽松许可协议，为开发者提供便捷使用条件。

项目地址:https://github.com/mobvoi/seq-monkey-data

Move AI推全新Move API 可轻松实现2D转3D

【AiBase提要:】

⭐ 使用单一相机捕捉人物运动，操作简单易上手。

⭐ 上传视频文件即可生成3D人类运动数据，流程简便快捷。

⭐ 支持多种3D文件格式，如usdz、usdc和fbx，应用广泛。

产品入口:https://top.aibase.com/tool/move-api

📰🤖📢AI新鲜事

Jasper公司收购Stability AI旗下的AI图像平台Clipdrop

【AiBase提要:】

⚙️ Clipdrop提供强大的AI图像编辑工具，企业客户可通过Jasper API访问，消费者可在Clipdrop.co购买独立版本。

💰 Stability AI因财务困境，获Intel投资5000万美元，一年后将Clipdrop出售给Jasper公司。

📈 Jasper公司收购将推动在AI图像处理领域市场份额，Stability AI将缓解财务压力，寻找新方向。

MusicMagus:基于扩散模型的文本精准编辑音乐片段

【AiBase提要:】

⭐ 音乐生成技术挑战:编辑生成音乐仍是难题，MusicMagus基于扩散模型提供精准修改解决方案。

⭐ 实验证实卓越性能:MusicMagus在音乐语义完整性和结构一致性方面显著优于基线模型。

⭐ 音乐编辑技术进步:利用先进扩散模型实现对特定音乐属性的精确修改，保持原始作品完整性。

论文地址 https://arxiv.org/abs/2402.06178

逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷，LLM严重降智

【AiBase提要:】

⚠️ 大模型逻辑推理表现受前提顺序影响，打乱顺序可导致性能下降30%。

⚠️ 改变前提叙述顺序对大模型推理表现有重大影响，Pro、GPT-3.5-Turbo表现下降。

⚠️ 逻辑推理中改变前提顺序让LLM性能大幅下降，需要进一步研究解决。

论文地址:https://arxiv.org/pdf/2402.08939.pdf

中国首部文生视频AI动画片发布将在央视综合频道开播

【AiBase提要:】

⭐️ 央视综合频道将播出国内首部文生视频AI动画片《千秋诗颂》

⭐️ 利用先进的AI技术，将中华经典诗词转化为具有中国审美特色的美术视觉

⭐️26集的动画片由人工智能辅助制作，具有里程碑意义，让观众感受中华经典诗词中的家国情怀和真情

每日AI谷歌推AI视频VideoPrismChatGPT新增文本朗读功能StabilityAI推图片放大工具CreativeUpscalerStableDiffusion安卓版客户端来了

0003

评论列表

共(0)条

相关推荐

站长资讯
vivo Y100发布售价1399元起
今日，vivo正式发布了千元档新品vivoY100，提供了琉云青、璃光蓝、星夜黑三种时尚配色。售价方面，vivoY1008GB128GB仅售1399元，8GB256GB只需1599元，12GB256GB仅1799元，12GB512GB仅售1999元，并将在11月4日正式开售。
站长网2023-10-30 15:40:02
0000
站长资讯
文字直播，闷声搞钱，日赚2000元
大家好，我是摸鱼掌柜。01、摸鱼思维很多人有一个不太健康的习惯，叫穷思竭虑。主要表现在过于在意别人的看法而不断内耗自己。一个人骂了你一句，你记了十年，就等于他骂了你十年。对于利益相关的人，要展示你的实力和智力。对于利益不相关的人，展示你的礼貌就好。可惜很多人把这个顺序弄反了，在无关利益的人身上花费时间，试图证明一些没意义的事。
站长网2023-04-27 18:00:37
0000
站长资讯
周鸿祎：大模型写作不是搜索逻辑提问需要得当且深刻
在日前的以《创业之路·保持好奇坚定挺住》为主题的直播对话中，360集团创始人周鸿祎在对话御风集团董事长、万通集团创始人冯仑时指出，大模型写作不是搜索的逻辑，而是在自己「阅读」过的知识中，快速地组织形成一篇文章。周鸿祎指出，其实很多人不懂得向大模型提问，提问的方式也非常简单，但事实上，如果提问的方式得当，且提问深刻，大模型回答的问题便会更加的具体、深入。
站长网2023-06-08 13:35:45
0000
站长资讯
推特疯传AI生成“五角大楼发生大爆炸”假图导致股市短暂下跌
日前，一张在Twitter上通报“五角大楼发生大爆炸”的假图广泛传播，并导致了股市下跌。据了解，在Twitter上疯传一张有关五角大楼发生爆炸的的假图，导致股市下跌。这张图片几乎可以确信是由人工智能生成的，尽管执法机构在Twitter上证明了这张图片是假的，但股市仍面临着极大的风险。
站长网2023-05-23 10:30:47
0000
站长资讯
云安全公司Zscaler 收购 Avalor 将更多人工智能引入其安全工具
云安全公司Zscaler周四宣布，以3.1亿美元的现金和股权收购了网络安全初创公司Avalor，此举将扩展Zscaler现有的平台功能。Zscaler创始人兼CEOJayChaudhry表示，此次收购将使公司能够更好地利用基于大型语言模型的人工智能技术，简化安全事件报告、事件缓解、资产发现、数据分类和安全策略生成等流程。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2024-03-15 11:18:34
0000