首页站长资讯AI日报：谷歌Gemini 1.5 Flash可免费使用；哩布哩布完成数亿元融资；苹果AI新功能将推迟至iOS 18.1版本

AI日报：谷歌Gemini 1.5 Flash可免费使用；哩布哩布完成数亿元融资；苹果AI新功能将推迟至iOS 18.1版本

站长网2024-07-30 08:48:071阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、告别P图困扰!Diffree直接通过文字描述就可无痕添加物体

在这个AI技术飞速发展的时代，Diffree作为一项能让设计师和摄影师们欢呼雀跃的AI图像处理技术，通过文本引导实现在图片中无缝添加新物体，降低了图像编辑门槛，让每个人都能成为创造者。

【AiBase提要:】

🎨 Diffree利用文本引导功能，根据简单文字描述在图像中添加新物体，实现无缝融合。

🔍 基于"文本到图像"模型，Diffree通过训练学会生成图像内容，利用"Stable Diffusion"扩散模型预测新物体位置。

✨ Diffree不仅能单次添加物体，还能多次添加并保持背景一致性，在实验证明中表现优越，降低了图像编辑难度。

详情链接:https://top.aibase.com/tool/diffree

2、谷歌推Alchemist技术实现图片材质精准编辑

谷歌研究团队最近推出了一项突破性技术Alchemist，使用户能够精确编辑图片中物品的材质属性，无需专业技能。这项技术基于经过微调的Text-to-Image生成模型，通过合成数据集和修改模型架构实现精细控制。实验结果显示技术有效改变物品外观，应用前景广阔。尽管存在局限性，但研究团队对其潜力充满信心，有望为图像编辑领域带来革命性变革。

【AiBase提要:】

✨ 突破性技术Alchemist实现精准编辑图片材质属性，无需专业技能。

🌟 实验结果显示技术有效改变物品外观，应用前景广阔。

💡 研究团队对Alchemist技术的潜力充满信心，有望为图像编辑领域带来革命性变革。

详情链接:https://prafullsharma.net/alchemist/

3、Google Gemini重大更新Gemini1.5Flash可免费使用

Google近日宣布了其AI助手Gemini的一系列重大更新，旨在提高用户体验并扩大其应用范围。更新涵盖了性能提升、新功能引入以及用户群体的扩展。Gemini1.5Flash版本带来了免费版Gemini的全面升级，提升了响应速度、推理能力和图像理解。

【AiBase提要:】

✨ Gemini1.5Flash版本全面升级，提升性能和功能。

🔗 文件上传功能即将推出，便于处理复杂任务。

🌐 Gemini功能将推广到更多平台和地区，支持更多语言。

4、苹果新AI功能或将推迟至iOS18.1版本发布

苹果公司备受期待的新AI功能 Apple Intelligence 可能无法赶上iOS18的首次发布。尽管用户对于新功能的推迟可能感到失望，但这也展现了苹果注重产品稳定性和完善度的态度。

【AiBase提要:】

📅 新AI功能可能推迟至iOS18.1版本发布，Beta测试将在本周开始。

📉 升级版Siri等其他AI更新或推迟至2025年才能与用户见面。

📈 苹果公司在整合AI技术到产品中时更注重稳定性和完善度，而非急于赶上发布日期。

5、Llama4启动训练 Meta科学家揭秘Llama3.1训练背后的故事

在播客节目Latent Space中，Meta的科学家Thomas Scialom揭开了Llama3.1的研发秘籍，透露了Llama4的神秘面纱。文章深入探讨了Llama3.1的诞生背后的平衡挑战与技术突破，展示了Meta在AI领域的领先地位和未来展望。

【AiBase提要:】

🔍 Llama3.1的诞生是参数规模、训练时间与硬件限制的完美平衡，挑战GPT-4o，展现了Meta的技术实力。

🔑 在研发过程中重视训练数据总量，选择增加训练token数，通过15T的token海洋实现知识深度与广度的飞跃。

💡 创新地选择合成数据进行后训练，尝试多种模型评估与改进方法，展示了Meta在AI技术上的探索与突破。

6、亚马逊云发布Amazon Q Apps:允许用户构建自己的生成式 AI 应用程序

在亚马逊云科技纽约峰会上，亚马逊云科技发布了Amazon Q Apps服务，为用户提供便捷的生成式AI应用程序构建方式。这项服务将AI技术应用变得更加简单易用，为用户提供了更多机会探索AI应用的可能性。

【AiBase提要:】

🚀 Amazon Q Apps服务让用户可以根据简单描述创建应用程序，无需技术背景也能使用。

💻 Amazon Q Developer集成到Amazon SageMaker Studio，为机器学习模型开发带来便捷。

🔒 Amazon Bedrock更新了功能，帮助用户轻松访问高性能大语言模型和构建安全、隐私的生成式AI应用程序。

7、AI离人类有多远?一个晾衣问题暴露GPT-4致命缺陷

在Quanta Magazine的播客中，华盛顿大学计算机教授Yejin Choi与主持人Steven Strogatz展开了关于人工智能的深刻对话，探讨AI是否需要具备身体和情感才能发展出与人类相似的常识。虽然大型语言模型（LLM）在语言能力上取得进展，但在理解基本常识方面仍存在挑战。Choi教授的实验室致力于教授AI常识，认为AI应该拥有情商和意识，以更人性化地与人类互动。

【AiBase提要:】

🧠 LLM表现接近人类智能，但训练方式与人类不同

🤖 AI在理解基本常识方面存在挑战，如ChatGPT回答问题出错

📚 Choi教授实验室研究教授AI常识，通过提供声明性知识帮助神经网络学习

详情链接:https://www.quantamagazine.org/will-ai-ever-have-common-sense-20240718/

8、AI图像生成平台LiblibAI完成数亿元融资创国内行业新高

LiblibAI是国内领先的AI图像生成平台，最近完成了数亿元人民币的三轮融资，创下国内AI图像赛道的最大总融资纪录。公司快速发展得益于明确的产品战略和强大的社区生态，面临的挑战是平衡先进模型发展速度与用户需求。团队成员来自知名高校，具备丰富的互联网和设计行业背景，为公司的持续创新提供支持。

【AiBase提要:】

🚀 LiblibAI完成数亿元融资，创下国内AI图像赛道最大总融资纪录。

💡 公司快速发展得益于明确的产品战略和强大的社区生态，积累近1000万专业AI图像创作者。

⚖️ 面临的挑战是平衡先进模型发展速度与用户需求，团队强调用AI-native思维设计产品。

9、Hierarchical3D Gaussian:实时渲染大规模高质量3D场景

在虚拟现实和计算机图形学领域，Hierarchical3D Gaussian方法突破了传统瓶颈，实现了高质量3D场景的实时渲染，提升了视觉效果和处理效率。该方法采用分块训练和层级优化技术，具有广泛应用潜力。

【AiBase提要:】

🌟 突破传统瓶颈: Hierarchical3D Gaussian解决了超大数据集渲染的瓶颈问题，提升了视觉效果和处理效率。

🚀 高效训练与渲染: 采用分块训练和层级优化技术，使得超大规模场景的实时渲染成为现实。

📈 广泛应用潜力: Hierarchical3D Gaussian能处理数万张图像的复杂场景，并适应各种资源条件，展现了显著的实用性。

详情链接:https://top.aibase.com/tool/hierarchical-3d-gaussian

AI日报谷歌Gemini1 5 Flash可免费使用哩布哩布完成数亿元融资苹果AI新功能将推迟至iOS18 1版本

0001

评论列表

共(0)条

相关推荐

站长资讯
OpenAI创始人最新演讲：不要做套壳ChatGPT，建议多研究AI医疗和AI教育
OpenAI是当下AI产业的风向标，据TheInformation报道，OpenAI的年营收已达到13亿美元，其爆发式增长提振了AI产业的信心。9月24日的美国旧金山举行的YC校友会上，OpenAI创始人兼CEOSamAltman的演讲无疑是当天最火爆的，台下挤满了前来学习和交流的创业者。
站长网2023-10-15 15:09:37
0001
视频号带货达人，@小李飞叨-李洋一个人就演出了人山人海
@小李飞叨-李洋是谁?这可能是一个很多年轻人感到陌生的名字。事实上，@小李飞叨-李洋是一个短视频创作者，粉丝主要为女性群体，年龄在31-40岁区间占比最大，内容的主要形式为一人分饰几角的演绎，截至目前其抖音粉丝已有249.7w，入驻视频号后，更是多个视频点赞破万，并且入围双十一带货头部达人榜。图源热浪数据
站长网站长资讯2023-12-24 10:25:24
0000
站长资讯
ChatGPT网站流量连续第三个月下降
文章概要:-OpenAI的ChatGPT在2023年8月份经历了连续第三个月的网站流量下降。-指标显示流量下降趋势可能正在趋于稳定。-学校新学年的开始预计将对ChatGPT的网站流量和使用产生积极影响。OpenAI的ChatGPT无疑是一款备受好评的人工智能聊天机器人，报告显示其网站流量在2023年8月份连续第三个月下降。这一下降趋势表明了一些挑战，但也暗示着可能慢慢趋于稳定。
站长网2023-09-08 14:29:38
0000
媲美OpenAI-o3，刚刚开源模型DeepCoder，训练方法、数据集大公开
今天凌晨4点，著名大模型训练平台TogetherAI和智能体平台Agentica，联合开源了新模型DeepCoder-14B-Preview。
站长网站长资讯2025-04-09 09:11:27
0000
站长资讯
OpenAI全量上线4o视频通话 - 我们等了7个月。
今天是OpenAI直播第6天，终于来了个能看点的。Day4是个很无聊的canvas的极小更新以及向全量用户开放，昨晚Day5完全就是给苹果做下PR，都是纯粹的垃圾时间。而今天，4o的实时视频通话，终于来了。是不是感觉有点陌生?没想到吧，4o居然还有实时视频通话。。。鸽了7个月，快被人忘干净了。总结一下今天的直播，有三个东西:实时视频通话。实时理解屏幕。圣诞老人限定语音。
站长网2024-12-13 09:00:10
0000