AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、李彦宏:百度搜索已有11%结果由AI生成
在百度2024年第一季度财报电话会上,百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向,强调人工智能技术对用户体验的推动和创新。尽管面临宏观经济挑战,百度仍致力于发展人工智能领域,取得成果并对未来充满信心。
【AiBase提要:】
💡 百度一季度在线营销收入同比增长3%,得益于搜索业务成熟。
💡 11%搜索结果通过生成式人工智能技术计算,提供更准确、有条理的答案,拓展用户任务完成能力。
💡 百度在人工智能领域持续投入,尚未商业变现,但对长期前景充满信心。
2、谷歌发布开源视觉语言模型PaliGemma
谷歌推出了开源视觉语言模型PaliGemma,结合图像处理和语言理解能力,支持多种视觉语言任务。该模型具有多任务支持、30亿参数规模和SigLiP视觉编码器与Gemma语言模型结合的特点。谷歌的贡献推动了AI领域发展,为研究人员和开发者提供强大工具。PaliGemma的开源特性意味着可以被广泛使用、改进和集成到各种产品和服务中。
【AiBase提要:】
✨ 多任务支持: PaliGemma能处理多种视觉语言任务,应用场景广泛。
🔑 参数规模: 包含30亿参数,是大型多模态模型。
💡 模型架构: 结合了SigLiP视觉编码器和Gemma语言模型,处理图像和文本输入。
详情链接:https://huggingface.co/blog/paligemma
3、腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
我对腾讯在生成式AI领域的最新成果——腾讯元器以及混元大模型的展示感到印象深刻。腾讯元器是一站式的AI智能体创作与分发平台,为企业提供了全新的解决方案,极大地扩展了智能体的应用范围和影响力。腾讯混元大模型在视频生成和3D生成领域展现出强大的实力,为未来的AI应用开辟了新的可能性。
【AiBase提要:】
🚀 腾讯元器是一站式的AI智能体创作与分发平台,为企业提供全新解决方案,扩展了智能体的应用范围和影响力。
💡 腾讯混元大模型参数规模达到万亿级别,采用混合专家模型(MoE)结构,在国内技术水平处于顶尖,并在某些中文能力方面与GPT-4相媲美。
🎥 腾讯混元大模型支持多种视频生成方式,包括文生视频、图生视频、图文生视频和视频生视频,已能够生成长达16秒的视频,同时展现了在3D生成领域的强大实力。
详情链接:https://top.aibase.com/tool/tengxunyuanqi
4、ChatGPT增强数据分析功能,实现与数据表格的实时交互
ChatGPT最近推出了一系列改进的数据分析功能,包括文件上传、实时表格交互、定制和下载演示图表以及安全与隐私保护。这些功能的增强进一步扩展了ChatGPT在数据分析和可视化方面的能力,使其成为一个更加强大的工具,能够帮助用户更有效地处理和分析数据,从而做出更明智的决策。
【AiBase提要:】
📂 文件上传: 用户可以直接从Google Drive和Microsoft OneDrive上传文件,提高处理Google Sheets、Docs、Slides以及Microsoft Excel、Word和PowerPoint文件的效率。
📊 实时表格交互: ChatGPT能够创建交互式表格,用户可以全屏查看并实时跟踪更新,深入分析数据或跟进问题。
🔒 安全与隐私: ChatGPT Team和Enterprise客户数据不会用于模型训练,Plus用户可选择退出训练,保障数据安全和隐私。
详情链接:https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
5、周鸿祎称留给谷歌的时间不多了 建议所有产品开源对抗OpenAI
周鸿祎在谷歌I/O大会上对谷歌发布的创新产品进行了深度点评,认为谷歌应将所有产品开源以对抗竞争对手。他建议谷歌应充分发挥自身优势,关注应用场景并在安卓系统中推广,以获取数十亿用户。通过用户数据反馈推动产品改进的飞轮。
【AiBase提要:】
🔍 谷歌应将所有产品开源以应对竞争对手挑战
💡 谷歌应充分发挥搜索、Chrome浏览器和安卓等优势,关注应用场景并推广
📈 通过用户数据反馈推动产品改进的飞轮
6、Google Photos将推出Ask Photos功能 动动嘴就能搜索照片和视频
Google Photos即将推出名为Ask Photos的实验性功能,利用AI模型Gemini,用户可以通过自然语言搜索查找照片和视频,辅助完成相关任务。这将进一步增强Google Photos的搜索能力,让用户更便捷地管理他们的珍贵回忆,享受个性化体验。功能预计将在未来几周内推出。
【AiBase提要:】
🔍 自然语言搜索: 用户可以通过自然语言问题搜索照片和视频,无需记住具体关键词或拍摄日期。
🧠 上下文理解和细节提取: Gemini AI模型能理解照片上下文和主题,提取细节信息。
🔄 动态调整和学习: Ask Photos可以根据用户反馈进行动态调整和学习,提供更准确的结果。
详情链接:https://blog.google/products/photos/ask-photos-google-io-2024/
7、OpenAI与Reddit合作,将用户生成独特内容整合至ChatGPT
OpenAI与Reddit宣布战略合作,旨在彻底改变在线社区互动体验和推动AI创新。这一合作将为用户带来全新的体验,同时也为AI和社交媒体融合创造新的可能性。
【AiBase提要:】
⭐ 合作旨在整合先进的AI功能和用户生成的独特内容,提升ChatGPT等AI工具的理解和展示能力。
⭐ Reddit向OpenAI开放Data API,使后者能够获取Reddit社区生成的丰富内容,推出个性化内容推荐等AI功能。
⭐ 合作标志着社交媒体和人工智能融合的重要里程碑,为用户和版主带来全新的体验。
8、Hugging Face承诺免费提供1000万美元GPU计算资源,帮助小型开发者对抗大型AI公司
Hugging Face承诺投入1000万美元的GPU计算资源,旨在降低开发AI应用的门槛,对抗人工智能领域的中心化趋势。通过分享计算资源,使每个人都能够使用先进的人工智能技术。
【AiBase提要:】
🔸 Hugging Face投入1000万美元GPU计算资源,支持小型开发者
🔸 旨在降低AI应用开发门槛,抗衡科技巨头
🔸 通过ZeroGPU项目免费共享GPU计算资源,提高成本效益和能源效率
9、OpenAI CEO:GPT-5会很特别 可能类似于一个 “虚拟大脑”
在接受采访中,OpenAI CEO透露了关于GPT-4o和GPT-5的信息,揭示了这些多模态大模型的特点和应用前景。GPT-4o具有跨文本、视频、音频推理能力,低延迟和拟人化声音特点,将带来前所未有的用户体验。而GPT-5被描述为一种非常特别的产品,可能会采用新的名称和功能,更像是一种能处理各种任务的虚拟大脑。
【AiBase提要:】
🔹 GPT-4o是多模态大模型,具有跨文本、视频、音频推理能力,低延迟和拟人化声音特点,提升工作效率和生活质量。
🔹 GPT-4o可在一个平台上完成多种任务,如实时翻译、语音交互和视频分析,带来巨大改变,特别适用于开发人员和专业人士。
🔹 GPT-5被描绘为一种“虚拟大脑”,能够帮助用户处理各种任务,是一次巨大的尝试,展示了OpenAI在人工智能领域的创新和突破。
10、马斯克旗下 xAI 与甲骨文接近达成 100 亿美元协议
马斯克旗下的 xAI 公司与甲骨文接近达成100亿美元协议,将成为甲骨文最大客户之一。这一举动将加速 xAI 在人工智能领域的发展,提升其竞争力。
【AiBase提要:】
💰 马斯克的 xAI 计划投资100亿美元租用甲骨文的 AI 服务器,成为甲骨文最大客户之一。
🚀 xAI 正在进行60亿美元的股权融资,以支付云计算服务成本,提升 Grok 模型的性能和效率。
💡 马斯克计划通过融资加速 GPU 租赁扩张,目标是在2025年前达到10万个 GPU。
11、腾讯混元将发布大模型C端App腾讯元宝
腾讯在腾讯云生成式AI产业应用峰会上宣布将推出面向C端用户的全新App“腾讯元宝”,背后搭载着超万亿参数规模的通用大语言模型——混元大模型。该模型展现出卓越的中文理解、创作、逻辑推理和任务执行能力,为用户带来高效经济的智能体验。
【AiBase提要:】
🚀 腾讯元宝是基于腾讯混元大模型的全新App,展现出超强的中文理解和创作能力。
💡 腾讯混元采用混合专家模型(MoE)结构,大幅提升了性能,降低了推理成本,为用户带来更高效的体验。
💬 腾讯混元在文本生成、数理逻辑和多轮对话等关键领域达到业界领先水平,为中文用户提供前所未有的智能体验。
魅族21系列推出Flyme 10.5系统:语音助手接入AI大模型
魅族21系列最新推出了Flyme10.5.0.1A稳定版系统,此次更新的语音助手接入了AI大模型,用户可以在使用魅族21系列手机时进行体验。以下是本次系统更新的主要内容:1.语音助手小溪接入了AI大模型,支持自然语言对话、文档总结、知识问答、出行规划、运动健康建议、文案生成等AI功能。0000AI水印能解决生成式AI的信任问题吗?
划重点:-随着生成AI技术的迅速发展,人们越来越难以区分AI生成的内容和人工生成的内容。-数字水印技术是否能帮助人类重新获得对内容的控制是一个备受争议的问题。-尽管一些专家认为水印技术是建立和维护AI时代信任的多方面方法的一部分,但也有人认为技术挑战和潜在的滥用问题仍然存在。站长网2023-11-07 10:29:0400002023年,自媒体的日子更艰难了
1、2023年自媒体日子更艰难了。前段时间有同行说,一些百万粉的头部公众号都难接单了,有的在调低刊例价,有的不得不接一些过去不愿接的广告。很多人盼着疫情结束了市场会景气起来,但疫情真结束了才发现行情更差了。站长网2023-04-13 09:04:580000陈睿称B站虚拟主播在国内遥遥领先:将提升直播业务经营质量
在近日发布的2023年第四季度及全年财报之后,B站管理层团队,包括董事长兼CEO陈睿、副董事长兼首席运营官李旎、以及首席财务官樊欣等人,共同参与了财报电话会议。当分析师对B站的直播业务提出相关问题时,陈睿详细阐述了该平台直播业务的特色和优势。他表示,B站的直播内容大多与公司的“特色和优势品类”紧密相连,与公司在视频领域的竞争优势相契合。站长网2024-03-08 13:28:230000比DOMOAI还原能力更强!GoEnhance AI视频转绘更稳定更流畅
GoEnhanceAI是一家提供先进图像和视频编辑解决方案的公司,通过其AI技术,用户可以将视频转换成多种不同风格的视频,实现更丰富多样的视觉效果。同时,GoEnhanceAI还能利用其先进的技术增强和提升图像至极致细节,帮助用户实现高分辨率的图像效果。官网地址:https://top.aibase.com/tool/goenhance-ai站长网2024-02-22 10:35:120004