AI日报:前百度高管推AI搜索产品Genspark;Kimi内测上下文缓存功能;TikTok推AI全家桶Symphony;橙篇已支持10万字长文生成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、前百度高管景鲲创业AI搜索估值18亿 推出首款产品Genspark
作为前百度高管,景鲲创立了新公司MainFunc并推出首款产品Genspark,旨在通过AI技术提供优质搜索体验。公司获得6000万美元种子轮融资,估值达到2.6亿美元,展现出巨大市场潜力。景鲲的履历卓越,现在再次领先AI搜索领域,期待其继续创新发展。
【AiBase提要:】
🚀 MainFunc是由景鲲和前小度CTO朱凯华共同创立的AI创新产品公司,推出首款AI Agent搜索产品Genspark。
💰 公司完成6000万美元的种子轮融资,估值达到2.6亿美元,市场潜力巨大。
🔍 Genspark定位为AI Agent引擎,专注提供搜索服务,通过AI技术生成名为"Sparkpages"的自定义页面,节省用户时间提供可信信息。
官网地址:https://mainfunc.ai/
搜索产品入口:https://top.aibase.com/tool/sparkpage
2、Kimi 开放平台将启动 Context Caching上下文缓存 内测
Kimi 开放平台近日宣布,备受期待的Context Caching功能即将启动内测。这一创新功能将支持长文本大模型,并通过高效的上下文缓存机制,为用户提供前所未有的体验。Context Caching是一项前沿技术,通过缓存重复的Tokens内容,大幅度降低用户在请求相同内容时的成本。
【AiBase提要:】
🔑 Context Caching功能支持长文本大模型,通过高效的上下文缓存机制提供前所未有的体验。
🚀 Context Caching能智能识别并存储已处理的文本片段,极大提升API接口响应速度。
💡 适用于规模化、重复度高的prompt场景,通过重用已缓存的内容提升处理效率、降低费用。
3、TikTok推AI全家桶Symphony 写脚本,剪视频,数字人全包
TikTok推出的Symphony AI内容工具套件彻底改变了内容创作和分享方式,让每个人都能成为创意大师。Symphony Assistant提供贴心的帮助,发现趋势、提供创意指导、激发灵感、编写脚本,并给出优化建议。Symphony Creative Studio能在60秒内生成多种TikTok视频预览,支持多语言翻译和视频编辑。Symphony Digital Avatars帮助品牌扩展创意策略,提供真实人物头像。
【AiBase提要:】
🚀 Symphony Assistant提供全方位创作帮助,从趋势发现到脚本编写,让创作过程更简单高效。
💡 Symphony Creative Studio支持快速生成多样TikTok视频预览,多语言翻译和视频编辑功能让内容更具吸引力。
👤 Symphony Digital Avatars通过生成式AI创建真实人物头像,帮助品牌扩展全球创意策略。
详情链接:https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite
4、百度文库:AI产品“橙篇”已支持10万字长文生成
百度文库最新推出的AI产品“橙篇”在长文生成和多模态编辑方面取得重大突破,为用户提供全面的创作和编辑功能。产品基于强大的AI技术支持,让用户能够轻松访问专业学术资源、创作超长图文内容,并实现一站式的多格式编辑和调整。
【AiBase提要:】
🚀 “橙篇”支持10万字长文生成及多模态编辑能力,满足用户专业领域内的全链路需求。
💡 打破学术资源壁垒,让用户轻松访问全球专业学术站点资料和文献资料。
✨ 支持超长图文理解和生成,一次性上传多种格式文件并实现快速总结、问答和创作。
详情链接:https://top.aibase.com/tool/chengpianai
5、首个AI高考评测结果发布 GPT-4o拿下第二名
在这场别开生面的AI高考评测中,多个AI模型接受了语文、数学和英语的全面能力测试,展现出了在学术领域的潜力和局限性。虽然在语文和英语科目表现良好,但在数学推理方面仍有提升空间。未来随着技术的进步,AI将更加聪明,更好地服务人类社会。
【AiBase提要:】
🧠 AI模型参与全面能力测试,展现学术潜力和局限性。
📚 语文和英语科目表现良好,数学推理方面仍有提升空间。
🚀 技术进步将使AI变得更加聪明,更好地服务人类社会。
6、Flash Diffusion适用于任何扩散模型,实现几步图像生成
Flash Diffusion方法为图像生成技术带来革命性突破,加速了预训练扩散模型生成过程,表现出色且高效多才多艺。研究人员采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。该方法适应不同骨干网络,显著减少采样步骤同时保持高质量生成。Flash Diffusion注入新活力,提升图像生成效率和多功能性,有望在各领域产生深远影响。
【AiBase提要:】
⚡ 加速预训练扩散模型生成过程,表现出色且高效多才多艺。
🔍 采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。
🌟 适应不同骨干网络,显著减少采样步骤同时保持高质量生成。
详情链接:https://top.aibase.com/tool/flash-diffusion
7、AI生图可“量身定制”!华为清华联手推个性化生成技术PMG
在个性化至上的时代,华为与清华大学合作推出了名为PMG的个性化生成技术。该技术利用用户历史行为和偏好,生成符合用户需求的多模态内容,如表情包、T恤设计图、电影海报等。通过实验验证,PMG技术展现出巨大潜力和商业价值,为用户带来更加丰富、个性化的体验。
【AiBase提要:】
⚙️ PMG技术利用用户历史行为和偏好生成个性化多模态内容。
💡 PMG通过关键词生成和隐向量生成提取用户偏好,实现多模态内容生成。
📈 PMG技术在电商服装图片生成、电影海报场景和表情生成等应用场景中验证有效性,展现出色的生成效果。
详情链接:https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG
8、Gboard革新打字体验 谷歌凭大模型实现一键修复所有错误
Gboard是Google为移动设备打造的智能键盘,最新推出的"校对"功能利用大型语言模型实现一键修复整个句子和段落错误,彻底改变了传统的逐字修正体验。该功能已在Pixel8设备上推出,受益用户众多。研究团队通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能,展示了大模型在提升移动端输入交互体验方面的巨大潜能。
【AiBase提要:】
🔍 利用大型语言模型实现一键修复整个句子和段落错误,改变传统逐字修正体验。
🚀 通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能。
💡 部署在云端TPU V5上,通过优化延迟等手段提升用户输入效率。
详情链接:https://arxiv.org/abs/2406.04523
9、可以在Confyui中用英伟达的Lumina-T2X图像生成了
英伟达的 Lumina-T2X 图像生成模型可以在Confyui中用英伟达的Lumina-T2X图像生成了,作为一个开源模型,它在美学表现和图像质量上与业界领先的MJ V6 相差无几,这一成就在开源领域尤为难能可贵。
【AiBase提要:】
🌟 Lumina-T2X采用统一的DiT架构,能生成多种媒体内容,拓展AI在内容创作领域的应用范围。
💡 Lumina-T2I图像生成模型提高生成质量、降低训练成本,展示AI技术的经济潜力。
🔑 Lumina-T2I的成功关键在于模型主干采用Large-DiT、文本编码模型使用Llama2-7B、VAE采用SDXL,为高质量图像生成奠定基础。
感兴趣的可以在 Confyui 中使用这个插件尝试::https://github.com/kijai/ComfyUI-LuminaWrapper
10、OpenAI灵魂人物Ilya创办新AI公司SSI 剑指安全超级智能
Ilya Sutskever离职后创立Safe Superintelligence Inc.专注解决超级智能人工智能系统安全性问题。公司致力于研究控制和限制超越人类智能的AI,并计划通过工程和科学突破解决安全性难题。SSI从一开始就是营利性实体,不受短期商业压力影响,目前正在招聘技术人才。
【AiBase提要:】
🔒 SSI专注解决超级智能AI系统安全性问题,致力于研究控制和限制超越人类智能的方法。
🚀 SSI计划通过工程和科学突破解决AI安全性难题,提高AI能力和安全性。
💼 SSI是一家营利性实体,不受短期商业压力影响,正在招聘技术人才。
11、GPT-4通过图灵测试 超过一半的人无法区分GPT-4和人类
人工智能领域的重要里程碑之一是图灵测试,最近一项实验显示,GPT-4在互动式双人图灵测试中被误认为人类的概率高达54%,引发人们对AI系统逼真表现的关注。参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类,这对机器智能的讨论产生了深远影响。
【AiBase提要:】
🤖 GPT-4在图灵测试中被误认为人类的概率高达54%,展现出逼真的表现
🔍 参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类
💡 结果暗示了AI系统在实际应用中可能欺骗人类,提出了新的伦理、隐私和安全性挑战
12、AI设计工具Kittl:输入文字提示即可生成图标、剪贴画等
Kittl是一款AI驱动的设计平台,利用先进算法和机器学习,用户可通过简单文本提示创建高质量设计元素,无需复杂技能和软件操作。提供矢量标志图标、令人惊叹的图像和剪贴画,高级文本编辑,魔法着色,即用型模板。用户可访问插图、字体、照片、图标、纹理等无限内容,轻松拖放并自定义。
【AiBase提要:】
⭐ 利用AI技术和机器学习,用户通过简单文字提示即可创建高质量设计元素。
⭐ 提供成千上万的专业设计模板,无需复杂的设计技能和软件操作。
⭐ 用户可轻松拖放高质量插图、照片、图标和形状,并自定义。
产品入口:https://top.aibase.com/tool/kittl
在人工智能的推动下 Meta 的 Reels 收入收窄与 TikTok 的差距
2020年推出的Reels是Meta平台对病毒式短视频应用TikTok的回应,当时它引起了人们的嘲笑,并被认为是Meta模仿流行竞争对手的又一个例子。但在上周三,Meta披露的数据显示,Reels视频在用户和广告商中增长迅速,并迅速赶上了由字节跳动所有的备受年轻用户喜爱并重塑了社交媒体格局的TikTok应用。站长网2023-07-31 16:37:220000苹果推送 iOS 17.2 正式版 新增“手记”应用等
在今日凌晨的更新中,苹果正式发布了iOS17.2,作为iOS17的第二次大版本更新,此次更新带来了许多新的功能和错误的修复。站长网2023-12-12 09:13:430002ChatGPT和视觉搜索,正在改变搜索市场格局
先来看一组与搜索相关的数据:ChatGPT的月活超过1亿,用户超过1.8亿,网站访问量在2023年5月达到19亿。根据小红书的数据,搜索已经成为用户最高频的使用行为之一,60%的日活用户会在小红书上主动搜索,日均搜索查询量接近3亿次。抖音搜索的月活在2021年就超过了5.5亿。百度截止到2022年第三季度,百度APP月活用户达到6.28亿。这些数据显示出搜索市场的新趋势。0000使用 Windows 11 上的生成式人工智能助理 Copilot:您能执行的所有操作都在这里
尽管有许多疑虑,人工智能——特别是从提示中生成文本和图像的生成式AI——继续被推广到我们日常使用的硬件和软件中。微软在这一领域一直很活跃,今年早些时候在其Bing搜索引擎中添加了AI聊天机器人功能,现在正在预览Windows11中的新CopilotAI助手早期版本。站长网2023-11-06 15:18:190003Transformer要变Kansformer?用了几十年的MLP迎来挑战者KAN
MLP(多层感知器)用了几十年了,真的没有别的选择了吗?多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。站长网2024-05-04 12:36:280000