2023百度十大科技前沿发明公布 超70%涉及大模型和重构创新
近日,百度公布了“2023百度十大科技前沿发明”,十大前沿发明中,超过70%涉及大模型和重构创新。
据悉,发布的十大科技前沿发明涉及大模型、基于大模型的端到端搜索、飞桨、AI芯片、生成式检索、内容生成推荐技术、自动驾驶决策系统、生物计算大模型、高性能量子芯片。
百度表示,随着越来越多的大模型产品陆续上线,我国生成式人工智能发展也将从“拼大模型参数”阶段步入“拼原生应用、拼产业落地”阶段。
具体如下:
一、基于大模型的检索生成决策交互一体的智能系统
该发明提出了知识增强的大模型智能交互系统。该发明通过知识内化和知识外用两种手段增强模型的知识性和推理能力,通过检索增强提升模型实效性和事实准确性,通过对话增强提升模型记忆能力和多轮交互能力。该发明技术显著提升了大模型的理解、生成、逻辑、记忆能力,并广泛应用在百度的核心业务,赋能了千行百业。
二、基于大模型的端到端搜索技术
该发明提出了大模型端到端搜索技术,打破了传统级联分治的模式,标志着10余年来百度搜索技术架构的重大代际变革。该发明技术已被广泛运用于通用搜索、视频搜索、企业搜索等多场景,系统效果和研发效率均显著提升。
三、飞桨端到端自适应的分布式训练技术
该发明通过“两个统一表示”对硬件资源和模型结构统一建模,支持任意模型在异构硬件下实现最优模型切分和资源分配,以通用自动混合并行策略实现高效训练,并可针对故障中断、资源扩缩自适应重新完成最优切分和并行策略选择,实现自动容错和弹性调度,在大规模分布式训练的灵活性、易用性、高效性和鲁棒性等方面具备明显优势。该发明技术成功助力文心一言高效训练,大规模集群作业训练有效率提升超30%,在百度智能云、智能搜索和推荐等核心产品线发挥重要作用,同时也广泛应用于传统行业的智能化改造,产生了显著的经济效益和社会效益。
四、飞桨多硬件分层适配一体化技术
针对智能芯片多样性,通过松耦合的分层设计和简捷适配接口,显著降低芯片与框架适配复杂度,广泛兼容多种硬件类型。针对AI应用的高性能需求,支持软硬系统极致优化,充分发挥硬件潜能,实现业务应用收益最大化。基于该发明技术,飞桨已经和40多家芯片/IP厂商完成高效适配,实现繁荣的AI软硬件生态,构建AI软硬件适配技术体系并推进国家标准,引领行业发展。
五、面向企业级大模型平台的AI芯片优化技术
该发明提出了面向企业级大模型平台的AI芯片优化技术,通过精准控制、提前预判等方式在满足高性能、低延迟AI计算的同时减缓AI芯片的瞬时大电流。该技术可以有效减少系统的整体成本、提升系统的稳定性和可靠性,并且提升在各种场景下AI处理器的使用效率。该发明技术为百度智能云千帆等企业级大模型平台提供了更加高效、稳定的训练和推理能力支持。目前千帆大模型已纳管的国内外主流大模型数量达到42个,并提供大模型开发和应用的整套工具链,能为企业进行高效、可靠的AI应用的构建。
六、全链路生成式智能检索系统
该发明实现了工业界首次将搜索系统与大规模生成技术相融合。通过引入全链路的可信度提升策略、真实数据的增强训练和严格的模型风控机制,采用AI原生架构设计,完成异步模型计算架构的深度优化,成功地突破了大模型在大规模用户应用场景的各种挑战。该发明技术全线落地百度搜索产品,进一步提升了搜索结果的准确性和可靠性,助力搜索首位极致满足效果快速提升,并超越了国际同行。
七、基于用户心智理解的内容生成式推荐技术
该发明全新构建对话式推荐系统,利用大模型理解能力和生成能力的优势:(1)将隐式反馈变为自然语言交互,推荐系统可对话,更加方便用户理解;(2)实现内容推荐与内容生成结合,集成推荐前看点、推荐中互动、推荐后延伸,提升用户陪伴式消费体验;(3)基于大模型能力生成的海量高质量资源,支持个性化生成千人千面的内容。该发明技术已经在百度Feed在线应用,以对话的方式触达用户深层需求,激发用户的阅读兴趣和探索效率,一期上线提升用户时长10%。
八、数据驱动的自动驾驶决策系统
该发明以深度学习技术为核心,推动自动驾驶决策系统由规则驱动向数据驱动转型,包括交互决策模型及其训练方法、基于人类驾驶员和自动驾驶的数据生产方法,以及基于闭环仿真的评测系统等部分。该发明技术已在萝卜快跑Robotaxi业务规模化落地应用,累计吸收上亿帧道路交互场景数据,决策准确率达到99.5%,实现90%以上的线上规则替代,有效支持Robotaxi无人化运营。
九、融合第一性原理的生物计算大模型
该发明融合生物领域数据和生物化学原理,构建极具创新性的生物计算大模型,在化合物和蛋白质领域取得重大技术突破,标志着百度在生物计算方向上的国际领先性。该发明技术已广泛应用在小分子药物发现、多肽药物设计、抗体药物设计等场景,在精度和速度上超越众多传统方法,助力合作伙伴在多个管线上找到高价值候选药物分子。
十、高性能量子芯片的设计、流片与测控全栈技术
该发明瞄准超导量子芯片研发“设计、流片、测控”闭环中的核心技术,旨在研发具有业界核心竞争力的高性能量子芯片,为量子计算的实际应用提供基础支撑。通过“端到端”的优化,以及与量子软件和量子应用的融合,高性能量子芯片研发将对人工智能、材料科学、药物研发、金融科技等领域带来高潜价值,进而促进量子计算的产业化。
AI 原生时代,字节想要复刻第三次增长奇迹
2024年被业内称为「AI应用元年」,字节跳动布局AI的节奏明显加快了。过去一年,字节推出十余款AI应用,覆盖Agent定制、聊天、社交、图像/视频、办公、教育等多个领域,甚至还涉足了硬件产品。移动互联网时代,字节就有「APP工厂」之称,所以相继打造今日头条和抖音两个爆款产品,借此成为最赚钱的中国互联网公司之一。图源备注:图片由AI生成,图片授权服务商Midjourney0000马斯克谈新AI公司竞争:阻止人工智能公司一家独大
马斯克最近宣布成立人工智能公司xAI,并表示其目标是理解宇宙的真实本质。在接受采访时,他表示创建xAI的目标是防止某个公司一家独大,并建设一个有着最大限度好奇心和求真务实的美好AGI。站长网2023-07-18 17:22:540000?签约OR孵化,MCN机构该如何平衡商业效率?
在刚刚过去的4月,由克劳锐出品的《2023中国内容机构(MCN)行业发展研究白皮书》重磅发布,白皮书在引发业内热议的同时也为中国MCN机构的发展给出了可能的方向。在白皮书发布后,克劳锐以“实现增长,路在何方”为主题发起系列直播,通过对话MCN机构创始人,探讨MCN机构们当前关注的重点行业问题。0000雷军称小米汽车SU7Ultra量产版明年上市 提供两个版本选择
在昨晚的年度演讲返场直播中,雷军宣布小米SU7Ultra的量产版计划于明年上半年上市。虽然价格会相对较高,但雷军保证不会过高。量产车型将保留原型车的底盘结构、电机和电池包配置,即V8sV8sV6s三电机系统,提供高达1548匹马力的动力输出,并配备麒麟二代电池。站长网2024-07-25 10:31:020001AI 超越人类,在街景图像中定位精确度更高
斯坦福大学的三位计算机科学家开发了一个深度学习模型,可以通过观察谷歌街景图像来确定大致的拍摄位置。这个模型在一个流行的地理猜测游戏GeoGuessr中表现出色,甚至超过了顶级玩家。尽管这个模型不能精确确定街景照片的位置,但它能够可靠地确定国家,并在很大程度上猜测出离正确位置不超过15英里的范围内。站长网2023-07-21 17:54:500003