中国AI大模型论文数量全球第一,清华力压麻省理工、斯坦福
论文是研究新技术、开发新产品获取“图纸”的重要途径之一,OpenAI的研究人员正是借鉴了Transformer的论文(被引用超过9万次),才开发出了对全球各行业影响巨大的产品ChatGPT。
而论文的数量、通过率和被引用次数是衡量一个国家科技人才素质,以及技术创新能力的重要标准之一。
根据美国最古老大学之一乔治城大学的数据分析平台ETO,在今年5月发布的最新调查报告显示:2017—2022年期间,全球一共发布了125.5万篇与AI相关的论文。
其中,中国发布了24.3万篇AI论文,占到了总数的25%,成为发布论文最多的国家;
美国发布了17.1万篇论文,占总数的18%,排名第二;剩下的论文由欧洲、亚太地区国家贡献。
需要注意的是,ETO只统计了英文技术论文,如果算上中文论文,那么中国发布的论文数量将会更多。
在AI论文研究领域方面,中国对计算机视觉模型、机器人技术成为发布、研究最多的领域总计14万篇左右;在自然语言处理为1.9万篇左右、AI安全方面为2557篇。
从每年被引用次数最多的10%论文来看,美国达到34036篇,中国是29229篇。
如果细分到学术、研究机构,中国AI论文的被引用次数是领先美国的,中国科学院排名第一、谷歌排名第二,清华大学排名第三超过了麻省理工、斯坦福、卡内基梅隆等著名大学。
北京大学、中国科学院大学、上海交通大学和浙江大学在AI论文的发表和被引用方面也很出色。
从企业角度来看的话,谷歌排名第一,发布了6529篇论文,平均每篇被引用次数达到183.8;微软排名第二发布了5558篇,平均引用82.8;腾讯排名第三,发布了2760篇,平均引用54.2;
阿里巴巴排名第四,发布了2518篇,平均被引用42.3;Meta排名第五,发布了2280篇,平均引用181;亚马逊排名第六,发布了2026篇,平均引用43.5;IBM排名第七,发布了1574,平均引用52.5;
三星排名第八,发布了1530篇,平均引用29.3;华为排名第九,发布了1485,平均引用36;百度排名第十,发布了1355篇,平均引用61。
本次报告的其他主要发现:
从2017—2022年,全球AI研究增长了一倍多,这在很大程度上得益于自然语言处理和计算机视觉模型研究的快速增长。机器人研究进展缓慢,但仍然比较明显。
AI安全研究进展很快,但基础比较薄弱。ETO估计,AI安全研究仅占整个AI研究的2%。
中国在AI研究产出方面处于领先地位;但如果仅计算高频率被引用论文数量,美国略高排名第一。
中国科学院的AI研究总量以及高频率引用研究论文,均位居世界榜首。
此外,在2017—2022年期间,大约有40万篇论文是关于AI视觉模型的,整体增长了121%,成为AI增长最快的子领域。典型代表产品有Midjourney、Stable Difusion、DALL·E3、Sora、Gen-3等。
在2017—2022年期间,大约有13.5万篇论文是关于自然语言处理的,整体增长了104%。典型产品有ChatGPT、文心一言、Kimi、讯飞星火、通义千问等。
其实关于论文数量这个问题,「AIGC开放社区」是深有体会。如果你经常看arxiv、SSRN、《自然》、acm、IEEE等顶级论文平台,以及Huggingface、Github的开源项目就能发现,国内出现频率相当高,而且多数项目创新性都不错,评价也很高。
即便是国外科技巨头谷歌、微软、OpenAI、Meta、苹果等AI论文、项目,华人的贡献也占据了重要地位。
例如,OpenAI的最初ChatGPT研发团队华人有9位,有5位本科是在中国念完的,其中3位毕业于清华大学、1位毕业北京大学、1位毕业华中科技大学。
此外,在上周United Nations在官网发布的最新调查显示,中国在生成式AI(AIGC)申请的专利数量为38210个,美国只有6276个,是其6倍。就算别的国家全都加在一起连中国的一半都不到。
这也充分证明了,中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。
什么值得买:正在基于通用大模型开发“值得买消费内容大模型”
近日,值得买表示,大数据和大模型是公司非常关注的领域,公司已经在该领域加大了投入。在大数据层面,目前随着公司逐步沉淀来自于消费内容业务板块和营销服务业务板块等的更多数据资源,已形成一个能够涵盖人、货、场等多种维度的底层数据体系。截止2023年6月底,公司商品数据库已经收录了近22万个品牌、1123万聚合商品。站长网2023-09-26 09:26:280000生成式AI之战,谁能破局而出?
随着腾讯的入局,国内生成式AI大模型赛道集齐BAT三大巨头,竞争日趋白热化。4月14日,腾讯云发布面向大模型训练的新一代高性能计算集群,搭载英伟达最新一代H800GPU,服务器互联带宽高达3.2T,算力性能较上一代提升3倍,号称目前国内性能最强的大模型计算集群。站长网2023-04-20 21:38:220001AI日报:推理更强!OpenAI新模型o1发布;Midjourney 7.0一次可生8张图;开源语音模型Fish Speech 1.4发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI推出全新的模型系列OpenAIo1站长网2024-09-14 15:43:220000iPhoneSE4或10月量产 预计2025年3月发布
苹果公司即将开启其供应链的新一轮征程,计划在今年金秋十月全面启动iPhoneSE4的大规模生产工作。这款备受期待的机型预计将于2025年阳春三月正式面世,届时它将作为苹果年度最具性价比的智能手机,引领新一轮的市场热潮。站长网2024-07-25 02:36:130000章泽天登胡润财富榜:净资产600亿 位列清华优秀校友第三
胡润研究院联合沃尔沃汽车发布了《2023沃尔沃汽车・胡润校友会榜》。清华大学和浙江大学并列第一,各有32位校友登上胡润百富榜,成为最具财富创造力的校友会。北京大学排名第三,有22位校友上榜,上海交通大学排名第四,有21位校友上榜,武汉大学排名第五,有17位校友上榜。人民大学和华南理工大学并列第六,各有16位校友上榜。站长网2024-01-09 11:56:440000