中国AI大模型论文数量全球第一,清华力压麻省理工、斯坦福
论文是研究新技术、开发新产品获取“图纸”的重要途径之一,OpenAI的研究人员正是借鉴了Transformer的论文(被引用超过9万次),才开发出了对全球各行业影响巨大的产品ChatGPT。
而论文的数量、通过率和被引用次数是衡量一个国家科技人才素质,以及技术创新能力的重要标准之一。
根据美国最古老大学之一乔治城大学的数据分析平台ETO,在今年5月发布的最新调查报告显示:2017—2022年期间,全球一共发布了125.5万篇与AI相关的论文。
其中,中国发布了24.3万篇AI论文,占到了总数的25%,成为发布论文最多的国家;
美国发布了17.1万篇论文,占总数的18%,排名第二;剩下的论文由欧洲、亚太地区国家贡献。
需要注意的是,ETO只统计了英文技术论文,如果算上中文论文,那么中国发布的论文数量将会更多。
在AI论文研究领域方面,中国对计算机视觉模型、机器人技术成为发布、研究最多的领域总计14万篇左右;在自然语言处理为1.9万篇左右、AI安全方面为2557篇。
从每年被引用次数最多的10%论文来看,美国达到34036篇,中国是29229篇。
如果细分到学术、研究机构,中国AI论文的被引用次数是领先美国的,中国科学院排名第一、谷歌排名第二,清华大学排名第三超过了麻省理工、斯坦福、卡内基梅隆等著名大学。
北京大学、中国科学院大学、上海交通大学和浙江大学在AI论文的发表和被引用方面也很出色。
从企业角度来看的话,谷歌排名第一,发布了6529篇论文,平均每篇被引用次数达到183.8;微软排名第二发布了5558篇,平均引用82.8;腾讯排名第三,发布了2760篇,平均引用54.2;
阿里巴巴排名第四,发布了2518篇,平均被引用42.3;Meta排名第五,发布了2280篇,平均引用181;亚马逊排名第六,发布了2026篇,平均引用43.5;IBM排名第七,发布了1574,平均引用52.5;
三星排名第八,发布了1530篇,平均引用29.3;华为排名第九,发布了1485,平均引用36;百度排名第十,发布了1355篇,平均引用61。
本次报告的其他主要发现:
从2017—2022年,全球AI研究增长了一倍多,这在很大程度上得益于自然语言处理和计算机视觉模型研究的快速增长。机器人研究进展缓慢,但仍然比较明显。
AI安全研究进展很快,但基础比较薄弱。ETO估计,AI安全研究仅占整个AI研究的2%。
中国在AI研究产出方面处于领先地位;但如果仅计算高频率被引用论文数量,美国略高排名第一。
中国科学院的AI研究总量以及高频率引用研究论文,均位居世界榜首。
此外,在2017—2022年期间,大约有40万篇论文是关于AI视觉模型的,整体增长了121%,成为AI增长最快的子领域。典型代表产品有Midjourney、Stable Difusion、DALL·E3、Sora、Gen-3等。
在2017—2022年期间,大约有13.5万篇论文是关于自然语言处理的,整体增长了104%。典型产品有ChatGPT、文心一言、Kimi、讯飞星火、通义千问等。
其实关于论文数量这个问题,「AIGC开放社区」是深有体会。如果你经常看arxiv、SSRN、《自然》、acm、IEEE等顶级论文平台,以及Huggingface、Github的开源项目就能发现,国内出现频率相当高,而且多数项目创新性都不错,评价也很高。
即便是国外科技巨头谷歌、微软、OpenAI、Meta、苹果等AI论文、项目,华人的贡献也占据了重要地位。
例如,OpenAI的最初ChatGPT研发团队华人有9位,有5位本科是在中国念完的,其中3位毕业于清华大学、1位毕业北京大学、1位毕业华中科技大学。
此外,在上周United Nations在官网发布的最新调查显示,中国在生成式AI(AIGC)申请的专利数量为38210个,美国只有6276个,是其6倍。就算别的国家全都加在一起连中国的一半都不到。
这也充分证明了,中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。
AI公司奥创光年Mogic AI获千万美元A轮融资
据36氪消息,AI全链路营销公司「奥创光年」(MogicAI)已于近日获得千万美元A轮融资,本轮由凯辉基金领投,老股东真格基金参与投资。本轮融资将主要用于AI视频领域的智能算法、模型研发等技术投入上,以进一步提升产品能力。站长网2023-08-09 08:49:030001黄仁勋最新访谈:AI不会完全取代人类
快科技4月29日消息,近日,哥伦比亚广播公司公开了主持人比尔惠特克采访英伟达CEO黄仁勋的完整文字实录。在采访中,黄仁勋分享了他对人工智能的见解,他认为人工智能和机器人将能够胜任越来越多的任务,甚至在某些方面做得比人类更加出色。不过黄仁勋明确表示,人工智能并不会完全取代人类,相反,当企业因采用先进技术而变得更高效时,它们的收益也将相应增长,这意味着他们可以雇佣更多的工人。站长网2024-04-29 17:15:010000大模型行业,根本没有什么“真”开源?
最近一段时间开源大模型市场非常热闹,先是苹果开源了70亿参数小模型DCLM,然后是重量级的Meta的Llama3.1和MistralLarge2相继开源,在多项基准测试中Llama3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。站长网2024-08-01 14:19:360000天涯社区申请天涯臻选商标 此前已成立天涯甄选公司
天眼查App显示,近期,天涯社区旗下天涯好东西(海南)电子商务有限公司申请注册一枚“天涯臻选”商标,国际分类为广告销售,当前商标状态为等待实质审查。此外,今年7月,天涯甄选(成都)科技有限公司已成立,注册资本800万人民币,该公司由四川天涯在线网络科技有限公司间接控股,后者为天涯社区网络科技股份有限公司全资子公司。站长网2023-11-27 14:57:540001IBM 研究人员推出用于深度学习推理的模拟 AI 芯片
IBM研究人员近日在《自然电子学》杂志上发表了一篇文章,介绍了一款用于深度学习推理的模拟人工智能芯片。该芯片采用模拟内存计算的方法,使用纳米级的相变存储器将突触权重存储为电导值。芯片具备64个模拟内存计算核心,每个核心都有一个256x256的交叉阵列,用于存储突触单元。芯片的架构使得每个核心能够处理与深度神经网络层相关的计算。站长网2023-08-14 18:11:180000