清华系「自然语言编程神器」上新!支持100+种编程语言,效率upup
清华和智谱AI联合打造的多语言代码生成模型CodeGeeX,更新了!
它支持的编程语言种类从原来的20种增加到100多种。
通过IDE中的插件,可以轻松实现「无缝自然语言编程」。
由于使用了新版基础模型,CodeGeeX2的功能更加强大。
据了解,这次的新版本,精度和速度分别是原来的两倍和三倍,内存消耗却只有1/5。
代码生成、解释、翻译、纠错和编程问答等工作,效率都比以前有显著提高。
作为「课代表」,我们把CodeGeeX的更新概括成了下面这几个方面:
代码能力更强了
模型特性得到了优化
AI编程助手功能更全面了
用户协议更加开放
插件版本也将全面更新
模型用起来太繁琐?没关系,除了模型本身的更新,CodeGeeX的插件版本很快也将全面升级至新版。
新插件同样支持超过100种编程语言,说不定比我们知道的还要多。
这之中除了Python、Java等我们耳熟能详的语言之外,还包括Swift、Kotlin等移动端新兴势力。
甚至像Rust这种系统级的编程语言,也在CodeGeeX2的能力范围之内。
比如下面这张动图就展示了CodeGeeX2生成Kotlin代码的场景。
代码生成的速度简直比人类输入指令的速度还快。
而且从中我们可以看到,CodeGeeX2添加注释或debug都能一键完成。
不仅是设计算法,实用程序的编写也是小菜一碟。
补全个vue.js代码,搭建出网页,效率杠杠的!
除了这些代码相关的任务,CodeGeeX2还有很多其他应用场景。
比如查询SQL数据库。
只要打开问答模式,用自然语言描述想要查询的内容,CodeGeeX2就能自动生成SQL查询语句。
模型变强之后,会不会收费呢?不必担心,新版CodeGeeX插件将继续对个人用户免费开放。
而6B参数的CodeGeeX2,也已经进行了开源,相关代码可以到GitHub仓库中查看。
GitHub Copilot的模型也不是对手
OpenAI的HumanEval评测标准可以很好地评价生成代码的表现。
这个名字很容易理解:模型生成的代码质量如何将由人类来评价。
在HumanEval评测中,6B参数的CodeGeeX2的得分比15B参数的StarCoder模型还要高,可谓是四两拨千斤。
而GitHub Copilot中曾使用的Code-Cushman-001模型同样不是CodeGeeX2的对手。
不过,CodeGeeX毕竟是一个多语言模型,而HumanEval却只支持Python。
所以,为了更加准确地测试CodeGeeX的表现,智谱团队在其基础上增加了Go、C 、Java和JS四种语言的测试数据,得到了HumanEval-X数据集。
结果显示,在多语言方面,新版CodeGeeX2的表现和在Python中一样优异。
相较于第一代,CodeGeeX2的Pass@1指标在各个语言上的平均表现提升了107%。
其中,Rust语言的性能提升显著,提升了321%;C 和JS语言上的表现也提升了70%以上。
而在代码翻译方面,CodeGeeX2的表现同样碾压对手。
「不看广告看疗效」,CodeGeeX不仅测试结果优异,用户的认可度也是很高的。
在「CodeGeeX是否提高了编程效率」这一问题中,有83.4%的用户给出了正面的答案。
除了调查结果,用户们也在「用脚投票」。
自第一个版本发布以来,CodeGeeX的下载量已达12万次,平均每天生成近千万行代码。
这是个什么概念呢?如果只看代码行数,相当于不到一周的时间就写出一套Windows XP。
说了这么多,CodeGeeX又该如何体验呢?
快速体验
第一种方式就是IDE中的插件,VScode和JetBrains系列IDE的插件仓库中均有收录。
除了使用IDE中的插件之外,CodeGeeX也可以在Transformer中快速调用。
fromtransformersimportAutoTokenizer,AutoModel
tokenizer=AutoTokenizer.from_pretrained("THUDM/codegeex2-6b",trust_remote_code=True)
model=AutoModel.from_pretrained("THUDM/codegeex2-6b",trust_remote_code=True,device='cuda')
model=model.eval()
#rememberaddingalanguagetagforbetterperformance
prompt="#language:python\n#writeabubblesortfunction\n"
inputs=tokenizer.encode(prompt,return_tensors="pt").to(model.device)
outputs=model.generate(inputs,max_length=256,top_k=1)
response=tokenizer.decode(outputs[0])
>>>print(response)
#language:python
#writeabubblesortfunction
没有支持的IDE,Transformer又觉得麻烦,但还是想体验怎么办?
没关系,这里还有个还有在线版DEMO。
传送门:https://codegeex.cn/zh-CN/playground
赶快来感受一下「无缝自然语言编程」吧!
论文地址:
https://arxiv.org/abs/2303.17568
Github项目页:
https://github.com/THUDM/CodeGeeX2
Hugging Face项目页:
https://huggingface.co/THUDM/codegeex2-6b
—完—
国产AI投广告太疯狂!Kimi 20天花1.1亿元、秘塔20天投1500万
快科技10月30日消息,随着人工智能技术的飞速发展,国产AI大模型市场的广告投放战也愈演愈烈。根据博主互联网的那点事”分享,Kimi在10月份的前20天内,广告投放费用高达1.1亿元人民币,接近其三季度总和。秘塔同期投放1500万,逼近其三季度总额,腾讯的元宝AI同样大手笔,10月已投入3000万广点通,超过三季度总额的三分之一。站长网2024-10-30 22:15:000000组合式AI驱动生态系统XenonJs 像搭积木一样构建Web应用
XenonJs是一个模块化的Web开发框架,让开发者可以轻松创建和分享可定制的Web应用和组件。该框架具有以下核心优点:XenonJs采用组件化和图状态(GraphState)的模式,开发者可以像搭积木一样组合不同的组件和服务来构建Web应用。组件间采用标准化接口,实现松耦合和高内聚。开发者可以选择使用官方组件库中的现成组件,也可以开发自定义组件。组件和组件组合非常易于重用。站长网2023-09-12 10:24:010000阿里巴巴里程碑时刻!正式完成纽约香港双重主要上市
里程碑时刻!阿里巴巴完成香港、纽约双重主要上市今天,阿里巴巴集团宣布正式完成香港双重主要上市,成为在香港交易所(港交所)和纽约证券交易所(纽交所)同时拥有主要上市地位的公司,标志着公司发展的新里程碑。根据公告,阿里巴巴在港交所上市的普通股和在纽交所上市的美国存托股(ADS)将持续可转换。0000小米终极辟谣:小米汽车正式发布前不可能有售价
站长之家(ChinaZ.com)1月5日消息:小米集团公关部总经理王化发布声明,针对近期关于小米汽车的种种传闻进行澄清。他强调,在小米汽车正式发布之前,所有关于小米汽车版本和售价的信息、海报都是虚假的。王化表示,小米汽车的产品尚未最终确定,因此不可能有确定的售价和政策。他呼吁大家不要轻信所谓的内部人士传言,因为没有人知道真正的价格和发布时间。站长网2024-01-05 11:57:280000AI图像缩放器Pixelhunter 适用于社交媒体
Pixelhunter是一种基于AI的图像缩放器,适用于社交媒体,可针对各种平台优化图像。它能自动调整大小,支持102种尺寸,并使用对象识别和裁剪功能。体验地址:https://pixelhunter.io/站长网2023-08-07 15:36:190000