上海AI实验室开源科学大模型浦科化学,理科能力全线提升,免费商用
最新科学大模型浦科化学(ChemLLM),发布即开源!
这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模型能力,通过注入海量化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。
值得一提的是,在获得化学能力同时,大模型的数理学科及推理能力还得到增强。
目前该模型支持免费商用。
化学领域超越ChatGPT
浦科化学具备专业的化学知识能力。
可以精准翻译研究论文中的各种专业名词:
还能回答高中化学试题,并给出解释。
在多项测试中,浦科化学的表现都大幅超过其他模型。
研究人员通过3个任务来测试模型专业能力:
分子名称转换
分子性质预测
反应产物预测
这些任务分别涉及化学物质的表示、性质和转化,是化学研究的基础和核心。
分子名称转换要求模型能够在不同分子表示方式之间进行准确转换,如SMILES、IUPAC名称、分子式等。
分子性质预测方面,要求模型能根据分子的结构和组成,预测其化学性质,如沸点、密度、溶解度等。
反应产物预测方面,要求模型能根据给定的反应物和反应条件预测反应产物的结构。
结果显示,浦科化学在这三项任务上均表现出色,分别获得22.0、49.0和7.0的分数,远超过其他同规模模型的水平,并超越了GPT-3.5,证明浦科化学在理解和处理化学知识方面具备强大能力。
泛理科能力涌现
在化学能力提升的同时,浦科化学在数学、物理及推理方面的能力也都得到提升。
研究人员使用MMLU(大规模多任务语言理解数据集)作为测试集来评估浦科化学在通用场景下的性能,对语言模型的多项任务能力进行测试评估,并将浦科化学与其他同等规模的模型进行比较,以评估化学训练数据对基础模型的影响。
评测结果显示,浦科化学在大学化学任务上得分为47.0,超越了所有其他模型。
研究人员发现,尽管没有对浦科化学进行数学和物理学科的训练,模型在大学数学、大学物理、STEM(科学、技术、工程和数学)类等相关领域上也获得了最佳成绩。
同时,浦科化学在形式逻辑任务上也达到了最高水平。
上述结果表明,当对大模型进行进行化学专业训练时,其数理及推理能力也能得到增强。
有趣的是,浦科化学在道德场景、人文科学类、社会科学类等分项任务上也展现了优异的平均性能,这说明,对大模型进行专业某个学科的知识训练,不仅不会让大模型“分心”,反而有助于其道德水平及一般任务水平的提升。
据了解,上海AI for Science团队面向化学、物理、生命、地球等科学领域,通过深入研究各学科基础理论,结合最新人工智能理论,探索AI驱动重大科学问题的研究范式,加速人工智能在化学、药物研发、新材料、气象等领域的渗透与落地。
其中,AI for Chemistry方面的研究以语言模型为核心,通过大模型连接智能化实验设备,全方位提升实验效率,从而实现化学研究的自动化和智能化。相关研究范式的创新,将助推科学发现速度,实现更大的社会效益。
未来,基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从而提升化学研究的效率和质量。
开源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
曝iPhone17将推Slim机型 取代现有“Plus”系列
站长之家(ChinaZ.com)5月6日消息:知名分析师JeffPu透露,iPhone17系列将展现“焕然一新的设计”,并带来前置摄像头的改进以及更为紧凑的灵动岛设计。其中,JeffPu预测苹果将推出一款全新的“iPhone17Slim”机型,该机型旨在取代现有的“Plus”系列。但值得注意的是,这款Slim机型并非iPhone12/13mini的延续,而是苹果在产品线中的一次全新尝试。站长网2024-05-06 18:48:430000十年烧了3000亿,自动驾驶迎来梦醒时分
FastReading融资困难、人才逃离、岗位骤减,自动驾驶已不再是性感的赛道。L4迟迟无法落地,商业化前景更明确的L2成为重要造血手段。自动驾驶告别培育期,适者生存,活下来将成为未来几年的主题。被资本冷落3年后,关于自动驾驶的一切开始出现更深的裂痕。站长网2023-07-06 22:10:320002中国科学院提出「思维传播」框架 让大模型能够像人类一样类比思考
中国科学院与耶鲁大学的研究人员共同提出了一种名为「思维传播」(ThoughtPropagation)的全新框架,旨在提升大型神经网络模型(如GPT-4、PaLM)的推理能力,使其能够更像人类一样进行类比思考。这个框架的灵感源自人类认知,即人们在面对新问题时常常将其与已经解决的类似问题进行比较,以推导出解决策略。论文地址:https://arxiv.org/abs/2310.03965站长网2023-10-10 22:14:150000研究表明,开源语言模型无法与 GPT-4 相提并论
开源语言模型的进步是无可争议的。但它们真的能与来自OpenAI、谷歌和其他公司的训练有素的语言模型竞争吗?诸如之前所报道的,使用AlpacaFormula训练的开源语言模型几乎不需要怎么训练以及很低的成本就能达到了类似于ChatGPT的水平。站长网2023-05-29 10:10:080000百度萝卜快跑:5名主要犯罪嫌疑人已被刑拘 涉嫌操纵数百账号抹黑公司
快科技6月25日消息,百度旗下@萝卜快跑自动驾驶官微发文称,近日,公安机关反馈成功破获一起网络水军”案件。经过连续侦查,公安机关抓获陈某、王某等10余名犯罪嫌疑人,涉及多个省市的10余家MCN机构。据悉,嫌疑人还涉嫌操纵数百个账号发布抹黑萝卜快跑言论,目前陈某、王某等5名主要犯罪嫌疑人已被刑事拘留,案件还在进一步侦办中。站长网2024-06-26 15:40:150002