世界最强开源大模型Falcon 180B引爆全网 性能直逼商业模型
要点:
Falcon180B是TII研究中心推出的开源大模型,参数量达1800亿,在Hugging Face排行榜上位居第一。
Falcon180B在多项自然语言处理基准测试中表现强劲,击败了LLaMA2,与GPT-3.5和PaLM2不相上下。
Falcon180B可免费商用,提供了聊天对话版本,任何人都可以试用体验。
近日,阿布扎比的全球领先技术研究中心 TII 发布了一款世界顶级开源大模型 ——Falcon180B。这款模型在3.5万亿 token 的训练下,拥有1800亿参数,性能超过了之前的开源模型 Llama2,甚至接近了谷歌的 GPT-4。Falcon180B 在各项任务中表现出色,被认为是目前最好的开源大模型之一。
Falcon180B 的训练过程使用了亚马逊云机器学习平台,并在多达4096个 GPU 上完成了训练,总共进行了大约7,000,000个 GPU 计算时。训练数据主要来自于 RefinedWe 数据集,其中包括对话、技术论文和一小部分代码等多种数据。
项目地址:https://huggingface.co/tiiuae/falcon-180B-chat
Falcon180B 在多个基准测试中都表现出色,超过了 Llama2和 GPT-3.5。在 Hugging Face 开源大模型榜单上,Falcon180B 的评分也超过了 Llama2,成为当前评分最高的开放式大模型。
除了基础模型,研究人员还发布了聊天对话模型 Falcon-180B-Chat,该模型在对话和指令数据集上进行了微调,可以进行实时对话的演示。
虽然 Falcon180B 的性能引起了广泛关注,但也有一些人对其质疑。英伟达高级科学家 Jim Fan 指出,Falcon-180B 的训练数据中代码只占了5%,而代码是提高模型推理能力的重要数据,因此对于没有代码能力的模型,无法声称优于 GPT-3.5或接近 GPT-4。
总的来说,Falcon180B 作为世界顶级开源大模型,拥有强大的性能和参数规模,在各项任务中表现出色。然而,对于其在代码方面的不足,还需要进一步的探讨和研究。
AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹
划重点:🔍在现有的视频生成和编辑方法中,精确和局部的视频编辑仍然是一个巨大的挑战。🔍本文提出了一种新颖的方法,通过同时指定内容和运动来实现精确的视频编辑。🔍通过三阶段的训练策略和时空自适应融合模块,我们实现了内容和运动控制的集成,具有出色的编辑效果。站长网2024-05-24 21:14:300000NVIDIA DGX Cloud现在可强化Genative AI训练
英伟达发布消息,NVIDIADGXCloud作为今年3月推出的一项人工智能超级计算服务,现在可以强化GenativeAI训练,它为企业提供了训练生成性人工智能和其他开创性应用所需的基础设施和软件的即时访问。站长网2023-07-26 10:52:180000小米副董事长林斌回应减持公司股票:用于捐赠、慈善!
快科技6月22日消息,近日小米集团副董事长林斌减持行为引发行业关注。据悉,林斌在6月4日至6月6日期间,累计减持小米集团1000万股股份,按照每股均价计算,合计套现约1.79亿港元,约合人民币1.66亿元。有投资者认为这是在减持套现,违反了当初的承诺。对此,林斌本人今早通过微博发文回应:站长网2024-06-22 23:42:130000知乎最新变动:PC网页端非登录用户已无法查看回答全文
快科技5月27日消息,近期,知乎平台的一项新变动引起了用户的广泛关注。据媒体报道,非登录用户在PC网页端访问知乎时,已无法查看回答的全文内容。经测试发现,当用户尝试点击展开阅读全文”时,系统会自动弹出登录窗口,而非登录用户无法直接浏览全文。在2022年3月,工信部针对部分网站强制用户下载App才能浏览全文的问题,召开了行政指导会,督促相关互联网企业进行整改,并明确指出:站长网2024-05-27 19:47:120001UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%
要点:1.多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。2.LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。3.LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。站长网2023-11-06 15:07:230000