微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。
Phi-3Medium14B 型号的性能与Mixtral8x22B和Llama370B相当,甚至超过了Command R 104B和GPT3.5。这表明微软的这个模型在大型模型领域具有较强的竞争力。
Phi-3Small7B 型号虽然规模较小,但其性能依然超过了Mistral7B和Llama38B,这使得它在需要处理大量数据但计算资源有限的场景下具有潜在的应用价值。
Phi-3系列模型支持的上下文长度为4K和128K,这为处理长文本数据提供了灵活性。模型规模方面,Medium版本为14B参数,Small版本为7.5B参数,而Vision版本则为4.2B参数。
在训练数据方面,微软使用了4.8T(万亿)令牌对模型进行训练,训练过程持续了42天,使用了512个H100GPU。训练数据集包含了10%的多语言数据,并且采用了经过严格过滤的数据和合成数据,特别是科学和编程教材,这可能有助于模型在这些领域的特定任务上表现更好。
微软还为Phi-3系列引入了一个新的分词器,拥有10万词汇量,这有助于模型更好地理解和生成语言。此外,Phi-3模型的权重兼容AWQ、INT4、ONNX和transformers,这为开发者提供了在不同平台上部署和运行模型的灵活性。
总体而言,微软的Phi-3系列模型在大型语言模型领域展现了强大的性能和灵活性,为研究人员和开发者提供了新的工具和可能性。随着这些模型的发布,我们可以期待在自然语言处理和相关领域出现新的创新和应用。
模型地址:https://top.aibase.com/tool/phi-3-vision-128k-instruct
每月6元!用户被中国移动多收8年来电显示费上热搜:官方回应了
快科技7月15日消息,据国内媒体报道称,有用户反馈称,自己的父母被中国移动多收8年来电显示费,每月6元累计费用无法退回。报道中提到,这位用户如果不给父母查询手机账单时意外发现,老人至今每月都被收取6元的来电显示”增值业务费。随后这个话题迅速登上了热搜,有不少网友纷纷表示,自己也不知道来电显示费已取消,每月仍被扣除6元费用。0000创新性生成框架InsActor:用指令就能将人体运动模型转化为逼真的物理动画
**划重点:**1.🚶♂️利用最新的扩散式人体运动模型,InsActor能够生成基于高级人类指令的物理动画。2.🌐通过扩散策略进行灵活条件化运动规划,InsActor捕捉高级人类指令与角色动作之间的复杂关系。3.🎮在实验证明,InsActor在包括指令驱动运动生成和航点导向等任务上取得了最先进的结果。站长网2024-01-02 10:45:230000渐冻人蔡磊称已在准备身后事:原京东财务副总裁 电子发票推动者
快科技8月26日消息,在近日的一段节目中,京东原副总裁、渐冻症抗争者蔡磊称他可以完全接受死亡了。他透露其实自己去年已在准备身后事,找接班人、设立慈善信托、设立遗体捐献、写书,都是知道自己快不行了,在做的准备。”0000美国最受欢迎CEO榜单出炉:NVIDIA黄仁勋夺魁 库克仅第四
快科技10月9日消息,据美国科技公司职场社区Blind调查,NVIDIACEO黄仁勋成为美国最受员工欢迎的CEO,支持率高达96%。据悉,今年8月,Blind面向硅谷科技员工展开了全美CEO支持率调查,共有13171名美国员工进行了匿名投票。站长网2023-10-09 14:07:080000吓人!美国14岁少年因涉嫌贩卖3D打印枪械被捕
近日,美国底特律的一名14岁少年因涉嫌非法贩卖3D打印枪械而被捕,这一事件让人感到震惊。根据CBS新闻的报道,警方在与国土安全部联合进行的一次行动中,突击搜查了少年的住所,查获了一系列与非法武器制造相关的物品。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-09-14 03:23:280000