微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。
Phi-3Medium14B 型号的性能与Mixtral8x22B和Llama370B相当,甚至超过了Command R 104B和GPT3.5。这表明微软的这个模型在大型模型领域具有较强的竞争力。
Phi-3Small7B 型号虽然规模较小,但其性能依然超过了Mistral7B和Llama38B,这使得它在需要处理大量数据但计算资源有限的场景下具有潜在的应用价值。
Phi-3系列模型支持的上下文长度为4K和128K,这为处理长文本数据提供了灵活性。模型规模方面,Medium版本为14B参数,Small版本为7.5B参数,而Vision版本则为4.2B参数。
在训练数据方面,微软使用了4.8T(万亿)令牌对模型进行训练,训练过程持续了42天,使用了512个H100GPU。训练数据集包含了10%的多语言数据,并且采用了经过严格过滤的数据和合成数据,特别是科学和编程教材,这可能有助于模型在这些领域的特定任务上表现更好。
微软还为Phi-3系列引入了一个新的分词器,拥有10万词汇量,这有助于模型更好地理解和生成语言。此外,Phi-3模型的权重兼容AWQ、INT4、ONNX和transformers,这为开发者提供了在不同平台上部署和运行模型的灵活性。
总体而言,微软的Phi-3系列模型在大型语言模型领域展现了强大的性能和灵活性,为研究人员和开发者提供了新的工具和可能性。随着这些模型的发布,我们可以期待在自然语言处理和相关领域出现新的创新和应用。
模型地址:https://top.aibase.com/tool/phi-3-vision-128k-instruct
独家对话华创资本熊伟铭,还有什么AI项目值得关注和投资?
第三届BEYOND国际科技创新博览会在澳门威尼斯人金光会展中心正式开幕,在此期间,凤凰网科技《AI前哨》与华创资本创始合伙人熊伟铭展开对话,探讨了“AI热”下投融资市场环境的变化和影响。0000YouTube 宣布负责任的人工智能创新方法:要求披露 AI 生成的内容并添加标签
YouTube正在推出针对AI内容的新规则,包括要求创作者透露他们是否使用了生成式人工智能来制作逼真的视频。YouTube在周二的一篇博客文章中概述了一系列与AI相关的政策更新,表示那些不透露是否使用AI工具制作「改动过的或合成的」视频的创作者将面临处罚,包括被移除内容或被暂停参与该平台收益分享计划。站长网2023-11-15 18:06:450001Sam Altman突遭起底「生活奢靡」!戴340万名表,开上亿豪车,买价值6亿豪宅
【新智元导读】最近,关于Altman的风波不断。有人挖出他戴着价值48万美元的奢侈品手表,开着价值上亿的豪车,而更让人瞠目结舌的,就是他奢华无比的硅谷大佬朋友圈了。Altman被挖坟了!最近有人注意到,在2018年的一次Wired活动中,Altman低头看了看自己的手腕。继续扒皮后有人发现,当时他戴着一款看起来非常奢华的金表。0000谷歌与环球音乐正在就人工智能生成音乐授权进行谈判
谷歌和环球音乐正在洽谈授权艺术家的旋律和声音,以用于由人工智能生成的歌曲,以此来将音乐业务最大的威胁之一变现。据四名知情人士证实,这些讨论旨在建立一项新的人工智能技术合作伙伴关系,因为这一行业正在应对新技术的影响。生成型人工智能的崛起导致了「深度伪造」歌曲的激增,这些歌曲可以逼真地模仿已有艺术家的声音、歌词或音效,通常未经其同意。站长网2023-08-09 09:04:310000DialMe:一个自动化面试平台
DialMe是一个旨在改善面试流程的革命性平台。DialMe的目标是摆脱传统的文字填写表格方式,而是通过人工智能引导真实对话,为您提供深入的见解。不再让人们感到无聊,让AI引领对话,让您更快地了解应聘者或受访者。站长网2023-09-25 18:15:070000