姚班斯隆奖马腾宇正式宣布大模型创业
要点
1. 清华姚班校友、斯坦福助理教授马腾宇宣布创办Voyage,一个专注于嵌入模型的创业项目,其嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。
2. Voyage的嵌入模型强调高检索精度,使用自监督损失函数和多领域训练数据,具有出色的性能,尤其在工业领域数据集上表现明显。
3. Voyage提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出XL规模和代码金融领域版本。
清华姚班校友兼斯坦福大学助理教授马腾宇宣布了一个引人注目的创业项目,名为Voyage,旨在提供卓越的嵌入模型。这个嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。该项目的成功也得益于三位知名教授,包括斯坦福人工智能实验室主任Christopher Manning和AI领域著名华人学者李飞飞,他们担任了Voyage的学术顾问。
Voyage的嵌入模型强调高检索精度,用于将文本向量化。与生成式模型相比,嵌入模型更注重语义理解,利用神经网络(通常是Transformer架构)来捕获和压缩语义上下文。该团队花费了五年时间收集海量训练数据和开发预处理和后处理方法,最终打造出SOTA的嵌入模型。测试结果显示,Voyage在MTEB数据集上超过OpenAI,且在工业领域数据集上表现更出色。此外,Voyage承诺未在MTEB上作弊,并提出了9个真实世界数据集,其中大部分取得了最佳成绩,有些甚至表现出色。
技术上,Voyage采用了自监督损失函数和多领域的训练数据,同时使用了新的微调技术,无需人工标注。该嵌入模型可通过API或Python库调用,支持最大窗口长度为4096个token。Voyage目前提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出更多版本,包括XL规模和金融领域版本。
总的来说,Voyage的创始人兼CEO马腾宇是清华姚班校友,斯坦福大学助理教授,他的团队致力于提供高质量的嵌入模型,为检索增强生成(RAG)应用和搜索领域提供更先进的解决方案。这一创业项目在嵌入模型领域取得了巨大的成功,展现了创新技术的潜力。
研究人员推自动测试平台CodeIPPrompt 可分析AI代码生成是否侵权
最近,人工智能工具如ChatGPT和Copilot在程序员中爆发式增长,为他们提供了更多帮助。然而,这些人工智能助手可能会删除代码中的注释(这些注释本来用于明确版权和归属指南),从而使人类程序员对知识产权侵权一无所知,但仍会在法律上承担责任。站长网2023-08-01 15:11:310001iPhone16发布会定档:将于9月10日举行
苹果公司于今日凌晨正式宣布,将于美西时间9月9日上午10点,也就是北京时间9月10日凌晨1点,举办2024年秋季新品发布会。与以往不同,此次发布会的时间较常规提前了一天,通常苹果会选择在周二进行发布,而这次则定在了周一。发布会地点依旧选在苹果公园的史蒂夫乔布斯剧院,主题定为“It'sglowtime”,预示着可能与产品发光特性或某种创新技术有关。站长网2024-08-28 14:17:320000小米 MIX Fold 4 、 MIX Flip 折叠屏手机本月发布
小米公司近日宣布,其最新打造的智能工厂已全面投入生产,标志着新一代小米MIXFold4和MIXFlip折叠屏手机的诞生,这两款备受期待的产品将于本月正式亮相。小米官方表示,这座新一代智能工厂采用了深度自研的制造装备,实现了关键工艺流程的100%自动化。同时,工厂还建立了行业领先的全链路工业大数据平台,确保了工业生产的100%数字化。站长网2024-07-08 20:29:300000FUN||蒙娜丽莎被“玩坏”!AI人工智能又盯上蒙娜丽莎,25个不同版本
本文转自:叙拉古之惑蒙娜丽莎无疑是世界上最著名的画作,几个世纪以来一直是艺术家和艺术爱好者的灵感来源。最近,新一波人工智能生成的蒙娜丽莎图像在网上掀起了波澜,结果令人惊讶。这些图像以原画为起点,使用机器学习算法创建既熟悉又全新的新版本。虽然一些艺术纯粹主义者可能会争辩说,这些人工智能生成的图像只是对原作的模仿,但很难否认这些新作品背后的创造力和创新。站长网2023-05-24 02:08:350000