首页站长资讯Midjourney遇劲敌！谷歌AI绘画4大牛创业，免费试玩Imagen技术，拿下1.2亿天使融资

Midjourney遇劲敌！谷歌AI绘画4大牛创业，免费试玩Imagen技术，拿下1.2亿天使融资

站长网2023-08-26 18:43:371阅

AI绘画王座上的MidJourney，终于迎来强劲对手。

最新挑战者Ideogram横空出世，开局就靠免费注册吸引众多目光。

最瞩目的特性:在图中精准生成文字，英伟达科学家范麟熙直接毫不客气地用它画了一个“It’s over， Midjourney”。

背后公司Ideogram AI，谷歌AI绘画4大牛集体离职的创业项目，坐标多伦多，带着1650万美元（约1.2亿人民币）种子轮融资席卷而来。

创始团队中前4人都是谷歌文生图研究Imagen论文作者，组成一个扩散模型顶级研究团队。

谷歌藏着掖着这么久都不给大家玩的先进研究成果，终于被他们给开放出来。

Ideogram AI种子轮融资由a16z和Index Ventures领投。

个人投资者中也不乏知名人物，如OpenAI创始成员Andrej Karpathy，强化学习大牛Pieter Abbeel，Node.js创始人Ryan Dahl、GitHub联合创始人Tom Preston-Werner等。

甚至团队的老上司，前谷歌大脑掌门人Jeff Dean也有参与。

别看创始团队都是技术出身，Ideogram AI在宣传造势方面也一点不含糊，直接在𝕏上号召大家刷二创tag，开启了一波病毒营销。

AI学会精准画出文字

让AI精准画出文字，一直是个难题。虽然SDXL和Midjourney新出的局部重绘功能有所改善，但网友反馈成功率一直不太高，需要反复尝试。

Ideogram一搞定这个痛点，直接被网友们玩出花了。

让文字出现在指示牌上、同时适应环境光影，没问题。

做一个咖啡拉花也没问题;抽象风格的海报，也可以搞出风格合适的字体;一句话直出品牌logo更是生产力属性拉满。

从网友们分享的提示词中也可以看出，增加画文字成功概率的“咒语”也很简单，就一个单词:

typography（印刷排版）

不过很可惜的是，它还不太能掌握中文。

抛开文字，Ideogram的图像生成能力，出图质量可以比肩MidJourney和Stable Diffusion。

如果与Imagen使用完全相同的技术，那么使用谷歌T5而不是OpenAI CLIP作为语言编码模型，意味着Ideogram对提示词里空间关系描述的理解还要更强。

有人成功用它生成一组风格一致的图像。

再结合视频生成工具Pika Labs直接搞出电影预告片风格的短片。

扩散模型顶级研究团队

Ideogram AI创始团队共7人，其中4人都是谷歌Imagen的合著者。

其中共同一作Mohammad Norouzi任CEO，他在多伦多大学计算机科学博士就读期间拿到了谷歌ML博士奖学金。

毕业后他加入谷歌大脑工作了7年，除了生成模型之外也是也是谷歌神经机器翻译团队的原始成员，Hinton团队自监督对比学习框架SimCLR的合著者。

共同一作William Chan（陳俊樂）任新公司CTO，他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。

他2012年加入谷歌时先做的机器学习广告工程，后转到谷歌大脑作NLP研究。

第三位共同一作Chitwan Saharia本科毕业于孟买理工学院，2019年加入谷歌，现在是Ideogram的联合创始人。

第四位联创Jonathan Ho博士毕业于UC伯克利，曾在OpenAI工作一年，后加入谷歌。

他除了是Imagen论文的核心贡献者，还是去噪扩散模型奠基之作《Denoising Diffusion Probabilistic Models》的一作，这篇论文合著者中的Pieter Abbeel也是Ideogram AI的投资人。

创始团队中的另外三人，Shayaan Abdullah曾是Twitter的机器学习工程师，于今年4月离职，后加入Ideogram AI。

Jacob Lu为软件工程师，加入Ideogram之前曾在亚马逊等公司任职;Jenny Lei是软件工程实习生，加入Ideogram AI之前曾在谷歌实习。

还要做视频生成

Ideogram AI的四位联创在谷歌期间，还完成了视频生成的后续工作Imagen Video。

在一年前就已经实现了生成1280*768分辨率、每秒24帧的高清视频片段。

实际上在今年3月，量子位就曾从投资市场获悉他们的天使轮估值达到1亿美元，更多VC想给钱而赶不上、投不进，以及他们创业方向的更多消息:

不仅做图像生成，将来还要做视频生成。

无论Imagen还是Imagen Video，谷歌出于安全、伦理等方面考虑都未曾放出试玩、API或开源代码。

研究成果无法转化为应用，是近年来不少从谷歌离职创业者遇到的共同问题。

如大模型那边的Transformer八位作者中，Cohere创始人Aidan Gomez就曾表示离开的原因是“我在谷歌没有看到大模型发挥它真正的力量”。

Ashish Vaswani与Niki Parmar离开谷歌创办Adept AI与Essential AI的原因也是“谷歌希望用Transformer优化现有产品，而我们希望创造新产品”。

后来这些研究者所担心的事也确确实实发生了:

尽管2021年5月（比ChatGPT训练数据截止日期还早）谷歌就已经开发出了LaMDA对话大模型与聊天机器人，但在推出产品方面有太多顾虑，最终18个月后被隔壁ChatGPT一手直接面对公众开放抢尽了风头。

……

吸取了这些教训，新成立的Ideogram AI也拿出一副尽量开放、先把用户吸引进来玩的架势。

最初宣布了1000人测试名额，但没一会就满了。

今天似乎又开放了一些名额，量子位上午注册时并没有遇到排队。

总之名额应该还是有限的，感兴趣的朋友抓紧了。

试玩地址:

https://ideogram.ai

参考链接:

[1]https://ideogram.ai/launch

[2]https://x.com/ideogram_ai/status/1694024927853129757

[3]https://x.com/DrJimFan/status/1694358069638275463

[4]https://x.com/WilliamLamkin/status/1694535089575637048

—完—

Midjourney遇劲敌谷歌AI绘画4大牛创业免费试玩Imagen技术拿下12亿天使融资

0001

评论列表

共(0)条

相关推荐

站长资讯
AI智能硬件公司「未来智能」获数千万元Pre-A轮融资
据36氪报道，近日，安徽艾德未来智能科技有限公司（未来智能）宣布完成数千万元Pre-A轮融资，由天际资本领投。本轮融资资金将主要用于AI创新产品研发和市场扩张。他们的主打产品是iFLYBUDS系列会议办公耳机，可以在打电话、路演等场景中快速启动录音功能。该产品适配系统通话、网络电话以及市面上主流的会议APP，并支持边录音边转文字、外语实时翻译等多种功能。
站长网2023-09-07 14:30:33
0000
站长资讯
宗馥莉接任娃哈哈电商执行董事
2月23日，杭州娃哈哈电子商务有限公司发生工商变更，宗庆后卸任法定代表人、执行董事、经理，由其女儿宗馥莉接任。杭州娃哈哈电子商务有限公司成立于2020年3月，注册资本2亿人民币，经营范围含食品销售、食品互联网销售、互联网信息服务、普通货物仓储服务、农副产品销售等，由娃哈哈商业股份有限公司全资持股。
站长网2024-02-26 11:52:26
0000
站长资讯
科大讯飞官宣：讯飞星火认知大模型V2.0将在8月15日发布
就在刚刚，科大讯飞官宣，讯飞星火认知大模型V2.0升级发布会将在2023年8月15日14:00举办，具备代码自动生成、续写、纠错等能力。2023年5月6日，科大讯飞正式发布星火认知大模型。“讯飞星火认知大模型”具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
站长网2023-08-10 12:06:34
0000
站长资讯
微软发言人否认 AMD 参与 Athena 雅典娜人工智能芯片的开发
据彭博报道，微软正在与芯片制造商AMD合作将其AthenaAI芯片组推向市场。报道引用了多个消息来源。据该报道称，微软提供了资金支持，以帮助资助AMD扩大人工智能芯片组业务，并与AMD合作为这家软件巨头的数据中心创建一款内部AI芯片组。
站长网2023-05-06 14:12:30
0000
站长资讯
百度：将在10月17日发布多款AI原生应用
百度宣布，将在10月17日以“生成未来（PROMPTTHEWORLD）”为主题举办BaiduWorld2023。届时，百度将发布多款AI原生应用，介绍大模型最新进展。此外，大会还将举行面向企业、开发者、合作伙伴、投资人等分论坛，设置前沿AI互动体验区，全面展现百度最新成果。
站长网2023-08-21 14:36:30
0001