戴着Vision Pro做饭!爆卖20万台首发测评解禁:又贵又重槽点满满,网友直呼拔草了
【新智元导读】昨晚10点,苹果Vision Pro的保密封印正式解除,外媒博主们纷纷放出测评,网友们看完第一印象:好贵!好重!
Vision Pro,如今已经狂卖20万台!
所以,这款被苹果寄望于「打造新时代的空间计算机」的设备,用起来到底怎样?
昨晚10点,保密封印正式解除了。媒体和大V们纷纷放出测评,果粉和VR发烧友们激动地掀起连夜狂欢!
准备好,一大波测评来袭!
空间计算机迈出了第一步,但问题重重
外媒The Verge对于Vision Pro的评价是:开始以为是魔法,然后发现它不是。
许多问题都为人诟病,比如面部体感很重,使用者的鼻子需要非常坚挺,否则它会往下滑;巨大「充电宝」看起来有12000毫安,但实际上仅有3000多毫安;虚拟化身重,虚拟眼睛和真实人脸会产生错误,效果很滑稽,或者很恐怖。
「Apple Vision Pro是有史以来最好的消费类头显,然而,这恰恰也是问题所在。」
太长不看版:
优点
- 显示效果堪称技术奇迹,拥有迄今最好的视频透视体验
- 手势和眼动追踪技术实现了飞跃
- 与苹果的生态系统可以无缝协同
- 把窗口放满整个空间,非常有趣
缺点
- 贵,太贵了
- 视频透视有时可能会出现模糊
- 手势和眼动追踪的表现不稳定
- 数字化身不够自然,甚至会有一些「恐怖谷效应」(但有人认为效果很赞)
使用Vision Pro进行通话,你觉得「诡异」吗?
对于The Verge出的30分钟长视频,网友们也是反响热烈:
「你真的想要一台总是盯着你手的电脑吗?」让我笑疯了。
「跟Quest3相比,更窄的视野是一个巨大的失误。」
评价这款头显最中肯的说法,就是「这是我见过有史以来最好的头显,但并不完美」。
有趣的是,有人看完视频种草了,有人则是彻底拔草了。
「看完了,有85%的可能性要去买。」
「视频做得真好,看完拔草了。」
使用Vision Pro的灵魂拷问
其实,头显这个概念十多年前就出现,已经不新鲜了。
2013年,就有了第一款Oculus Rift。随后,第一台Oculus演变成了Meta的Quest系列,然后是如今正在推出的售价500美元的Quest3。
苹果的创新点在于,把许多想法组合在一起,将头显打造成一台电脑。
他们希望,把Vision Pro打造成一款完整的设备,在苹果的生态系统中与Mac和iPad并驾齐驱。
然而,为了这种愿景,苹果也不得不做出很多权衡。
最致命的一个问题就是,在一款头显中实现所有这些技术,就意味着它戴在脸上会很重,所以苹果不得不使用外接电池,以及其他一些权衡。
以下,是The Verge记者对Vision Pro用户们发出的灵魂拷问——
你愿意使用一款每次使用都会打乱你发型的电脑吗?你会愿意被它破坏妆容吗?
你的电脑拍摄的内容,可能会被迪士尼限制,你愿意吗?
你愿意用一个无法和别人分享内容的电脑吗?你最豪华的电视,是否应该具备HDMI输入功能?你的电脑一到昏暗环境里就不好用,你愿意吗?
你的电脑总是在监视你的手部动作,你愿意吗?
硬件
苹果不希望我们叫它VR头显,而是「空间计算机」,确实有一定道理。
从很多地方看来,它的确可以假装不是VR头显。
跟很多看起来很傻的塑料VR头显相比,Vision Pro非常惊艳。
它由镁和碳纤维制成,铝制外壳,仿佛是苹果那熟悉的设计语言的自然延伸。
EyeSight功能鸡肋
不过,硬件设计中也有很鸡肋的bug,比如苹果引以为傲的EyeSight功能。
注意,你眼前出现的,是数字眼球,不是真的眼睛
在The Verge记者看来,这个功能还不如不存在。
因为OLED分辨率很低,透镜面板很昏暗,盖板玻璃由很强的反光,所以在正常的照明下,你的眼镜很难被看到。
大多数情况下,别人看到你的眼镜时,会看到一个低分辨率的、幽灵般的图像。所以,你并不能戴着它和别人进行真正的眼神交流。
当然,Vision Pro也有很多令人惊喜的地方。
设备上的摄像头、传感器、激光雷达扫描仪和红外泛光灯,让它在弱光下就能工作。
散热也做得不错。M2处理器、苹果的R1空间处理器和一对风扇,可以让设备迅速散热。
对于戴眼镜的用户,可以定制蔡司镜片。戴着隐形眼镜使用Vision Pro的感觉,也还不错。
600多g的重量,全都压到了脸上
但是,Vision Pro真的太重了!
仅是头显的重量,就有600到650g,可以说,它是一款戴在你脸上的iPad。
可怕之处在于,它的重量是完全前置的。像Quest Pro这样722g的大型头显,会有精心制作的头带来平衡重量。
但Vision Pro没有!所有的重量,都压在了你的脸上。过不了一会儿,你就会感到这种「不能承受之重」了。
虽然,这已经是苹果做了妥协的结果——为了减轻重量,苹果特意把电池做成了一块外接的「重达353g的银砖」。
电池可以供电两个半小时。而一旦断开电池,电源供应就会完全切断。
显示屏:库克想做AR,但其实没做出来
显示屏是Vision Pro如此昂贵的主要原因——它们是Vision Pro体验的核心,也是让所有体验如此神奇的直接原因。
两款显示器都是微型MicroOLED,总像素为2300万像素,尺寸仅为7.5微米,大小相当于一个红细胞。这是技术的重大飞跃。
不过,在显示屏上,苹果也有权衡取舍。
苹果最大的目标,其实是光学AR——光线直接通过眼镜传递到你的眼睛,数字信息层层叠叠地覆盖在你所看到的东西之上。
库克一直认为,AR是有可能真正改变人类的技术。
然而问题在于,构建真正的光学AR显示器、足以取代日常计算机的技术,迄今还没有出现。
Magic Leap2倒是更小、更便宜,但在视野和图像质量上更差,大多数人都无法接受。
因此,苹果决定打造一款具有实时视频直通功能的头显——这就是Vision Pro的决定性权衡的结果。
说白了,这是一款伪装成AR头显的VR头显。
Vision Pro上的视频直通,效果非常好。戴上它时,一堆visionOS窗口漂浮在周围。
在适合人眼的计算机上,以高分辨率实时做到这一点,其实是一项惊人的工程成就。
根据苹果的说法,摄像头看到的内容和显示屏上的内容只有12毫秒的延迟。算起来,甚至没有一秒的延迟:你看完最后一帧视频之前,下一帧视频就已经准备好了。
WSJ记者甚至戴上Vision Pro做了一顿饭,切菜时屏幕上所看到的与实际发生事情并没有明显的延迟
可以说,这是迄今为止消费类设备中最好的视频直通。
问题在于,相机仍然是相机,显示器仍然是显示器。
相机和显示器在色彩再现上,都有局限性,而Vision Pro无法克服。
当你移动头部时,运动模糊很明显,还会有一些奇怪的直线翘曲。随着降噪开始,低光也会导致视频直通的清晰度下降。
比如,在这个中等光线的房间里,系统试图平衡一切事物的亮度,因此Vision Pro只能显示眼睛实际看到的49%的颜色。
另外,Vision Pro的视野也不大,因此你看到的东西周围会有大的黑色边框。
镜头边缘有一点失真和渐晕,还会有绿色和粉红色的边纹。这些都让视野更小。
视角模拟
屏幕截图
手势追踪和眼动追踪
手势追踪和眼动追踪系统,是苹果非常引以为豪的部分,看起来比其他的消费级系统都要先进。
头几次使用时,你会非常惊喜,觉得像超能力一样。
你并不需要把手举在空中,Vision Pro的外置摄像头只要看到你的手就能工作。你可以把手放在沙发上、腿上、桌子上,它都能追踪。
然而,多用几次后你会发现:如果你想要查看自己控制的内容,就要费大劲了。
平时我们用电脑,操作一个对象时并不需要看着它。
而在Vision Pro上,这完全不可能。
你必须看着那个东西,才能点击它,这就会导致你不断地将注意力从手头做的事上面移开,转满查看你接下来需要按的按钮。
记者才玩了一个小游戏,就感觉抓狂:移动棋子很困难,因为他的目光一直在从棋子上移开。
虽然visionOS也是为眼动追踪系统设计的,但也有不少问题:很多控件都太小了,而且靠得太近了,根本无法快速浏览系统。
点击你想要的东西时,你必须看着它。最快的方法,就是移开视线,再试一次。
要知道,你的眼睛和手并不能直接控制Vision Pro:摄像头会观察它们,将其转化为输入,很多时候转化并不完美。
比如用屏幕键盘时,你需要盯着每个字母,捏住你的手指来选择按键,这实在太费时间了。
它唯一的用途,可能就是输入Wi-Fi密码。如果要花更长时间,还不如用听写或者连接蓝牙键盘,这样你可以直接控制输入。
不仅是使用令人抓狂,这个系统会不断观察你的手部输入,所以会记录很多意料外的输入。
比如你在干一件别的事,系统却会意外地滚动、点击东西。这就逼得你不得不取下Vision Pro。
总结来说,这确实是有史以来最好的手势和眼动追踪系统,但魔法过一会就会失效。
如果苹果真的要做空间计算机,输入系统要走的路还长着呢。
最后,记者表示:作为主要的计算工具,Vision Pro给人的那种孤独感格外突兀。
「我不想在Vision Pro中处理工作。我的工作需要与人协作完成,我更愿意与他们一起,身处这个真实的世界。」
高强度使用一周后的体验:计算和娱乐的未来
另外,CNBC的记者也给出了一篇生动的深度体验。
最初见到苹果公司展示Vision Pro时,很多用户心里一定也会充满了疑问。
毕竟,虚拟现实、增强现实、混合现实各种复杂的现实概念,各大公司已经摸索了好几年。
但Vision Pro的三大亮点让3500刀的售价看起来似乎都开始显得有些「平易近人」了:
- 显示效果最为顶级的屏幕;
- 透视可真实还原周遭世界;
- 世界上最好的头显处理器。
Vision Pro的显示屏有效地解决了像Meta Quest3这样低成本头戴设备常见的「纱窗」效应——头显中能看到清晰的像素点的问题。
在Vision Pro上,无论是阅读网页还是书本上文字都非常轻松。
甚至能够让用户在比家里任何一台电视都要大而且清晰的屏幕上观看普通电影和3D电影。
虽然Quest3和其他头戴设备也具备透视功能,但苹果的技术表现明显更胜一筹。
Vision Pro的画面更加清晰锐利,让用户能够舒适地全彩观看周围环境,几乎没有任何延迟,不过还是无法通过它阅读手机上的内容。
用户只要旋转那个小巧的数字旋钮,就像操作苹果手表或 AirPods Max 那样,来调整音量或让自己完全沉浸进一个3D场景之中。
虚拟旅行功能真的能让用户足不出户就在夏威夷、湖边、白沙滩上工作或看电影。
在舒适而宁静的环境里,云朵在天空中缓缓移动,让用户仿佛置身其境。
一旦熟悉了Vision Pro的操作,在头显里导航就变得非常简单。
就像iPhone诞生时那样,苹果推出了多点触控显示屏,彻底改变了过去主要依赖触控笔、触摸板或键盘操作的手机的交互方式。
不需要手柄,头戴设备通过传感器追踪用户的眼动(甚至在你在线购物或在App Store中购买时进行自动验证)。
苹果提供了一个快速设置流程,先是将设备与你的眼睛进行适配,然后让用户跟随一系列的点移动视线,并随着操作捏合手指以进行校准。
对于戴眼镜的用户,苹果还提供了可插入设备的镜片。
其精准度令人赞叹。用户只需看向目标,然后用拇指和食指轻点即可选择按钮或应用。
例如,每个应用底部都有一个白色控制条,用户只要对它进行拖拽,或者通过注视应用的角落并沿对角线拖动,就可以调整应用的大小。
而通过并拢食指和拇指,向上或向下拉动,就可以滑动照片或滚动网页。
同样,通过双手的食指和拇指向外或向内拉动,就可以进行缩放操作。
不需要在面前挥舞双手,因为头显的外置摄像头能够检测到用户腿上的手指动作,操作可以非常轻巧。
用户可以在虚拟空间中同时运行十几个应用,虽然实际上没必要同时运行这么多,因为根本看不过来。
用户可以在自己正前方设置一个浏览器窗口,旁边放上音乐播放器,在最上面放一个虚拟的电视屏幕。
而且这个虚拟世界的布局完全由你自己决定。
用户可以同时打开电子邮件、浏览器,让飞书保持活跃状态,旁边再放一个Word文档,再把日历则放在另一边。
只要用户想,甚至可以把短信显示在天花板上。
截图显示应用程序似乎有些歪斜。但实际上在头戴设备中看起来,它们都是完美对齐的
这为多任务处理提供了一种全新的方式。
体验Vision Pro的过程中,没有遇到任何操作延迟。
这要归功于苹果的内容渲染方式。
Vision Pro只对用户正在聚焦的屏幕区域进行清晰渲染,而让其他区域保持模糊。
这就是为什么一些截图的边缘部分看起来有些模糊。
但是在头显内部,一切都非常清晰。这种技术被称为「注视渲染」(foveated rendering),能大大提高处理器的效率。
Vision Pro的观看体验也好的离谱。
用户可以同时直播四场比赛,主要的比赛显示在中间,其他比赛固定在两侧。这种体验简直不可思议。
苹果还提供了几段自己特别录制的内容,清晰度之高让用户感觉仿佛亲临其境。
其中有一个略显惊悚的片段,一个女士在悬崖间的绳索上行走。
如果恐高,那么可能它的真实度会让你完全受不了。
这些片段展示了第三方未来可以录制并发布到头戴设备上的内容类型。
可以想象,未来可以让用户体验现场观看一场比赛。
FaceTime的使用体验非常棒。你可以在面前的屏幕上清楚地看到通话对象的视频画面。但他们看到的并不是真正的你,而是一个名为「数字化身(digital Persona)」的3D 渲染形象。
创建「数字化身」非常简单,只需在设置菜单中选择相应选项,然后摘下头戴设备并按照外部显示器的引导进行。
系统会引导你进行一系列表情动作,如上看、下看、左看、右看、微笑、露齿笑以及闭眼,仅需几秒钟,一个3D 化身就诞生了。
与其他头显设备相比,这个化身的外观更接近真人,不会显得卡通化。
通过FaceTime与其他使用数字化化身的人交流时,对话更加自然,不像是两个滑稽头像在那聊天。
即便穿着睡衣,也能通过数字化化身穿着正装参加正式会议。
此外,内置扬声器的表现出色,声音响亮且支持空间音效。
这意味着如果用户从正前方的电影转过头去,声音仍然保持在原来的位置,就像用户真的在看电视一样。
音乐和电影的音质都非常出色,具有全面的环绕声效果。
不过,别人还是能听到头戴设备发出的声音,所以在公共场合最好使用AirPods。
用户可以使用Vision Pro或最新的iPhone15Pro和iPhone15Pro Max外部相机捕捉的「立体照片」。
这种相机可以创建照片或视频的3D版本。
比如,用户可以记录了4个月大的女儿吃东西的场景,以及自己的狗狗第九个生日的情景,将来能够重温这些特别的时刻。
最后,这款头戴设备的制造质量非常高。苹果使用了顶级的玻璃、屏幕和金属材料,让它既看起来高端大气又能舒适佩戴。
可以说,这篇深度体验真的把Vision Pro现有的优点非常全面地展示了出来。
两万五一台,值得买吗?
参考资料:
https://www.wsj.com/tech/apple-vision-pro-review-39f2d82e
https://www.theverge.com/24054862/apple-vision-pro-review-vr-ar-headset-features-price
https://www.cnbc.com/2024/01/30/apple-vision-pro-review-the-future-of-computing-and-entertainment.html
一段乱码,竟让ChatGPT越狱!乱序prompt让LLM火速生成勒索软件,Jim Fan惊了
【新智元导读】外国网友发现全新越狱技术——只要告诉ChatGPT它可以认识乱序排列的单词,就可以通过输入乱序的prompt,让它生成勒索软件了。继奶奶漏洞之后,ChatGPT又有新「玩法」了!这位国外的网友说,自己刚刚发现了一种全新的越狱技术,让ChatGPT创建勒索软件、键盘记录器等。我们都知道,人脑可以读懂顺序打乱的字句和单词,并不影响理解。而这位网友正是利用了这一点。站长网2023-08-19 15:27:430000Meta 试图通过 Advantage+ AI 来吸引广告商投放定向广告
据TheInformation消息,广告公司高管透露,Facebook母公司Meta目前已停止向广告商推介其元宇宙计划,并转向强调其人工智能(AI)工具和短视频产品Reels。这也表明马克·扎克伯格的热情正在消退,原本全力押注元宇宙的他,现在开始关注公司的成本削减。Meta正在加强其AI工具的宣传,特别是针对定向广告的AdvantageAI项目。站长网2023-04-19 16:30:200001AI视野:必应推出GPT-4Turbo模型;抖音测试“AI搜”功能;小红书内测AI聊天机器人;OpenAI计划新一轮融资
🤖📈💻💡大模型动态必应推出GPT-4Turbo模型微软推出BingChat的最新模型,GPT-4Turbo,为用户提供更准确和最新的信息。目前仅限部分用户试用,使用方法需通过检查资格确认。【AiBase提要:】🚀GPT-4Turbo发布:微软推出BingChat的最新模型,GPT-4Turbo,升级版GPT-4,截至2023年4月信息,提供更好的搜索结果。站长网2023-12-25 18:54:380000替换万物3D!Meta 推ReplaceAnything3D可用文本引导3D场景编辑
**划重点:**1.一种名为ReplaceAnything3D(RAM3D)的新型文本引导的3D场景编辑方法,可以替换场景中的特定对象。2.提出了Erase-and-Replace方法,通过文本提示实现对场景中的对象进行替换,保持多个视点的3D一致性。3.展示了RAM3D在各种现实3D场景中的多样性,演示了修改的前景对象与场景的整体融合,不影响整体完整性。站长网2024-02-01 14:46:070000LP-MusicCaps:基于 LLM 的伪音乐字幕生成方法
LP-MusicCaps是一种基于LLM的伪音乐字幕生成方法。该项目的目标是为音乐生成字幕。它通过将大型语言模型应用于标签数据集,生成了一个大规模的音乐字幕数据集,为研究者们提供了更多的训练数据,以便成功训练音乐字幕生成模型。项目地址:https://github.com/seungheondoh/lp-music-caps其核心功能包括:站长网2023-08-03 18:16:430000