谷歌Gemini刚发就惹质疑 测试效果视频疑似剪辑
站长网2023-12-07 17:30:000阅
要点:
谷歌Gemini发布引起争议,测试标准和效果视频被质疑,涉及思维链提示技巧和尝试次数选择。
Gemini在一些测试中超越GPT-4,但质疑声音仍然存在,包括图表比例尺、展示视频真实性等方面。
Gemini的发布给其他团队带来信心,认为未来趋势是从大教师模型蒸馏小尺寸密集模型,实现效率和能力的最佳结合。
谷歌Gemini发布后,虽然引起了广泛关注,但却受到了一些质疑。Gemini在一些测试中表现超越了GPT-4,尤其在使用思维链提示技巧和多次尝试的标准下。然而,关键的技术报告引发了争议,其中的测试标准和效果视频被怀疑存在失偏颇和剪辑。
Gemini在MMLU多任务语言理解数据集测试中显示出色,但对比GPT-4时的提示技巧和展示方式引发了争议。质疑者指出,Gemini在使用提示技巧 32次尝试的标准下超越了GPT-4,但这一标准是否公平受到质疑。图表比例尺的问题也被揭示,引起了技术主管的修正。Gemini发布的视频在展示时也引起了关注,部分观点认为其中可能存在剪辑和非实时录制。

Gemini的发布给其他团队带来信心,认为未来的趋势是从大教师模型蒸馏小尺寸密集模型,实现效率和能力的最佳结合。然而,一些观点认为Gemini的发布并未让GPT-4成为独一无二、难以企及的存在。Gemini的多模态能力也受到了测试,对于图片中的内容进行提问,结果显示其表现不一。
Gemini的发布在技术上取得了一些进步,但也面临着一些质疑和挑战。对于使用Gemini的开发者来说,其中的优势和不足需要根据具体任务和需求来权衡。未来Gemini Pro和Gemini Ultra的实际应用表现将成为关注焦点。
0000
评论列表
共(0)条相关推荐
Worldcoin创始人:AGI将于2030年到来
文章要点:1.Worldcoin创始人预计AGI和核聚变能源将在2030年实现。2.Altman也投资了核聚变Startup公司,认为无限能量对AGI至关重要。3.Worldcoin项目旨在应对AGI带来的就业减少,通过提供全民基本收入。站长网2023-08-31 16:47:580000百度文心一言APP支持一键生成专属数字分身 可免费使用
据百度官方消息,目前,文心一言APP正在内测数字分身新功能,iOS和Android用户升级新版本后,均可免费使用该功能,极速体验创建和使用数字分身的乐趣。据了解,文心一言APP新功能极大缩短了用户创建数字分身的时间。过去,创建一个数字分身,需要先通过3D扫描技术创建3D模型,再通过渲染技术给模型赋予纹理,进行动作捕捉、语音合成等,费时费力。站长网2024-02-02 10:06:090000拼多多APP上线本地生活入口 位于首页“充值中心”内
据Tech星球报道,拼多多在其APP内推出了新的本地生活入口。该入口位于首页的“充值中心”内,主要售卖美食相关的特惠餐饮券和代下单服务。图注:拼多多APP内的本地生活业务入口。站长网2023-07-19 11:23:180000AI写真应用妙鸭相机App在苹果应用商店上线
备受关注的AI写真应用“妙鸭相机”已经在苹果应用商店正式上线了App。此前,妙鸭相机只有微信小程序应用,现在有了App版本,用户可以在不同的设备上使用该应用。妙鸭相机的App与小程序账号互通,用户可以使用已有的账号登录,并且可以在App内使用11种不同风格的AI制图功能。此外,用户还可以通过妙鸭相机App创作视频,这为用户提供了更多的创意空间和表达方式。站长网2023-07-31 08:50:190000研究称GPT-4 选股准确率高达 60%,被质疑数据污染
划重点:-GPT-4在选股任务中表现超越人类分析师和其他金融模型,准确率达到60%。-研究者指出,GPT-4可能受到训练数据污染的影响,导致结果偏高。-实验结果显示,GPT-4生成的叙述见解对未来股票表现具有信息性。站长网2024-05-27 19:35:530000