谷歌Gemini刚发就惹质疑 测试效果视频疑似剪辑
站长网2023-12-07 17:30:000阅
要点:
谷歌Gemini发布引起争议,测试标准和效果视频被质疑,涉及思维链提示技巧和尝试次数选择。
Gemini在一些测试中超越GPT-4,但质疑声音仍然存在,包括图表比例尺、展示视频真实性等方面。
Gemini的发布给其他团队带来信心,认为未来趋势是从大教师模型蒸馏小尺寸密集模型,实现效率和能力的最佳结合。
谷歌Gemini发布后,虽然引起了广泛关注,但却受到了一些质疑。Gemini在一些测试中表现超越了GPT-4,尤其在使用思维链提示技巧和多次尝试的标准下。然而,关键的技术报告引发了争议,其中的测试标准和效果视频被怀疑存在失偏颇和剪辑。
Gemini在MMLU多任务语言理解数据集测试中显示出色,但对比GPT-4时的提示技巧和展示方式引发了争议。质疑者指出,Gemini在使用提示技巧 32次尝试的标准下超越了GPT-4,但这一标准是否公平受到质疑。图表比例尺的问题也被揭示,引起了技术主管的修正。Gemini发布的视频在展示时也引起了关注,部分观点认为其中可能存在剪辑和非实时录制。
Gemini的发布给其他团队带来信心,认为未来的趋势是从大教师模型蒸馏小尺寸密集模型,实现效率和能力的最佳结合。然而,一些观点认为Gemini的发布并未让GPT-4成为独一无二、难以企及的存在。Gemini的多模态能力也受到了测试,对于图片中的内容进行提问,结果显示其表现不一。
Gemini的发布在技术上取得了一些进步,但也面临着一些质疑和挑战。对于使用Gemini的开发者来说,其中的优势和不足需要根据具体任务和需求来权衡。未来Gemini Pro和Gemini Ultra的实际应用表现将成为关注焦点。
0000
评论列表
共(0)条相关推荐
AI合成数据公司“光轮智能”完成天使+轮融资
光轮智能近期完成了天使轮融资。累计融资金额达数千万元人民币,投资方包括SEEFund、变量资本等。据介绍,光轮智能致力于为企业落地AI提供自动化、物理精确可控、真实、可泛化的合成数据解决方案,打造AI时代的数据基础设施。光轮智能开创性的将生成式AI与仿真技术深度融合,提供多模态、高质量、大规模、低成本的合成数据,弥补AI时代的数据缺口。站长网2023-07-25 16:18:390000腾讯高管谈友商云服务降价:不会带来巨大影响
腾讯控股高管在2023年一季度财报电话会上透露,友商云服务的价格调整对腾讯确实会带来一些影响,但云业务在公司总收入中所占比例仅为个位数,并未超过10%。云服务只是公司的一种基础设施,并不是主要收入来源。站长网2023-05-18 08:43:260000摩根士丹利:随着 Edge AI 走向主流,苹果处于最有利的位置
在人工智能(AI)成为2023年的热门话题之际,投资公司摩根士丹利的一份新报告得出结论,尽管苹果对其AI技术的发展讳莫如深,但该公司已准备好在消费者开始广泛采用基于AI的工具时获得利润。摩根士丹利认为,苹果在AI领域的进展超出了公众的预期,并可能在2024年成为「EdgeAI(边缘AI)」领域的六大「关键受益者」之一。站长网2023-11-09 18:08:120006冯提莫“二次跳槽”:签约抖音游戏公会,重心还在直播吗?
与B站合约到期、停播7个月后,冯提莫要回归了。7月6日,抖音游戏公会“微应互动”发布了与冯提莫签约的消息。随后,冯提莫工作室也官宣了该消息。签约抖音公会,冯提莫这是要来抖音开播了?对此,新播场咨询了微应互动相关人士,对方称冯提莫后续动向以她的团队发声为准,并表示快了。冯提莫直播至今已经接近10年,在斗鱼、B站都曾是“一姐”的存在。站长网2023-07-14 20:07:510003大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了!而且无论是GPT-4还是Claude3,面对它都如同被夺了魂,无法给出正确答案。难倒一众大模型的,是逻辑学当中经典的“动物过河”问题,有网友发现,大模型对此类问题表现得很不擅长。甚至有人观察到,几个不同的模型都给出了一致的(错误)答案,让人怀疑他们是不是用了相同的训练数据。站长网2024-06-25 05:03:570001