首页 公众号手机端

谷歌承认Gemini演示视频是( shì)剪辑版

sss001 2个月前 (11-16) 阅读数 20 #未命名
[CommentView]

科技巨头谷歌的(de)新大(dà)模型Gemini一夜爆红,受到()市场看好(hao),但有(yǒu)分析指出(chū),谷歌在(zài)Gemini的(de)宣传资料中(zhōng)存在(zài)夸大(dà)宣传的(de)嫌疑。

当地(dì)时(shí)间一二月六日,谷歌宣布推出(chū)“最大(dà)、最强、最通用”的(de)新大(dà)型语言模型Gemini。Gemini将是( shì)首个(gè)直接在(zài)手机上(shàng)运行(xíng)的(de)大(dà)模型,被应用于(yú)谷歌Pixel 八 Pro智能(néng)手机和(hé)聊天(tiān)机器人(rén)Bard。Gemini被视为(wéi / wèi)对(duì)于(yú)AI(人(rén)工智能(néng))新锐巨头OpenAI旗下(xià)最新大(dà)模型GPT-四的(de)直接回应,也(yě)象征着一度因聊天(tiān)机器人(rén)ChatGPT而(ér)处于(yú)被动状态的(de)谷歌终于(yú)正式冲回赛道(dào)。

据谷歌介绍,Gemini在(zài)MMLU(大(dà)规模多任务语言理解)的(de)得分率达到()九0.0%,是( shì)第一个(gè)在(zài)MMLU测试中(zhōng)超过(guò)人(rén)类专家(jiā)的(de)模型。Gemini将包括一套三种不(bù)同规模的(de)模型,其中(zhōng),Gemini Ultra被定位为(wéi / wèi)GPT-四的(de)竞争对(duì)手,Gemini Pro的(de)性能(néng)优于(yú)GPT-三.五,Gemini Nano则用于(yú)特定任务和(hé)移动设备。

凭借强大(dà)的(de)性能(néng),Gemini一夜爆红,引来(lái)了华尔街的(de)关注。一二月七日,谷歌母公司Alphabet(Nasdaq:GOOG)的(de)股价涨五.三一%,收于(yú)一三六.九三美元,迎来(lái)自(zì)今年(nián)八月二九日以(yǐ)来(lái)表现最好(hao)的(de)一天(tiān),总市值达到()一.七二万亿美元。

美国(guó)银行(xíng)的(de)分析师在(zài)六日指出(chū),由于(yú)人(rén)们(men)对(duì)于(yú)谷歌的(de)AI能(néng)力感到()担忧,Alphabet今年(nián)承受了一定的(de)压力,而(ér)一款“具有(yǒu)良好(hao)品牌形象的(de)、竞争力较强的(de)模型”可(kě)能(néng)会(huì)吸引更多消费者使用谷歌搜索,并对(duì)云服务的(de)销售产生(nián)积极影响:“数据显示谷歌拥有(yǒu)一流的(de)、不(bù)可(kě)复制的(de)AI能(néng)力,这(zhè)可(kě)能(néng)对(duì)公司在(zài)二0二四年(nián)上(shàng)半年(nián)的(de)股票走势产生(nián)积极影响。”

摩根大(dà)通的(de)分析师在(zài)六日的(de)一份报告中(zhōng)写道(dào),尽管市场在(zài)当天(tiān)没有(yǒu)对(duì)Gemini给出(chū)明显的(de)反应,能(néng)够看到()谷歌在(zài)“这(zhè)一主要(yào)技术转变”中(zhōng)的(de)进展还是( shì)一0分“鼓舞人(rén)心”。然而(ér),摩根大(dà)通也(yě)指出(chū),大(dà)模型在(zài)“搜索领域的(de)货币化路径存在(zài)不(bù)确定性”,可(kě)能(néng)会(huì)在(zài)未来(lái)带来(lái)一些阻力。

在(zài)七日的(de)报告中(zhōng),摩根大(dà)通的(de)分析师写道(dào):“虽然现在(zài)还处于(yú)其发展早期,但Gemini的(de)推出(chū)象征着在(zài)生(nián)成式AI获得广泛商业化并得到()广泛传播的(de)第二年(nián)中(zhōng),谷歌做出(chū)了重大(dà)创新。”

目前看来(lái),谷歌如何在(zài)整体业务、尤其是( shì)最重要(yào)的(de)搜索业务中(zhōng)将Gemini进行(xíng)商业化是( shì)备受华尔街关注的(de)一点。目前,谷歌计划在(zài)本月晚些时(shí)间通过(guò)谷歌云将Gemini授权给客户,并将在(zài)未来(lái)几个(gè)月与谷歌服务中(zhōng)的(de)其他(tā)产品集成,但还没有(yǒu)公布后(hòu)续的(de)商业化策略。

富国(guó)银行(xíng)(Wells Fargo)的(de)分析师表示,Gemini的(de)推出(chū)应该足以(yǐ)平息关于(yú)“谷歌在(zài)AI领域究竟应该何去(qù)何从”的(de)争论,不(bù)过(guò),关键问题在(zài)于(yú)谷歌如何利用Gemini获得营利:“简而(ér)言之(zhī),我(wǒ)认为(wéi / wèi)谷歌证明了他(tā)们(men)仍然具有(yǒu)一些竞争力。”

而(ér)KeyBanc的(de)分析师也(yě)表示,Gemini是( shì)谷歌今年(nián)众多AI公告的(de)“顶峰”,但要(yào)让AI对(duì)谷歌的(de)业绩增长和(hé)盈利能(néng)力产生(nián)积极影响需要(yào)时(shí)间:“Gemini仍在(zài)努力进入搜索等核心产品,因此我(wǒ)们(men)建议耐心观察其影响。”

不(bù)同于(yú)华尔街的(de)整体看好(hao),在(zài)科技领域中(zhōng)有(yǒu)声音指出(chū),Gemini或许存在(zài)“夸大(dà)宣传”的(de)质疑。

在(zài)Gemini于(yú)六日推出(chū)后(hòu)不(bù)久,就(jiù)有(yǒu)网友指出(chū)了宣传资料中(zhōng)的(de)一些不(bù)妥之(zhī)处。例如,当谷歌称Gemini的(de)MMLU的(de)得分率高于(yú)GPT-四时(shí),显示GPT-四的(de)得分率是( shì)八六.四%,但根据谷歌发布的(de)六0页技术报告,Gemini Ultra的(de)MMLU测试结果下(xià)有(yǒu)“CoT@三二”的(de)小字注释,表示其使用了思维链提示技巧,尝试了三二次并从中(zhōng)选择最好(hao)结果。而(ér)作为(wéi / wèi)对(duì)比的(de)GPT-四却是( shì)无提示词技巧给五个(gè)示例,在(zài)这(zhè)个(gè)标准下(xià),Gemini Ultra的(de)测试结果其实是( shì)八三.七%,低于(yú)GPT-四的(de)八六.四%。

如果是( shì)同样使用CoT@三二的(de)方法,虽然成绩仍低于(yú)Gemini Ultra,GPT-四的(de)得分率达到()了八七.二九%。

如果像谷歌DeepMind首席科学家(jiā)杰夫·迪恩(Jeff Dean)回应的(de)那(nà)样,这(zhè)种写法只是( shì)为(wéi / wèi)了显示两种不(bù)同方法间的(de)比较,对(duì)于(yú)Gemini测试视频的(de)质疑则显得更加难以(yǐ)反驳。

在(zài)推出(chū)Gemini后(hòu),谷歌发布了一个(gè)时(shí)长六分钟的(de)演示视频,展现了测试员和(hé)Gemini的(de)一些有(yǒu)趣互动,其中(zhōng)包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地(dì)图设计智力问答、和(hé)Gemini玩杯子(zǐ)游戏和(hé)推理小游戏等等。在(zài)整个(gè)过(guò)程中(zhōng),Gemini的(de)反应速度都非常快,还会(huì)生(nián)成音频和(hé)图片来(lái)辅助回答,并用上(shàng)一些口语化乃至幽默化的(de)表达,可(kě)谓是( shì)让人(rén)大(dà)开眼界。

然而(ér),很快就(jiù)有(yǒu)网友从视频开篇的(de)文字免责声明中(zhōng)发现了问题,认为(wéi / wèi)其可(kě)能(néng)暗示了视频中(zhōng)展示的(de)是( shì)精心挑选的(de)好(hao)结果,不(bù)是( shì)实时(shí)录制,而(ér)经过(guò)剪辑的(de)。随后(hòu),谷歌在(zài)一篇博客文章中(zhōng)解释了多模态交互过(guò)程,基本上(shàng)也(yě)间接承认了只有(yǒu)使用静态图片和(hé)多段提示词拼凑,才能(néng)达成演示视频中(zhōng)的(de)效果。

例如,在(zài)文章中(zhōng),谷歌承认,不(bù)同于(yú)视频中(zhōng)对(duì)于(yú)猜拳手势的(de)快速反应,只有(yǒu)在(zài)向Gemini同时(shí)展示这(zhè)三个(gè)手势并提示其这(zhè)是( shì)游戏时(shí),Gemini才会(huì)得出(chū)猜拳游戏的(de)结论。

有(yǒu)分析指出(chū),这(zhè)和(hé)谷歌在(zài)视频中(zhōng)所暗示的(de)可(kě)以(yǐ)说(shuō)是( shì)完全不(bù)同,因为(wéi / wèi)从视频看来(lái),Gemini可(kě)以(yǐ)实时(shí)观察周围的(de)世界并做出(chū)反应,用户可(kě)以(yǐ)与Gemini进行(xíng)流畅的(de)语音对(duì)话。沃顿商学院教授伊桑·莫利克(Ethan Mollick)也(yě)在(zài)X平台上(shàng)进行(xíng)了演示,如果是( shì)使用静态图片和(hé)多段提示词,完全可(kě)以(yǐ)通过(guò)ChatGPT Plus来(lái)复制Gemini的(de)表现。

伊桑·莫利克给ChatGPT Plus同时(shí)展示谷歌演示视频中(zhōng)的(de)多张截图,ChatGPT Plus也(yě)能(néng)给出(chū)类似的(de)答案。

在(zài)质疑发酵后(hòu),谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)对(duì)外媒回应称,视频中(zhōng)的(de)画鸭子(zǐ)演示(画一个(gè)鸭子(zǐ)的(de)简笔画,Gemini可(kě)以(yǐ)对(duì)每一步骤做出(chū)正确的(de)解释)确实是( shì)研究级别的(de)功能(néng),至少目前还没有(yǒu)出(chū)现在(zài)谷歌的(de)实际产品中(zhōng)。

谷歌DeepMind研究和(hé)深度学习负责人(rén)副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)也(yě)在(zài)X(原推特)平台上(shàng)发布长文,解释了团队是( shì)如何制作该视频的(de):“视频中(zhōng)的(de)所有(yǒu)用户提示和(hé)输出(chū)都是( shì)真实的(de),只是( shì)为(wéi / wèi)了简洁而(ér)进行(xíng)了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的(de)多模态用户体验是( shì)什么样子(zǐ)。我(wǒ)们(men)这(zhè)样做是( shì)为(wéi / wèi)了激励开发人(rén)员。”

然而(ér),维尼亚尔斯的(de)回应引发了更多的(de)争议。有(yǒu)网友评论道(dào):“如果你(nǐ)想激励开发者,为(wéi / wèi)什么不(bù)发布真实的(de)内容呢?被缩短的(de)用户提示就(jiù)不(bù)算‘真实’。这(zhè)样做既不(bù)真诚,又具有(yǒu)误导性。”

有(yǒu)谷歌员工对(duì)外媒透露,他(tā)们(men)认为(wéi / wèi)这(zhè)段视频描绘了一幅“不(bù)切实际的(de)画面”。有(yǒu)员工表示,对(duì)这(zhè)种夸张的(de)演示并不(bù)感到()惊讶,因为(wéi / wèi)员工们(men)已经习惯了公司会(huì)对(duì)产品在(zài)某种程度上(shàng)进行(xíng)夸大(dà)营销:“我(wǒ)认为(wéi / wèi)大(dà)多数使用过(guò)大(dà)语言模型技术的(de)员工都知道(dào),要(yào)对(duì)(演示中(zhōng)的(de))这(zhè)一切持保留态度。”

有(yǒu)外媒认为(wéi / wèi),谷歌“庞大(dà)的(de)官僚体系和(hé)各级产品经理使其直到()现在(zài)都无法像OpenAI那(nà)样敏捷地(dì)推出(chū)产品”。对(duì)于(yú)正在(zài)应对(duì)AI转型影响的(de)社会(huì)而(ér)言,这(zhè)并不(bù)是( shì)坏事(shì)。但对(duì)于(yú)谷歌最近这(zhè)种迅速推进的(de)表现,应该保持一定的(de)保留态度。

来(lái)源:澎湃新闻

顶一下(xià) ▲()   踩一下(xià) ▼()
[/CommentView]
版权说明

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门