谷歌发布最新人(rén)工智能(néng)模型Gemini
谷歌公司六日宣布推出(chū)一种名为(wéi / wèi)Gemini的(de)新人(rén)工智能(néng)模型,声称该模型在(zài)一系列智力测试中(zhōng)的(de)表现优于(yú)OpenAI的(de)GPT-四模型和(hé)“专家(jiā)级”人(rén)类。
Gemini已针对(duì)不(bù)同的(de)应用创建了三个(gè)版本,分别是( shì)Nano、Pro和(hé)Ultra。谷歌拒绝回答有(yǒu)关Pro和(hé)Ultra的(de)规模、它们(men)包含的(de)参数数量、训练数据的(de)规模或来(lái)源等问题。
其最小版本Nano旨在(zài)在(zài)智能(néng)手机上(shàng)运行(xíng),实际上(shàng)有(yǒu)两种模型:一种用于(yú)速度较慢的(de)手机,拥有(yǒu)一八亿个(gè)参数;另一种用于(yú)功能(néng)更强大(dà)的(de)手机,拥有(yǒu)三二.五亿个(gè)参数。据传GPT-四包含多达一.七万亿个(gè)参数,而(ér)Meta的(de)LLAMA-二则包含七00亿个(gè)参数 。
谷歌声称,Gemini的(de)中(zhōng)档Pro版本击败了其他(tā)一些模型,例如OpenAI的(de)GPT三.五,但更强大(dà)的(de)Ultra超过(guò)了所有(yǒu)现有(yǒu)AI模型的(de)能(néng)力。它在(zài)行(xíng)业标准MMLU基准上(shàng)的(de)得分为(wéi / wèi)九0%,而(ér)“专家(jiā)级”的(de)人(rén)类预计能(néng)达到()八九.八%。
这(zhè)是( shì)人(rén)工智能(néng)首次在(zài)测试中(zhōng)击败人(rén)类,也(yě)是( shì)现有(yǒu)模型中(zhōng)得分最高的(de)。该测试涉及一系列棘手的(de)问题,主题包括逻辑谬误、平常场景中(zhōng)的(de)道(dào)德问题、医疗问题、经济和(hé)地(dì)理。
在(zài)同一测试中(zhōng),GPT-四的(de)得分为(wéi / wèi)八七%,LLAMA-二的(de)得分为(wéi / wèi)六八%,Anthropic Claude 二的(de)得分为(wéi / wèi)七八.五%。Gemini在(zài)其他(tā)九项常见基准测试中(zhōng)的(de)八项中(zhōng)击败了所有(yǒu)这(zhè)些模型。
去(qù)年(nián),谷歌“深度思维”发布了一款名为(wéi / wèi)AlphaCode的(de)人(rén)工智能(néng)代码生(nián)成器,它可(kě)击败五0%的(de)人(rén)类开发人(rén)员,而(ér)新发布的(de)Gemini声称可(kě)击败八五%的(de)人(rén)类编程师。
谷歌“深度思维”的(de)艾力·柯林斯表示,Gemini“几乎在(zài)每个(gè)领域都是( shì)最先进的(de)”。
Gemini目前没有(yǒu)可(kě)供测试的(de)版本,但谷歌却演示了它两种很“实际”的(de)功能(néng)——解决家(jiā)庭作业问题、处理实时(shí)视频能(néng)力。这(zhè)不(bù)禁让“特定人(rén)群”惊呼:我(wǒ)现在(zài)就(jiù)需要(yào)它!而(ér)对(duì)业内人(rén)士来(lái)说(shuō),这(zhè)个(gè)AI更值得注意之(zhī)处,是( shì)它不(bù)仅能(néng)力最强,还最通用,这(zhè)意味着它可(kě)以(yǐ)适应各种任务。与当前许多专注于(yú)文本的(de)模型不(bù)同,Gemini接受过(guò)文本、图像和(hé)声音方面的(de)综合训练,能(néng)接受所有(yǒu)这(zhè)些格式的(de)输入然后(hòu)再输出(chū),甚至,它还比所有(yǒu)“前辈”模型们(men)更擅长搞开发。
来(lái)源:科技日报
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。