首页 公众号手机端

AI圈开年(nián)首炸:一三九位中(zhōng)国(guó)清北名校天(tiān)才 创立一家(jiā)震撼硅谷的(de)企业

sss001 6小时前 阅读数 3 #丑闻热瓜

本站一月一二日消息,据媒体报道(dào),DeepSeek作为(wéi / wèi)开年(nián)AI领域的(de)重大(dà)突破,以(yǐ)其“国(guó)产之(zhī)光”的(de)新形象震撼了海内外科技界。这(zhè)家(jiā)AI创业企业以(yǐ)其独特的(de)团队构成和(hé)卓越的(de)技术成就(jiù),成为(wéi / wèi)了业界关注的(de)焦点。

从公开资料来(lái)看,DeepSeek的(de)团队规模虽小,但实力不(bù)容小觑。其创始人(rén)梁文锋领导的(de)团队仅有(yǒu)一三九名工程师和(hé)研究人(rén)员,相比之(zhī)下(xià),OpenAI拥有(yǒu)一二00名研究人(rén)员,Anthropic也(yě)有(yǒu)五00多名。

然而(ér),DeepSeek凭借一系列吸睛的(de)标签,如“未寻求外部融资”、“创始人(rén)囤卡富翁”、“团队成员均为(wéi / wèi)清北等名校毕业生(nián)”等,成功在(zài)AI创业圈中(zhōng)崭露头角。

二0二四年(nián)一二月,DeepSeek发布了最新的(de)V三开源模型,该模型在(zài)评测中(zhōng)表现出(chū)色,不(bù)仅超越了阿里自(zì)研的(de)Qwen二.五-七二B和(hé)Meta自(zì)研的(de)Llama 三.一-四0五B等顶级开源模型,甚至能(néng)与GPT-四o、Claude 三.五-Sonnet等顶级闭源模型相媲美。

值得注意的(de)是( shì),DeepSeek V三大(dà)模型发布后(hòu)便完全开源,且其训练成本远低于(yú)同类模型。据SemiAnalysis数据显示,OpenAI GPT-四的(de)训练成本高达六三00万美元,而(ér)DeepSeek-V三的(de)成本仅为(wéi / wèi)其一0分之(zhī)一不(bù)到()。

此外,DeepSeek V三模型的(de)训练是( shì)在(zài)二000块英伟达H八00 GPU上(shàng)完成的(de),这(zhè)一数量远低于(yú)硅谷大(dà)厂普遍使用的(de)几一0万块更高性能(néng)的(de)GPU。这(zhè)一成就(jiù)打破了算力芯片对(duì)国(guó)产大(dà)模型的(de)限制瓶颈,为(wéi / wèi)创业团队提供了新的(de)解法:即便在(zài)算力有(yǒu)限的(de)情况下(xià),使用高质量数据和(hé)更好(hao)的(de)算法,同样能(néng)训练出(chū)高性能(néng)大(dà)模型。

OpenAI创始团队成员Andrej Karpathy发帖赞叹:DeepSeek-V三性能(néng)高过(guò)Llama三最强模型,且耗费资源仅一0分之(zhī)一,“未来(lái)或许不(bù)需要(yào)超大(dà)规模的(de)GPU集群了”

Meta科学家(jiā)田渊栋惊叹道(dào):“FP八预训练、MoE、预算非常有(yǒu)限的(de)强大(dà)性能(néng)、从CoT中(zhōng)提取以(yǐ)进行(xíng)引导……哇!这(zhè)是( shì)伟大(dà)的(de)工作!”

DeepSeek的(de)创始人(rén)梁文锋对(duì)硅谷的(de)惊叹并不(bù)感到()意外。他(tā)认为(wéi / wèi),这(zhè)是( shì)因为(wéi / wèi)DeepSeek作为(wéi / wèi)一个(gè)中(zhōng)国(guó)公司,正在(zài)以(yǐ)创新贡献者的(de)身份加入到()全球AI技术的(de)竞争中(zhōng)。他(tā)指出(chū),中(zhōng)国(guó)需要(yào)逐步成为(wéi / wèi)技术的(de)贡献者,而(ér)不(bù)是( shì)一直依赖西方的(de)创新成果。

梁文锋还强调了中(zhōng)国(guó)AI发展需要(yào)建立自(zì)己的(de)技术生(nián)态,就(jiù)像西方主导的(de)技术社区一代代创造出(chū)了摩尔定律和(hé)Scaling Law一样。他(tā)认为(wéi / wèi),很多国(guó)产芯片发展不(bù)起来(lái),正是( shì)因为(wéi / wèi)缺乏配套的(de)技术社区和(hé)前沿技术的(de)参与。

公开资料显示,DeepSeek的(de)母公司幻方量化是( shì)一家(jiā)量化基金起家(jiā)的(de)企业,与DeepSeek的(de)用人(rén)风格相似,均注重本土人(rén)才。DeepSeek在(zài)AI产品正式亮相前,曾长时(shí)间内部孵化该产品,并招聘文科人(rén)才提供相关知识来(lái)源。这(zhè)一独特的(de)历程使得DeepSeek在(zài)AI领域独树一帜,成为(wéi / wèi)中(zhōng)国(guó)AI技术创新的(de)佼佼者。

版权说明

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门