字节跳动大(dà)模型训练被实习生(nián)攻击,涉事(shì)者已被辞退
一0月一八日,多个(gè)微信群流传一则消息:“某头部大(dà)厂的(de)大(dà)模型训练被实习生(nián)入侵,注入了破坏代码,导致其训练成果不(bù)可(kě)靠,可(kě)能(néng)需要(yào)重新训练。据称遭到()入侵的(de)代码注入了八000多张卡,带来(lái)的(de)损失可(kě)能(néng)超过(guò)千万美元。”
界面新闻从知情人(rén)士处获悉,该头部大(dà)厂为(wéi / wèi)字节跳动。此事(shì)发生(nián)在(zài)今年(nián)六月,起因是( shì)某高校的(de)博士在(zài)字节跳动商业化技术团队实习,因对(duì)团队资源分配不(bù)满,使用攻击代码破坏团队的(de)模型训练任务。
界面新闻向字节跳动求方面证此事(shì),截至目前,官方未进行(xíng)回应。
传闻显示,该田姓实习生(nián)利用了HF(huggingface)的(de)漏洞,在(zài)公司的(de)共享模型里写入破坏代码,导致模型的(de)训练效果忽高忽低,无法产生(nián)预期的(de)训练效果,而(ér)且AML团队无法核查原因。但传闻曝出(chū)之(zhī)后(hòu),该实习生(nián)还在(zài)某微信群里辟谣称,自(zì)己发完论文后(hòu)就(jiù)从字节跳动离职,这(zhè)个(gè)当口有(yǒu)另一个(gè)人(rén)钻漏洞改模型代码,把锅扣到()自(zì)己头上(shàng)。
界面新闻从知情人(rén)士处了解到(),字节跳动内部已经调查明确此事(shì)为(wéi / wèi)田姓实习生(nián)所为(wéi / wèi)。目前,该实习生(nián)已被辞退,字节跳动同时(shí)把此事(shì)同步给大(dà)模型行(xíng)业联盟和(hé)该实习生(nián)所在(zài)的(de)给学校。但这(zhè)名实习生(nián)被辞退后(hòu)到()处“辟谣”甩锅,称是( shì)其他(tā)人(rén)所为(wéi / wèi)。
但该实习生(nián)攻击的(de)并不(bù)是( shì)豆包大(dà)模型,而(ér)是( shì)商业化技术团队的(de)模型训练任务,影响了该技术团队的(de)一些业务进展,但整体对(duì)公司造成的(de)损失并没有(yǒu)传闻中(zhōng)的(de)超过(guò)千万美元那(nà)么大(dà)。
一位技术安全专家(jiā)告诉界面新闻,HF漏洞产生(nián)肯定是( shì)单一性集中(zhōng)训练,此事(shì)暴露了字节跳动技术训练存在(zài)安全管理问题。公司既没做权限隔离,也(yě)没有(yǒu)做好(hao)共用代码的(de)审计。正常情况下(xià),每次大(dà)的(de)代码变动必须做审计,无论谁做操作都有(yǒu)痕迹记录,一个(gè)人(rén)想动代码是( shì)不(bù)可(kě)能(néng)的(de)。
上(shàng)述技术安全专家(jiā)表示,目前行(xíng)业通用的(de)做法是( shì)做三级隔离导向性部署,每一级只有(yǒu)镜像,每次先扫描。调用按次算、必须密钥。每一级完成后(hòu),才能(néng)进入下(xià)一级,而(ér)上(shàng)一级自(zì)动删除,进行(xíng)分级训练。
来(lái)源:界面新闻
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。