字节跳动实习生投毒自家大模型细节曝光，影响到底有多大？

jun21888 · 发表于 2024-10-19 10:38

独家｜字节跳动实习生投毒自家大模型细节曝光，影响到底有多大？

凤凰网科技

2024年10月19日 07:13:49 来自北京市

933人参与112评论

凤凰网科技讯（作者/董雨晴）10月19日，字节跳动大模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露，字节跳动某技术团队在今年6月遭遇了一起内部技术袭击事件，一名实习生因对团队资源分配不满，使用攻击代码破坏了团队的模型训练任务。

据悉，该事件的主要涉事者为一名田姓实习生所为，他利用了Huggingface（HF）平台的漏洞，在公司的共享模型中写入了破坏代码，导致模型训练效果忽高忽低，无法产生预期的训练成果。

一位前字节技术员工向凤凰网科技表示，“字节AI Lab的实习生权限和正职员工差异不大，也使得此次事件有了发生的机会”，其也对此次事件带来的恶性影响表达了担忧，“这件事之后肯定会极大地收缩实习生的权限”。

在消息曝出后，该名涉事实习生试图在社交平台上辟谣，将责任推给他人，不过很快便遭到了接近字节跳动人士的否认。

据相关知情人士在Gitbub上表述，“你（指田某）在长达2个月的时间里对集群代码进行恶意攻击，对公司近30位各级员工造成巨大伤害，让你的同事近一个季度的工作白费。所有的记录和审查都证明这是不容狡辩的事实！”

该名人士还分享了一则调查人员对田姓实习生 (TianKeyu)的询问录音，录音中的对话还原其攻击的过程：田某最先输入的code本来是被用于影响通讯和随机性的，“最开始的时候它并不是以攻击为目的，它是为了debug，但这确实会涉及到程序的一些运行情况。但是后面它经过一些文件，就是那些upload文件，code也会被update，code就变成了攻击code。它大概的作用就是去修改code，然后就会造成一些后果。”

录音中疑似田某本人的回应承认了其通过update使得code带有了攻击性。其也对问询人员明确表示，“就是因为某些原因导致了我们都非常不满”。

另据传闻称此次损失可能超过千万美元，但内部人士表示实际损失并没有传闻中那么严重。

据了解，该事件发生于今年6月底，目前字节跳动已对田姓实习生采取了辞退处理，并将此事通报给相关行业联盟和该实习生所在的学校。

不过前述相关知情人士表示，除了被字节辞退，田某目前未受到任何处罚。

多方消息显示，田姓实习生为国内某高校在读博士生，于2021年9月起在字节AI Lab实习，其所在的团队刚在今年4月与北大王立威团队提出了VAR研究，在图像生成质量、推理速度、数据效率和可拓展性等方面均超过了DiT。此外，VAR的推理速度比传统自回归模型快了约20倍。

截至发稿，字节跳动方面仍未对此事进行公开回应。

		自动登录	找回密码
密码			注册