近日,有消息传出某科技巨头的大模型训练遭到实习生破坏,注入的代码导致训练成果不稳定,可能需要重启整个训练过程。据称,此次事件涉及的代码影响了8000多张计算卡,损失可能高达千万美元级别。
据内部消息透露,涉事企业为字节跳动,事件发生在今年6月。起因是一名博士实习生因对团队资源分配不满,利用HF漏洞在共享模型中写入破坏代码。
该实习生姓田,其行为被字节跳动内部调查确认后已被辞退,并通报给相关联盟及其实习所在学校。然而,该实习生在离职后仍在微信群中辟谣,试图将责任转嫁给他人。
据悉,受影响的并非字节跳动的豆包大模型,而是其商业化技术团队的模型训练任务,对公司整体造成的损失并未如传闻般巨大。