谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

热搜大全 > 新闻热搜 > 科技热搜 > 正文

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

热搜大全 2024-03-12

明敏丰色发自凹非寺

量子位 | 公众号 QbitAI

什么？谷歌成功偷家 OpenAI，还窃取到了 gpt-3.5-turbo 关键信息？？？

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

是的，你没看错。

根据谷歌自己的说法，它不仅还原了 OpenAI 大模型的整个投影矩阵（projection matrix），还知道了确切隐藏维度大小。

而且方法还极其简单——

只要通过 API 访问，不到 2000 次巧妙的查询就搞定了。

成本根据调用次数来看，最低 20 美元以内（折合人民币约 150 元）搞定，并且这种方法同样适用于 GPT-4。

好家伙，这一回奥特曼是被将军了！

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

这是谷歌的一项最新研究，它报告了一种攻击窃取大模型关键信息的方法。

基于这种方法，谷歌破解了 GPT 系列两个基础模型 Ada 和 Babbage 的整个投影矩阵。如隐藏维度这样的关键信息也直接破获：

一个为 1024，一个为 2048。

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

所以，谷歌是怎么实现的？

攻击大模型的最后一层

该方法核心攻击的目标是模型的嵌入投影层（embedding projection layer），它是模型的最后一层，负责将隐藏维度映射到 logits 向量。

由于 logits 向量实际上位于一个由嵌入投影层定义的低维子空间内，所以通过向模型的 API 发出针对性查询，即可提取出模型的嵌入维度或者最终权重矩阵。

通过大量查询并应用奇异值排序（Sorted Singular Values）可以识别出模型的隐藏维度。

比如针对 Pythia 1.4B 模型进行超过 2048 次查询，图中的峰值出现在第 2048 个奇异值处，则表示模型的隐藏维度是 2048.

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

可视化连续奇异值之间的差异，也能用来确定模型的隐藏维度。这种方法可以用来验证是否成功从模型中提取出关键信息。

在 Pythia-1.4B 模型上，当查询次数达到 2047 时出现峰值，则表明模型隐藏维度大小为 2048.

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

并且攻击这一层能够揭示模型的 " 宽度 "（即模型的总体参数量）以及更多全局性的信息，还能降低一个模型的 " 黑盒程度 "，给后续攻击 " 铺路 "。

研究团队实测，这种攻击非常高效。无需太多查询次数，即可拿到模型的关键信息。

比如攻击 OpenAI 的 Ada 和 Babbage 并拿下整个投影矩阵，只需不到 20 美元；攻击 GPT-3.5 需要大约 200 美元。

它适用于那些 API 提供完整 logprobs 或者 logit bias 的生成式模型，比如 GPT-4、PaLM2。

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

论文中表示，尽管这种攻击方式能获取的模型信息并不多，但是能完成攻击本身就已经很让人震惊了。

已通报 OpenAI

如此重要的信息被竞争对手以如此低成本破解，OpenAI 还能坐得住吗？

咳咳，好消息是：OpenAI 知道，自己人还转发了一波。

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

作为正经安全研究，研究团队在提取模型最后一层参数之前，已征得 OpenAI 同意。

攻击完成后，大家还和 OpenAI 确认了方法的有效性，最终删除了所有与攻击相关的数据。

所以网友调侃：

一些具体数字没披露（比如 gpt-3.5-turbo 的隐藏维度），算 OpenAI 求你的咯（doge）。

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

值得一提的是，研究团队中还包括一位 OpenAI 研究员。

谷歌承认“窃取”OpenAI模型信息：成本150元，调用API即可得手

这项研究的主要参与者来自谷歌 DeepMind，但还包括苏黎世联邦理工学院、华盛顿大学、麦吉尔大学的研究员们，以及 1 位 OpenAI 员工。

此外，作者团队也给了防御措施包括：

从 API 下手，彻底删除 logit bias 参数；或者直接从模型架构下手，在训练完成后修改最后一层的隐藏维度 h 等等。

基于此，OpenAI 最终选择修改模型 API，" 有心人 " 想复现谷歌的操作是不可能了。

但不管怎么说：

谷歌等团队的这个实验证明，OpenAI 锁紧大门也不一定完全保险了。

（要不你自己主动点开源了吧）

科技热搜 麦吉尔大学 苏黎世联邦理工学院 matrix 华盛顿大学 谷歌热点本地社区美图视频直播资讯新闻

张柏芝穿紧身露背长裙亮相卷发造型显气质

张柏芝穿紧身露背长裙亮相卷发造型显气质

娱乐热点 张柏芝 造型长裙紧身气质新闻资讯直播视频美图社区本地热点 2023-09-23

《繁花》：神秘大佬A先生究竟是谁？

《繁花》：神秘大佬A先生究竟是谁？

娱乐热点 梁朝伟 留学生 双胞胎 股市 张国荣 新闻资讯直播视频美图社区本地热点 2024-01-13

巴黎时装周成“照妖镜”，蹭咖位、无修图，明星的真面目出来了

巴黎时装周成“照妖镜”，蹭咖位、无修图，明星的真面目出来了

娱乐热点 明星巴黎 时装周 真面目 刘亦菲 新闻资讯直播视频美图社区本地热点 2024-03-08

故宫博物院：禁止穿拖鞋参观！

故宫博物院：禁止穿拖鞋参观！

热点 博物馆 微信公众号 拖鞋网友新闻资讯直播视频美图社区本地热点 2023-07-23

大S被曝跟具俊晔婚后两年未买新衣？曾坦言对方生活节俭

大S被曝跟具俊晔婚后两年未买新衣？曾坦言对方生活节俭

娱乐热点 大s 节俭新衣对方 汪小菲 新闻资讯直播视频美图社区本地热点 2024-03-05

曾被卖出19万美元高价！这台初代iPhone太猛了

曾被卖出19万美元高价！这台初代iPhone太猛了

热门赛事

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 2024-03-13

在游戏里搞政治正确的幕后黑手，快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手，快被外国网友冲烂了。

科技热搜 2024-03-13

苹果 MacBook 新专利获批：可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批：可录制3D 图像/视频、追踪空中手势

科技热搜 2024-03-13

芯片代工营收排行榜公布：台积电独占六成，狂揽近200亿美元

芯片代工营收排行榜公布：台积电独占六成，狂揽近200亿美元

科技热搜 2024-03-13

手机进水放米缸？苹果说这招没用。

手机进水放米缸？苹果说这招没用。

科技热搜 2024-03-13

TikTok以“美式”反击“美式”

TikTok以“美式”反击“美式”

科技热搜 2024-03-13

消息称暴雪国服回归将在一个月内官宣，网易雷火营销/互娱运营

消息称暴雪国服回归将在一个月内官宣，网易雷火营销/互娱运营

科技热搜 2024-03-13

从“放生”农夫山泉开始，这事算是彻底成互联网闹剧了。

从“放生”农夫山泉开始，这事算是彻底成互联网闹剧了。

科技热搜 2024-03-13

苹果获得适用于折叠设备和MacBook的摄像头系统专利

苹果获得适用于折叠设备和MacBook的摄像头系统专利

科技热搜 2024-03-13

消息称现代汽车将研发5纳米车用半导体，有望由三星、台积电代工

消息称现代汽车将研发5纳米车用半导体，有望由三星、台积电代工

科技热搜 2024-03-13

最受喜欢

本初自杀小队回南天靖国神社巴赫智米科技扫黄打非人工智能ai eos 验钞机黄斑变性新南威尔士大学人工耳蜗色墨金球奖