IT之家 5 月 23 日消息,据《商业内幕》23 日(今天)下午报道,OpenAI 发布了安全研究员的招聘信息,研究当 AI 能够训练出自己的“更强版本”时可能出现的问题。

职位聚合网站显示,这则招聘信息面向 OpenAI Preparedness 安全团队,本月上线。该岗位年薪高达 29.5 万至 44.5 万美元(IT之家注:现汇率约合 200.8 万至 303 万元人民币),目标是寻找“能够支持递归式自我改进准备工作的强大技术执行者”。

招聘信息写道:“这项工作依赖于对未来可能存在、但当前未必已经存在的问题进行推理。因此,这一岗位尤其需要具备良好品味和策略(tasteful and strategic)的人才。”

当前,OpenAI 正着眼于实现自身研究工作的自动化的目标。去年 10 月,CEO 奥尔特曼曾表示,OpenAI 的目标是在今年 9 月前利用数十万枚芯片运行“自动化 AI 研究实习生”,并在 2028 年 3 月前实现“真正的自动化 AI 研究员”。他补充说,“我们完全有可能无法实现这一目标。但考虑到潜在影响极其巨大,我们认为公开说明这些目标符合公众利益。”

Anthropic 今年 4 月发布研究,尝试利用 AI 模型监督更强大的 AI 模型,并取得了有限但积极的结果。今年 5 月,Anthropic 联合创始人兼政策主管杰克 · 克拉克提出观点:到 2028 年底前,AI 研发完全脱离人类参与的概率“大约为 60%”。

OpenAI 的这则招聘信息提到,研究员预计需要重点研究如何防御“数据投毒”攻击,即攻击者通过训练数据破坏 AI 模型的行为;需要开发用于解释模型推理过程的工具,或通过实验理解模型的安全性与潜在风险;需要“追踪技术岗位自动化进展”,其中包括衡量 AI 编程工具的使用情况。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

Extracted and lightly reformatted for readability. · Source: zh