周伯文：AI安全提升远落后于性能需探索人工智能45度平衡率

2024-11-14 23:36:19 发布

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议-全体会议在上海世博中心举办。会上，上海人工智能实验室主任、首席科学家、清华大学惠妍讲席教授周伯文发表主题演讲，分享了关于人工智能技术发展和安全治理的见解。他提出一个技术主张――探索人工智能的45度平衡率。

当前，以大模型为代表的生成式人工智能快速发展，但是人力不断提升，模型应用存在一系列潜在风险顾虑。去年5月份，数百名AI科学家共同签署文件表达了对AI风险的担忧，呼吁、防御人工智能风险应该与流行病、核战争与其他大规模风险一样成为全球优先议题。

周伯文指出，其根本原因是目前AI发展是失衡的。目前AI技术能力提升，Transformer带来的模型基础下，大数据、大参数量的定理呈指数级增长；而安全标识、安全赋能与评估测量等，呈现离散化、碎片化且后置的特性。

最近的一些技术兼顾了性能和安全性，人类反馈强化学习、超级对齐等，这些方法帮助将人类偏好传递给大模型，涌现出了ChatGPT、GPT4，以及上海书生大模型等。虽然瞄准安全提升，往往还是性能优先。

所以，总体上AI模型安全的提升还远远落后于性能，这种失衡的背后是两者投入上的巨大差异，安全度投入远落后于AI投入，“目前世界上只有1%对齐或者安全优先考量。”

“AI要确保安全可控，统筹发展以安全。所以毫无疑问，要避免现在这类AI发展，真正需要追求的是AGI（通用人工智能）。AGI需要兼顾安全与性能，所以需要找到AI安全优先，但又能保证AI能力长期发展的技术体系，把这样一种技术思想体系叫做‘AI45度平衡率’。”

“AI45度平衡率”是指长期来看，要大体上沿着45度安全与性能平衡发展。平衡是指短期内可以有波动，但不能长期低于45度，也不能长期高于45度，这样会阻碍技术和产业应有发展。45度平衡的技术体系要求强技术驱动、全流程优化、多主体参与，以及敏捷治理。

周伯文提到，实现“AI45度平衡率”，也许有很多技术路径。而上海探索一条以因果为核心的路径，并将其命名为“可信AGI‘因果之梯’”。其分为泛对齐、可干预、能反思三个递进阶段。

泛对齐主要包含当前最前沿人类偏好对齐技术，但需要注意的是。这些安全对齐技术目前仅依赖于其相关性，而不是真正的因果关系，可能导致错误的推理和潜在的危险；

可干预包含AI系统进行动态干预，探究其因果安全技术，包括人在回路，机器可解释性和刚刚最近提出的对抗演练。可以通过提高可解释性和泛化性来提升安全性，同时也提升AI的能力；

能反思要求AI系统不仅追求高效的执行任务，还能够审视自身行为的外在影响和潜在风险，从而确保性能同时保证安全和道德边界不被突破，这阶段技术包括基于价值的训练、因果可解释性、推理等。

周伯文指出，目前从全球来看，AI安全和性能技术发展主要停留在第一阶段，部分在尝试第二阶段，真正实现AI安全与性能平衡必须完善第二阶段，并勇于攀登第三阶段。沿着“可信AGI‘因果之梯’”乘势而上，希望能够实现AI卓越与安全完美融合，并且深度理解AI内在机理和内在过程，从而有效开发革命性技术。

“我们坚信AI安全性也是全球性公共福祉，需要国际社会共同努力和合作。我们要与大家携手推进‘AI45度发展’，共享AI安全技术，加强全球AI安全人才的交流与合作，平衡AI安全与能力的投入，共同构建开放、安全的通用人工智能创新生态和人才发展环境。”他最后说道。C114通信网

声明：本页面内容源自互联网，不能用于任何商业服务,也不可作为任何信息依据,更无法构成专业建议，我们无法确保该内容的时效性、准确性和完整性，仅供读者参考。严禁使用和转载与分享该内容。本站对该信息不承担任何责任，内容和图片有误或涉及其他问题请及时与本站联系处理。

周伯文：AI安全提升远落后于性能需探索人工智能45度平衡率相关资讯资讯

周伯文：AI安全提升远落后于性能需探索
7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议-全体会议在上海世博中心举办。会上

共商共治，共创智能未来 —— 普华永道出
近日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海拉开帷幕。大会以“以共商促共享，

新质经济智慧财务丨2024世界人工智能
7月4日-6日，2024世界人工智能大会（以下简称:2024WAIC）在上海举行。本届大会以“以

高通孟樸出席2024世界人工智能大会产业
7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议正式开幕。高通公司中国区董事长孟樸

这届世界人工智能大会AI卷疯了：30余款
大模型展区汹涌的人潮，时代财经记者摄在过去半年，科技圈的多数震荡都与大模型紧密绑定在一起。20

世界人工智能大会在沪召开，大模型成“顶流
继OpenAI发布的聊天机器人ChatGPT火爆全球掀起人工智能热潮，AI技术愈发受到关注，而今

360智脑入选世界人工智能大会《2023
7月7日，2023世界人工智能大会期间，中国信息通信研究院发布了《2023年通用人工智能创新应用

2023世界人工智能大会 | 陈茂波出席
7月6日，2023世界人工智能大会在上海举办。蓝鲸财经在展会现场关注到，香港、新加坡、澳大利亚等

2023世界人工智能大会 | 脑机接口企
2023年7月6日，世界人工智能大会脑机智能与数字生命论坛在上海举办。此次论坛由中科院上海分院指

2023世界人工智能大会在沪开幕

资讯News

资讯网红热榜

娱乐Yule

《海蒂和爷爷》《帝国陷落》布鲁诺·甘茨豆瓣评分最高的5部电影

邓伦再回应不进组拍戏：我在认真看剧本了

王浩歌：眼里有星河，笑容更灿烂

胡兵国际时装周经典穿搭传递中国时尚名片

电视剧《芳心荡漾》温暖收官秦岚走心演绎成熟女性闪光魅力

第十二届北京国际电影节天坛奖获奖名单

潮流Trend

穿搭时尚球鞋

游戏Youxi

单机网游手游游戏攻略

汽车Che

评测汽车豪车

体育Tiyu

体育篮球足球

美容Meili

减肥化妆美容

数码Digital

软件数码电脑手机

健身Fitness

舞蹈武术运动