OpenAI CEO宣布转向，“大模型时代”即将结束？_天天要闻

首页 > 滚动 > > 内容页

OpenAI CEO宣布转向，“大模型时代”即将结束？_天天要闻

发表于: 2023-04-20 14:46:30 来源：虎嗅网

本文来自微信公众号：电厂（ID：wonder-capsule），作者：张勇毅，编辑：高宇雷，题图来自：视觉中国

4月19日，虽然在这个月几乎每周都至少有一家科技大公司入局训练大模型，但 OpenAI 却突然改变了方向声称，大模型时代已经要结束了。

(相关资料图)

上周末在麻省理工学院，OpenAI 的 CEO 在演讲中警告称：我们已经处在大模型时代的尾声，并表示如今的 AIGC 发展中，将数据模型进一步做大，塞进更多数据的方式，已经是目前人工智能发展中最后一项重大进展，并且还声称目前还不清楚未来的发展方向何去何从。

消息传出，立即引发很多外界的质疑，OpenAI 本身已经是大模型技术领域最前沿的研究机构，为何会说出这种能让研究方向180度掉头的论调？

在如今的生成式 AI 背后的技术，称其为大模型甚至已经不够准确，这些模型所需的参数数量已经是天文数字，称其为“巨型模型”或许更加准确。

OpenAI 最早的语言模式是 GPT-2，于 2019 年公布，发布时就有 15 亿个参数，此后随着 OpenAI 研究人员发现扩大模型参数数量能有效提升模型完善程度，真正引爆 AI 行业浪潮的 GPT-3 发布时，参数数量已经达到了 1750 亿个。

截至目前，OpenAI 并没有公布最新迭代版本 GPT-4 所用的参数数量。但外界普遍估算其包括的参数量已经达到了 GPT-3 的二十倍——3.5万亿个参数。

但人类互联网历史上被保留下来的各种高质量语料，已经在 GPT-3 以及后续发布的 GPT-4 的学习中被消耗殆尽。大模型参数数量仍然可以继续膨胀下去，但对应数量的高质量数据却越来越稀缺，因此增长参数数量带来的边际效益愈发降低。这如同 AI 行业的“摩尔定律”一般。

除了大模型本身的技术发展方向，Altman 提到的另一个问题：购买大量 GPU 以及建设数据中心的物理限制以及高昂的成本，或许才是更多 AI 大模型开发公司现在所面临的切肤之痛：运营巨型数据服务中心成本高昂已经是行业公认，但如果是用于 AI 大模型训练则更是贵上加贵，无论是对电力还是水力的消耗都极其巨大。

即使是 GPT-4 或 New Bing，也多次因为算力不足不得不公开宣布短时间内暂停访问。算力已经成为限制 AIGC 进一步拓展使用场景的关键桎梏。Altman 的说法的根据，或许也有很大一部分来源于 OpenAI 所面临的现实原因。

在今年三月，英伟达专用于大模型参数计算、采用专用 Transformer Engine 架构的英伟达 H100NVL 系列发布之后，从中嗅到商机的黄牛也开始借机炒价，售价已经飙升至四万美元。但这些在当下大模型技术巨大的风口面前似乎都不值一提，目前 H100NVL 系列仍然处于一货难求的状态。马斯克也在 Twitter 上惊呼“似乎每个人和他们的狗都在抢购 GPU”。

图片来自：半导体行业观察

不过吐槽归吐槽，即便是马斯克也不得不为了自己新成立的 AI 公司而买买买：据《商业内幕》报道，马斯克已经购入了一万组英伟达最新发布的 GPU 并运至数据中心。并在 Twitter 上声称将开发 TruthGPT 来挑战 ChatGPT。

尽管 Altman 同时还在演讲中表示“OpenAI 目前没有在开发 GPT-5”。但在 AI 大模型发展狂奔的路上，没有人愿意真的成为“落后六个月”的那个。

根据分析机构 SemiAnalysis 估算，如果按照目前 ChatGPT 的运算处理效率，想要承担 Google 搜索目前在全球全部访问流量，至少需要 410 万张英伟达 A100 GPU。即使只是训练出目前 ChatGPT 能力的大模型，也需要超过 10000 个 GPU 来完成，后续运营维护还需要更多。

这也是如今几乎你能见到的每个大模型产品都需要“内测邀请码”的原因：不仅训练这些大模型烧钱，运营起来更加烧钱。

这种对于计算硬件极度迫切的需求，推动着英伟达成为这个市场最大的垄断者。如今英伟达已经占据了计算卡 88% 的市场份额，其他选项 —— 例如 Google 开发的 Tensor TPU，甚至不提供对外售卖的选项。

但正如马斯克“嘴上说暂停训练半年，实际光速成立 AI 公司”一样，在很大程度上，这也只是 Altman 的一家之言。如今很多后来者的技术发展程度都还远未到能说出“AI 发展不能靠无脑计算”的程度。但 Altman 所说的确实已经成为如今头部大模型开发公司正在/即将要面对的棘手问题。

“一味不计成本地堆砌硬件不是未来”已经成为越来越多业内人士的共识。

现在的 AI 发展阶段，甚至很多地方都有着互联网发展早期时代的即视感：AI 行业的发展也已经出现了“摩尔定律”，训练大模型所需的大量 GPU 组成的硬件训练集群，与世界上第一台计算机并没有本质上的区别。

人工智能也需要一次“半导体革命”，探索未来也需要更加高效的方式：或许对大模型参数数量的精简，以及利用多个较小的模型实现处理能力的提升，会是大模型时代结束之后，AIGC 行业的下一个发展方向。

在 ChatGPT 发布之初，针对参数量过高以及关于道德伦理方面的问题，OpenAI 曾公开过一项新的研究：使用一种通过人类反馈来强化学习（RLHF）的技术，对模型数据进行微调。

经过超过一年的测试，OpenAI 由此生成了 InstructGPT，其模型参数量仅有 13 亿，只不到原版 ChatGPT 的百分之一，但这个迭代款不仅表现出更准确的回答能力，甚至在回答中关于事实核查以及负面内容的表现，要好于 ChatGPT 本身。

InstructGPT 演示样例

此外，同样近期大火的 AutoGPT：使用 GPT-4 作为底层技术，加入了从网页中抽取关键信息的能力，根据返回的结果进一步执行命令，帮你自动完成任务处理。突破了只能处理文本相关内容任务的限制。

由此诞生的结果，就是用户在 AutoGPT 的实际使用中都能明显感受到，要智能得多的结果，甚至完完全全改变了原本 ChatGPT 常规的使用方式，比如 AutoGPT 能自动完成一整个网页的代码实现，甚至还有网友发现 AutoGPT 为了完成最初的任务目标，自行在招聘网站上发布了招聘广告，吸引其他人来辅助完成。

这些在应用层面的创新，除了能为大模型技术探索更多的应用场景，也是在 AI 领域探索现有算力之下发展的可能。基于人类反馈实时修改结果的最直观体验，就是让人工智能变得更加聪慧，同时也是真正意义上能实现“一个人就是一个团队”的技术。

宏观来看，即使当下大模型技术对于 AIGC 的发展至关重要，但长远来讲，AI 绝不会永远依赖大模型的参数提升以及堆砌算力来构建未来，开发更小更精准的模型，以及更加具体的应用场景，或许已经是下一个时代真正的方向。

届时，或许是大模型时代的结束，却是人工智能时代真正的开始。

本文来自微信公众号：电厂（ID：wonder-capsule），作者：张勇毅，编辑：高宇雷

标签：

山东青岛：楼宇经济体劳动争议预防调解联盟成立

2022-02-15查看详情

电力巡线工“偏向虎山行”

2022-02-15查看详情

听！城市的脉动

2022-02-15查看详情

OpenAI CEO宣布转向，“大模型时代”即将结束？_天天要闻

OpenAI CEO宣布转向，“大模型时代”即将结束？_天天要闻

世界速看：子宫颈癌曹泽毅2021观点

开封市顺河回族区开展2023年铸牢中华民族共同体意识暨民族宗教政策法规宣传月集中宣传活动

龙川县气象台解除暴雨橙色预警【II级/严重】 焦点速递

环球今日讯！2023款新捷达SUV和VS7 ABT限量版上海车展首发亮相

江苏通报两起违规焊割火灾事故 涉及常州金坛区南京建邺区

雨花台区：锚定高质量发展，8个公共文化空间入选省级名单

机构：一季度全球PC出货量再次下滑，预计下半年复苏 天天视点

我国将引进卡26，“万能农用直升机”，有效提高多行业空运能力|天天观察

推动经济运行持续整体好转（经济新方位·首季数据观察）|环球热推荐

新车报讯：NIOCertified蔚来官方二手车业务可享众多新车同等购车权益|报资讯

4月19日河南地区二甲醚企业装置汇总_天天资讯

微信朋友圈访客记录怎么看_微信朋友圈访客记录查看方法简述-全球实时

世界速读：广西钦州市委书记林冠猝死 基本情况讲解

匈牙利政府将禁止25种乌克兰农产品进口|世界速递

两部门印发剧本娱乐经营场所消防安全指南 试行|资讯推荐

松滋斯家场镇：没有安全这个“1”，其他一切都是“0”|快资讯

天天新动态：上海：聚焦上海重点产业领域 培育一批科技领军企业

比亚迪汽车全新中型纯电猎装SUV，宋L将于今年第四季度上市|世界快看

公办和民办学校有什么区别吗?_公办和民办学校区别

世界头条：别白跑！郊野公园的露营区暂未开放

药物流产会肚子疼么_药物流产肚子会很疼吗

旺成科技北交所上市首日盘中破发平收 2022营收降12%

每日看点！伽蓝怎么读音 伽蓝怎么读

【全球播资讯】比亚迪汽车工程研究院艾凤杰：关键技术被“卡脖子”是国内汽车智能化转型的巨大问题

环球热推荐：头茬珠丰甜瓜抢先上市

每日热文：伦纳德31+8+7威少28分 KD布克合砍63分太阳逆转快船

英国3月CPI同比上涨10.1%，高于预期

国六b的标准_国六b标准符号-世界新消息

山东出版2022年净利润同比增长9.63% 聚看点

李国勇赴京拜访央企名企 对接深度合作 携手共谋发展_每日快讯

时光荏苒白驹过隙能同时用吗_时光荏苒 白驹过隙的意思

发改委：一季度审核固定资产投资项目42个 总投资2803亿元|当前速读

两款热管理新品发布 美的威灵汽车以核心零部件加速新能源汽车升级

再次面临被弹劾危机 厄瓜多尔总统表示不排除解散议会

武汉农村商业银行登录网站官网_武汉农村商业银行登录|热门看点

焦点信息:袁绍势力远胜于曹操，为何最终失败呢？

战旗汽车为什么便宜？战旗汽车油耗多少

明日新股申购：晶合集成_精彩看点

焦点要闻：胡润发布2023全球独角兽榜 河南省一茶饮企业排名上升258位，挺进Top100

活在自己的喜欢里 活着便有意义

中央气象台：华南今日对流激烈 强冷空气将大举入侵我国

玉米行情整体震荡 后市等待新驱动指引|全球热闻

今日热讯：宝莱特拟10转增5派2元（含税）

暴雨橙色预警信号学校停课吗_暴雨橙色预警信号

成都，我们来了！百家上市公司聚汇蓉城，见证全景成都路演中心盛大开启|世界百事通

4月19日日经225指数开盘下跌0.14%，韩国Kospi指数下跌0.04%-即时

粤铁投基金投资引领财富管理新趋势

环球今日报丨书面通知解除劳动合同必须要告知本人吗？

关于描写秋冬的优美句子（关于描写秋冬的优美句子简短）

全球快讯:百度热搜描写景色的古诗_描写景色的古诗

火灾事故敲警钟 防火安全需注意

美航母又跑了？台名嘴讽：5000美军性命比台湾人怎么想重要-环球时快讯

【地评线】“春风”送岗，兜牢民生底线 今亮点

每日速讯：纳雍县气象台继续发布大风蓝色预警信号【Ⅳ/一般】

车辆年检委托书范本_车辆年检委托书

天天快看：为什么大部分基金经理踏空了「ChatGPT」

四大品牌集结 奇瑞携14款新能源重磅新车强势登场

天天通讯！再见火箭！再见76人！哈登三方交易曝光，重回西部组三巨头争冠

发际线是什么意思_发际线是什么

孕妇降火吃什么水果效果最好_孕妇降火吃什么水果

3月份民航业完成旅客运输量4570万人次 运输生产恢复态势总体平稳

世界球精选！【4.18考试周】托福预测来啦！考前上分定心丸，还不快领！

4月18日基金净值：汇添富稳健添盈一年持有混合最新净值1.0216，涨0.09%

奇幻乙女冒险游戏《花之女王》Switch中文版预计2023年夏季发售！

守护年轻人心理健康的运动处方

精彩看点：“篮球女孩”长大成人，蜕变为“水中飞鱼”

欧普康视：目前专注国内眼视光产业，没有进军俄罗斯的计划-焦点快播

【世界时快讯】上海车展：伟巴斯特展示低碳智享未来驾乘的创新解决方案

环球简讯:[路演]大禹节水：聚焦滴灌精量化控制产品的研发 形成多项核心技术能力

英语阅读技巧_关于英语阅读技巧的简介

明天上午查寝时辅导员老师不但会进寝室，而且会打开你的柜子、行李箱

荷兰国际集团：欧洲有更多理由相信“更高更长时间” 精彩看点

《2023全球独角兽榜》发布：字节跳动居首 广州过去一年独角兽数量增长全国最快

中国联通：一季度净利22.66亿元 同比增11.6%

零基础中级会计实务怎么学

玉珠铉_关于玉珠铉的介绍

甘肃环县：古城诵经典 文化润心田

热头条丨三明市教育局教学视导组到沙县区开展教育教学工作检查

龙川县气象台解除暴雨橙色预警【II级/严重】焦点速递

江苏通报两起违规焊割火灾事故涉及常州金坛区南京建邺区

机构：一季度全球PC出货量再次下滑，预计下半年复苏天天视点

世界速读：广西钦州市委书记林冠猝死基本情况讲解

两部门印发剧本娱乐经营场所消防安全指南试行|资讯推荐

天天新动态：上海：聚焦上海重点产业领域培育一批科技领军企业

每日看点！伽蓝怎么读音伽蓝怎么读

李国勇赴京拜访央企名企对接深度合作携手共谋发展_每日快讯

时光荏苒白驹过隙能同时用吗_时光荏苒白驹过隙的意思

发改委：一季度审核固定资产投资项目42个总投资2803亿元|当前速读

两款热管理新品发布美的威灵汽车以核心零部件加速新能源汽车升级

再次面临被弹劾危机厄瓜多尔总统表示不排除解散议会

焦点要闻：胡润发布2023全球独角兽榜河南省一茶饮企业排名上升258位，挺进Top100

活在自己的喜欢里活着便有意义

中央气象台：华南今日对流激烈强冷空气将大举入侵我国

玉米行情整体震荡后市等待新驱动指引|全球热闻

火灾事故敲警钟防火安全需注意

【地评线】“春风”送岗，兜牢民生底线今亮点

四大品牌集结奇瑞携14款新能源重磅新车强势登场

3月份民航业完成旅客运输量4570万人次运输生产恢复态势总体平稳

环球简讯:[路演]大禹节水：聚焦滴灌精量化控制产品的研发形成多项核心技术能力

《2023全球独角兽榜》发布：字节跳动居首广州过去一年独角兽数量增长全国最快

中国联通：一季度净利22.66亿元同比增11.6%

甘肃环县：古城诵经典文化润心田

一季度财政收入回稳向上财政支出保持较高强度

港股异动 | 药明康德(02359)跌近7%领跌CRO概念机构指创新药板块整体估值合理偏低有望积蓄上涨动力全球热消息

17款帕拉梅拉4.8S仅售16.8万，拉风的造型，深受好评环球动态

超混电驱奇骏亮相上海车展日产汽车向智能网联和电驱化迸发-全球简讯

环球今亮点！家装家居板块震荡走强金牌厨柜午后封板、松发股份涨停

当前视点！鼎泰高科(301377)公司信息更新报告：行业底部业绩承压四重逻辑共振助推增长

早搏是什么原因引起的严重吗_早搏是什么原因引起的全球信息

浠婂勾绂忓缓鎷涘嫙300鍚嶉珮鏍℃瘯涓氱敓鏈嶅姟绀惧尯观点

恒指夜期收盘(4.18)︱恒生指数夜期(4月)收报20675点低水107点|当前热讯

飞机高铁网遍布长途客运大巴何去何从？全球新视野

全球快消息！青岛崂山大田有机春茶开采四成春茶已被预订

国内首部XR-LED主题影片《大湾风暴》全球启动，洲明提供虚拟拍摄技术信息

蓝牙适配器哪个牌子好知乎蓝牙适配器哪个牌子好世界速看

环球实时：大湾之港向海图强

保护传统村落挖掘文化价值（金台视线·关注传统村落保护③）

烧烤火爆淄博发布提醒告诫书：明码标价珍惜机遇

环球最资讯丨举办史上最大规模糖酒会成都消费中心城市地位凸显

贵州茅台(600519.SH)一季度净利润约205.2亿元同比增约19%

官方：12306分开候补成功几率更大，可用多个账户下单世界快看点

两个正官能制住伤官嘛伤官和正官存在的意义

福建大幅增加中小微企业发展专项转移支付天天速讯

港股医药“风”起恒生医疗ETF（513060）规模超百亿

如何开我妈是我妈证明怎么证明我妈环球报道

这个五一假期，广铁集团预测：将有1600万人次乘坐火车出行环球热文

中船互联与嘉为科技签署战略合作，共同打造“工业互联”与“IT运维管理”融合解决方案每日速递

全球观察：250ms极速唤醒体验！长城汽车Coffee OS 2智能语音公开课