您现在的位置: 首页 热点关注 > > 正文
GPT-4 在人工智能军备竞赛中加大了赌注
发布时间:2023-03-20 05:04:37 来源:科技前沿在线--小土豆

OpenAI最新的LLM功能强大得多,有时仍然是一门松散的大炮。

期待已久的OpenAI大型语言模型(LLM)系列更新终于来了。早期的演示表明 GPT-4 比其前身和竞争对手强大得多。但更重要的是,这种第四代生成式预训练转换器现在也是多模态的——能够处理视觉输入和文本。然而,该公司对该模型技术细节的保密引起了争议。

OpenAI周二在一篇博客文章中宣布了这一版本,并附有一份98页的技术报告,尽管该文件省略了关键细节,例如模型的大小,架构或训练方式。GPT-4已经集成到该公司广受欢迎的聊天机器人服务ChatGPT中。但是,此类 GPT-4 访问权限目前仅适用于付费订阅者。


(资料图片)

开发人员可以注册访问API,该API将允许他们将模型集成到他们的软件中,该公司透露,包括Duolingo,Stripe和Khan Academy在内的合作伙伴已经在他们的产品中使用该技术。微软还证实,自上个月推出以来,其新的Bing聊天机器人一直在GPT-4上运行。

“它非常接近某种弱的理解形式,尽管它不是理解我们所知道的方式。 ——Nello Cristianini,巴斯大学(英国)

OpenAI在其公告中表示,在进行一般对话时,新模型与其前身GPT-3.5之间的差异是微妙的。但在更复杂的任务中,差距变得更加明显,GPT-4 在广泛的机器学习基准测试中优于最先进的模型,包括那些旨在评估推理能力的基准。它在为人类设计的考试中也表现良好,在统一律师考试、大学和研究生院能力倾向测试(包括 SAT、GRE 和 LSAT)以及一系列专业考试和高中大学预科大学考试中得分接近前列。

与前几代LLM相比,GPT-4在推理能力方面的显着飞跃是最令人印象深刻的事情,NVIDIA AI的研究科学家Jim Fan说。“有史以来第一次,人工智能的基准将与人类的基准相同,”他补充道。

但是,GPT-4 与以前的迭代以及谷歌和 Meta 等竞争对手发布的 LLM 显着不同的另一种方式是它能够处理图像和文本。Fan说,这些多模态功能已经在学术界研究了很多年,但通过商业API访问它们是重要的一步,他补充说。

这些并不是人们能够使用的第一个多模态AI模型。OpenAI的DALL-E模型和开源的稳定扩散模型都能够将文本转换为图像。但 GPT-4 的工作方式正好相反,接受图像作为输入,然后回答有关它们的问题或将它们用作产生新想法的起点。

在演示中,OpenAI展示了该模型如何解释为什么基于图像的笑话很有趣,从冰箱内容的照片中生成食谱创意,甚至仅基于基本的草图编写工作网站。开发人员或公众尚未使用这些功能,但该公司已经与应用程序Be My Eyes合作,使用GPT-4来描述视障人士的照片中发生的事情。

除了为LLM开辟一系列新的实际用例之外,这种多模态可能是迈向更强大,更普遍的人工智能的重要一步,英国巴斯大学人工智能教授,《捷径:为什么智能机器不像我们一样思考》的作者Nello Cristianini说。

首先,这些LLM的培训方式可以从使用多种模式中受益匪浅,他说。使它们成为可能的主要创新之一是自我监督学习的想法,它消除了人类煞费苦心地标记训练数据的需要,而是允许人工智能通过摄取大量文本来自学。

当涉及到语言模型时,这是通过让人工智能猜测句子中的下一个单词来完成的。这不需要任何人工输入,因为模型可以从数据本身确定它是对还是错。Cristianini说,在网络规模的数据集上一遍又一遍地这样做,人工智能可以开发一个语言的统计模型,这种模型非常复杂,可以开发出新兴的能力。

“从科学家的角度来看,这是非常令人失望的。站在巨人的肩膀上是有整件事的,但如果我们知道我们站在什么样的肩膀上,那么就很难建立在它之上。 ——安东尼·科恩,利兹大学

使这些模型多模态可以加速学习过程,因为它允许一个数据源充当另一个数据源的监督信号。这不仅允许模型从更多形式的数据中学习,而且还可以帮助“基础”模型从其他媒体(如图像)的文本中学习的抽象知识。虽然GPT-4只是朝着这个方向迈出的一小步,但克里斯蒂亚尼尼说,随着更多模式的加入,人工智能可能会开始开发更复杂的现实模型。“这非常接近某种弱的理解形式,尽管它不是理解我们所知道的方式,”他说。

在解决迄今为止已被证明难以解决的一系列科学问题时,多模式也可能是一个关键因素,Air Street Capital的创始人,有影响力的人工智能状况报告的合著者Nathan Benaich说。“科学中的许多重大挑战 - 无论是物理学还是生物学 - 都需要融合尽可能多的数据模式,”他说。

但是,使用这些方法扩展到更多模式可能比看起来更难,英国利兹大学自动推理教授安东尼科恩说。LLM需要大量的示例来训练,虽然互联网提供了几乎无限的文本和图像供应,但其他类型的数据并非如此。“这一直是对这种技术的一大批评之一,它只需要相当疯狂的训练数据,”他说。

同样重要的是,不要夸大当前模型的能力,Cohn说。OpenAI在其公告中承认,GPT-4 存在与其前辈类似的问题,特别是它的“幻觉”倾向,这是指它自信地将实际上是错误的事情陈述为事实。虽然该公司已经阻止它提供有害的建议或危险信息,但它肯定会发生。也就是说,OpenAI声称GPT-4误导和歪曲的频率比GPT-82.3低5%。

鉴于此,科恩说,他很高兴看到OpenAI将模型构建为需要仔细监督的工具。然而,更成问题的是该公司决定不发布有关该模型的关键技术细节。这不仅使其他人更难调试和测试系统,而且还意味着AI社区的其他成员无法在他们的工作基础上进行构建。“从科学家的角度来看,这是非常令人失望的,”他说。“站在巨人的肩膀上是有整件事的,但如果我们知道我们站在什么样的肩膀上,那么就很难建立在它之上。

但最终,该公司的沉默是可以理解的,克里斯蒂亚尼尼说。ChatGPT的发布引发了大型科技公司之间的LLM军备竞赛,放弃他们如何构建GPT-4可能对他们的竞争对手有利。与此同时,即使他们公布了细节,也很少有研究小组拥有建立这种规模或复杂性模型的专业知识或资源。“即使论文是公开的,我们也无法复制,”他说。“但竞争对手可以,所以这就是问题所在。

标签:

少数的生物具备再生能力 盘点6种身体部位再生的动物

如果我们能使缺失的肢体或受损的器官再生那绝对是一件再好不过的事情了。想象一下,由于你可以在你的一...

190岁塞舌尔巨龟Jonathan成为头条新闻 大多数龟类物种的硬壳带来较慢的衰老

190岁的塞舌尔巨龟Jonathan最近成为了头条新闻,它成为了世界上最古老的陆地动物。虽然有传闻称某些种类...

重庆:到2025年25个重点领域企业能效全部达到基准水平

3月18日,重庆日报记者从市发展改革委获悉,日前,市发展改革委、市经济信息委、市生态环境局、市市场监...

重磅!2021“发现重庆之美”获奖名单揭晓

3月19日,2021发现重庆之美颁奖典礼在线上举行,最美城市管理人、最美坡坎崖、最美街头绿地、垃圾分类时...

去年重庆回收废弃农膜1.4万吨 农膜回收率达89.31%

3月16日,市五届人大常委会第六十九次主任会议听取了市政府关于《重庆市人大常委会对市人民政府农业面源...

申报分两批!今年国家级博士后科研工作站新设站工作启动

3月19日,重庆日报记者从市人力社保局获悉,为推动产学研深度融合,加强博士后工作平台建设,我市将开展...

浙江鄞州:“水、电、气、数”通办专窗实现城乡公共服务均等化

近日,在宁波市鄞州区邱隘镇公共事务服务中心,66岁的邱隘镇沈家新村居民邱秀月在一个窗口相继办理了不...

打开“浙里办” 浙江1000家农贸市场农产品可线上比价

今天哪个菜场的五花肉最便宜?食品安全抽检结果怎么样?这些问题,浙江居民只需打开浙里办APP上的浙里市场...

浙江鉴湖国家湿地公园规划发布 打造乡村数字旅游

19日上午,鉴湖国家湿地公园规划发布暨东鉴湖农旅观光体验启动仪式在绍兴市越城区陶堰街道举行。当天,...

总投资超10亿元!6个石化装备运维项目在岱山签约

日前,总投资超10亿元的6个石化装备运维项目在岱山经济开发区集中签约。此次签约的项目占地106亩,规划...

如何避免成为“买而不做”的“装备党”祝 杰

自恋是人的天性,人们总是希望自己是更好的,那么自己拥有的事物,也就相应地被自我赋予了更高的价值,...

山西临汾:率先在全省建起农村集体经济开发区

3月17日,临汾市农村集体经济发展(集团)有限公司在临汾经济开发区揭牌。以此为标志,临汾率先在全省建起...

一线工作近22年的缉毒警:我知道坏的是毒品不是人性

  “影子”般的缉毒警:一线工作22年,我知道坏的是毒品不是人性  如果我不继续干,别人也要干,缉...

广东肇庆“毒驾连撞5车致1死”肇事司机被批捕

  1月5日14时30分许,广东肇庆市端州区一男子赵某毒驾连撞5车,致一人死亡。  1月10日,澎湃新闻(ww...

江西最大文物倒卖案宣判:倒卖国家二级文物 9人获刑

  中新网南昌1月10日电 (冷峥嵘 张一怡)江西省共青城市人民法院10日发布消息称,近日,该院依法审结...

青海保障门源地震后生活必需品应急物资

  中新网西宁1月10日电 (记者 孙睿)记者10日从青海省商务厅获悉,青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关 入境需网上预约

  中新社防城港1月10日电 (翟李强)自2022年1月10日零时起,广西东兴口岸和边民互市贸易区恢复人员、...

呼和浩特:寒假期间有条件的学校要开展校内托管服务

  中新网呼和浩特1月10日电 (记者 张林虎)10日,记者从呼和浩特市教育局获悉,在暑假校内托管试点的...

“中国最后一个原始部落”翁丁老寨火灾原因公布

  “中国最后一个原始部落”翁丁老寨火灾原因公布:小孩玩火引起  中新网昆明1月10日电 (罗婕)近日...

北京市十五届人大五次会议胜利闭幕

  北京市十五届人大五次会议胜利闭幕   蔡奇陈吉宁李伟魏小东张延昆出席   张延昆齐静当选市人...

天津市委市政府致全市父老乡亲的慰问信:我们一定能够打赢

  中新网天津1月10日电 (记者 张道正)中共天津市委、天津市人民政府10日发布了“致全市父老乡亲的慰...

天津米面油存量由20天提高至30天 超市菜市场进货量翻倍

  天津米面油存量由20天提高至30天 蔬菜库存量、超市菜市场进货量翻倍  记者10日从天津市商务局获...

兰州名师话“美育”:“尚乐立人”分层培优 以“美”润教

  中新网兰州1月10日电 (记者 刘玉桃 高莹)“实际上音乐课作为一门非高考科目,一直以来没有受到足...

子夜直击,天津寒天战“疫”

  新华全媒+|子夜直击,天津寒天战“疫”  新华社天津1月10日电 题:子夜直击,天津寒天战“疫”...

重庆姐弟被生父扔下坠亡案上诉期结束 一审法院暂未收到两被告人上诉状

  重庆姐弟被生父扔下坠亡案上诉期结束,一审法院暂未收到两被告人上诉状  澎湃新闻记者 谢寅宗 ...

天津:划定封控区 全市开展全员核酸检测

江歌母亲江秋莲:尊重法院判决,法律认定在我意料之中

中国边疆“北方第一所”:9名民警守护“生命禁区”

辟谣!网传“封控区管控区相继解封”通知并非西安

河南安阳9日12时至24时新增11例本土确诊病例

老人5折环卫工8折生活困难免费 这家面馆背后有个暖心事

铁路公安以110幅优秀书画作品庆祝人民警察节

本周中东部冷空气频繁 东北等地有降雪

河南新增本土确诊病例60例

“打拐”民警眼里的百态人生:见证一份份不愿放弃的爱

迎腊八北京晴天上线 阵风6至7级体感冻人

多省份倡议春节“非必要不离开”,这地补贴1000元

伪造国家机关证件典型案例发布 有力打击制假贩假行为

15年照顾170多个新生儿 金牌月嫂“漂”到海外去看娃

江歌母亲江秋莲诉刘鑫案一审将于今日宣判

河南省安阳市两地划为高风险地区 一地划为中风险地区

员工迟到一次罚一千引争议 单位惩戒员工法律边界何在?

以体育人 秀出“青年范儿”

保安、厨师曾被竞业限制 企业滥用竞业限制让员工很苦恼

反诈老陈破圈:人民群众在哪 就把反诈宣传开展到哪

一所中职学校的育人实践

各地严惩恶意欠薪 保障农民工及时拿到工资

中学生成剧本杀行业潜在消费人群 多方助推行业“净化”

“这就是我最好的选择”

对餐饮浪费说“不”(百姓关注)

校园“直通车” 服务“零距离”

琉璃河遗址 两段铭文共证北京三千年建城史

千元修复个人征信报告?银行:“征信修复”都是骗局

琉璃河遗址 两段铭文共证北京三千年建城史

北京公交将开展无人驾驶道路测试

河南郑州调整五地为中风险区域 公路入郑需核酸检测阴性证明

“共享法庭”让金融消费者畅享“智慧司法”便利

《传奇2》网游著作权纠纷案峰回路转 最高法五份裁决四份改判一份发回重审

三代警察:从未放弃的28年

“胡叔叔”的寻亲工作室

天津津南本轮本土疫情第3—20例阳性感染者活动轨迹公布

“团圆”行动刑侦专家吕游 每一个案例都有单独的技术方案

河南“战疫”直面五重考验

开考古书店日均两三个顾客 流量时代她决心仍是只卖书

冬奥开幕在即 “双减”催热冰雪课堂

“不得以任何借口拒收患者”彰显生命至上

天津多站进京车票暂停发售

冷空气来袭广州气温骤降 广东多地发布寒冷预警

“电话发我”——“霸气回应”疫情求助背后的城市温度

天津津南区再增20例阳性感染者,详情公布

电影《农民院士》昆明首映 为观众呈现“把论文写在大地上”

南宁铁路警方春运期间将免费提供被拐儿童父母DNA检测服务

天津津南调整区域风险等级:1个高风险6个中风险!

天津全面加强离津管理 实施离津审批报备制度

口述|“郑州人张嘴做核酸采样的样子,熟练得让人心疼”

x 广告
x 广告

Copyright ©  2015-2022 南方自然网版权所有  备案号:粤ICP备18023326号-21   联系邮箱:855 729 8@qq.com