GPT-4来了!看它如何“吊打”ChatGPT 3.5?

作者:王鹤迦 责任编辑:王鹤迦 2023.03.15 17:08 来源:通信世界全媒体

通信世界网消息(CWW)ChatGPT热度还未散去,OpenAI再次发布深度学习领域的新里程碑。3月15日凌晨,OpenAI宣布正式发布GPT-4版本,它拥有图像识别功能、高级推理技能,以及处理25000个单词的能力,且回复准确性较原GPT-3.5版本有所提高,可以用所有流行的编程语言写代码。

据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本。

除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。

image.png

GPT-4相较于ChatGPT推理能力显著提升

ChatGPT最明显的问题之一就是“一本正经地胡说八道”。ChatGPT回答语言连贯自然、逻辑通顺,但它的回答内容不基于事实,而是基于语言模型。这使得人们需要对其输出的内容进行准确性的辨别。

在此次发布上,OpenAI称,他们花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训对GPT-4进行迭代调整,从而在真实性、可控性等方面取得了有史以来最好的结果。

据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离话题,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。同时,OpenAI为其加入了更多“人类反馈”,包括ChatGPT用户提交的反馈,以改进GPT-4的行为。OpenAI还与包括AI安全和安全性在内的50多个领域的专家合作,进行早期反馈。

OpenAI称,在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,相应的“不允许内容请求的倾向”降低了82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

image.png

此外,基础设施方面,OpenAI表示GPT-4是在Microsoft Azure AI超级计算机上训练的。Azure的AI优化基础设施也使OpenAI能够将GPT-4交付给全球用户。

小编也对现行版GPT-4测试了一下,回复速度快,内容也更全面,但对于信息输出仍有一定局限性。

image.png

image.png

目前GPT-4仍然有许多已知的局限性,OpenAI正在努力解决这些问题,随着多模态带来的模型全面化,人工智能将向着拥有人类解释能力这一目标更进一步。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容