[返回电脑前线首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
美媒:才6个月 ChatGPT就已经变得有些过时了
送交者: 我在枫林中哭泣[♀☆★★★女中豪杰★★★☆♀] 于 2023-05-23 19:54 已读 14657 次  

我在枫林中哭泣的个人频道

美国《大西洋月刊》5月19日文章,原题:ChatGPT已经过时了人工智能正在经历一场无声革命,这项技术不仅超越书面语言,融合多种媒体,更在朝着更崇高的目标努力,即更全面透彻地理解世界。ChatGPT才6个月大,就已经变得有些过时了。


这款程序及其“近亲”,被称为大型语言模型,通过统计学手段,预测、组成语句并予以表达。研究人员用更多文本训练这些程序,前提是认为在不同配置下对机器进行强制语料投喂可以提升预测能力和程序的智能水平。这种文本最大化的AI开发方法一直是过去几年来的主流。

然而,类似初代ChatGPT的纯语言模型正在退场,取而代之的是可以处理图像、音频甚至感官数据的机器。这种新模式可能反映了人类对智能更人性化的理解,是模拟儿童通过观察世界进行学习的初步尝试。企业也可以借此开发能力更全面的AI,进而将其整合到更多产品中。除了GPT-4和Bard,许多程序也有各自开发的拓展功能。这些程序被称为多模态模型——文本和图像都是其中的模态——许多研究人员希望可以借其将AI提升到新高度。

理论上说,多模态方法可以解决纯语言模型的核心难点——即使能流畅地串联单词,却无法将其同概念、观点、事物或活动联系起来。学习更多类型的数据,能够帮助AI模型对外部环境进行想象和交互,进行接近现实的输出,甚至为了解决问题而捏造真相。如果模型了解世界,自行捏造事物的可能性就会减少。多模态模型的构建并非是新鲜事物,但近几年来,AI研究的几项关键成果使得跨领域方法愈发可行。

这种变化也有其现实原因,因为不论互联网看起来多大,AI可以用于训练的文本数量都是有限的,其程序的规模和灵敏度,以及可应用的计算能力,都要受到现实制约。相比于ChatGPT,多模态AI在理解世界和语言流畅层面的提升仍有待讨论。许多程序都被证实存在一定程度的不足,但研究仍处于早期阶段,未来几年仍将不断提升。

要想真正让AI模拟人类的思维,我们还有很长的路要走。增加投喂的文本数据无法解决AI模型的偏差和虚假问题,拓展投喂数据的类型也不一定会解决此类问题。如果程序吸纳了有偏差的文本和图像,其输出仍然是有害的,而且传播形式会更广。相比只能处理语言的模型,多模态AI对某些特定操作可能更加敏感,例如对图像关键像素的篡改。除了智能层面,多模态AI也是很好的商业命题。

喜欢我在枫林中哭泣朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 我在枫林中哭泣的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回电脑前线首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]