ChatGPT继任者GPT-4本周推出具有令人兴奋的新功能

导读 微软在3月16日宣布了一场神秘的AI活动,看起来我们本周将以GPT-4的形式对ChatGPT进行重大升级,它具有多模式支持。这对大多数人来说可能毫

微软在3月16日宣布了一场神秘的AI活动,看起来我们本周将以GPT-4的形式对ChatGPT进行重大升级,它具有多模式支持。这对大多数人来说可能毫无意义,因为三个月前ChatGPT席卷了科技界,而我们仍在学习它能做什么以及它如何颠覆我们所知的科技。

多模式ChatGPT聊天机器人是AI的一次大规模升级,它已经为您的查询提供了类似人类的响应。目前,ChatGPT仅支持文本输入或一种交互方式。GPT-4将支持文本、音频、视频和图像作为输入。这就是使它成为多模态的原因,这一特性可以显着提高人工智能的能力。

微软美国上周没有透露任何关于ChatGPT的GPT-4升级的细节,只是调侃了3月16日的活动。但微软德国更进一步,本质上是软启动GPT-4。该公司上周在德国举办了一场活动,根据Heise.de详细介绍了GPT-4升级。

目前尚不清楚GPT-4是否会是ChatGPT的内置升级,或者它是否会专用于已经支持ChatGPT的微软Bing搜索引擎。然而,微软德国确认GPT-4将于本周推出,并且它将是多模式的。

微软首席技术官安德烈亚斯布劳恩说:“我们将在下周推出GPT-4,在那里我们将拥有提供完全不同可能性的多模态模型——例如视频。”

布劳恩称底层技术,人工智能理解自然语言,是“游戏规则改变者”。他透露,ChaGPT将适用于所有语言,包括多语言支持。你可能想用德语问它一些事情,然后用意大利语得到答案。

此外,另一位微软德国高管HolgerKenn解释说,如果需要,多模式ChatGPT机器人可以将文本翻译成图像、音乐和视频。

ChatGPTGPT-4的多模式技术将如何帮助用户?

虽然关于GPT-4的许多细节仍不清楚,但用户大概可以使用各种输入类型来获得他们需要的答案。超越文本意味着AI可以查看YouTube剪辑或收听录音,然后提供问题的答案。

微软提供了一个示例,说明ChatGPT的多模式如何帮助企业。人工智能可以在听完录音后自动用文本总结支持电话。这将为荷兰的一家大型Microsoft客户每天节省500个工作小时,该客户每天接到30,000个需要汇总的电话。为这样的任务设置ChatGPT只需要几个小时。

不过,微软警告说,ChatGPT并不总是可靠的,即使在GPT-4升级之后也是如此。微软正在研究置信度指标以提高聊天机器人的可靠性。

然而,目前还不清楚用户将如何测试GPT-4,以及OpenAI是否会在本周晚些时候在ChatGPT中提供它。微软在3月初悄悄推出了Kosmos-1,这是一种支持图像输入的多模式AI。周四,微软将举办以AI为中心的活动。

话又说回来,微软可能是OpenAI技术的大投资者之一,但OpenAI将继续升级其聊天机器人。这意味着让大众可以使用GPT-4。