OpenAI将推出ChatGPT的语音和图片功能会说话且能识图_电竞比赛押注平台app_正规的电竞竞猜软件

产品中心

OpenAI将推出ChatGPT的语音和图片功能会说话且能识图

来源：电竞比赛押注平台app 发布时间：2024-02-16 03:43:41

OpenAI昨日在官网宣布，将在未来两周内对ChatGPT Plus和企业用户推出ChatGPT的语音和图片功能，让用户能和ChatGPT进行语音对话或展示图片做出相关回应。

语音功能方面，ChatGPT 可以用语音来回答问题和命令，与苹果的Siri等个人助理相互较劲。据了解，ChatGPT 将会有 5 种不同的语音供用户选择，同时支持语音音频生成文本、将播客语音翻译成其他语言等功能。

例如，OpenAI 正在与 Spotify 合作，将播客翻译成其他语言，同时保持播客的声音。有必要注意一下的是，合成语音有很多有趣的用途，OpenAI可能会成为这一行业的重要组成部分。

OpenAI 于今年 5 月发布 ChatGPT 应用程序，并已经提供了语音转文本功能，而新增语音回复功能可让用户感觉在进行更人性化的对话。该公司希望这项新功能能鼓励用户随时随地使用其移动App，并与谷歌的Assistant、苹果的Siri或亚马逊的Alexa等个人助理产品形成直接的竞争。

图片功能方面，用户能向 ChatGPT 传送图片并询问有关问题，其能够准确的通过图片回答或给出建议。据悉，语音功能将在 iOS 和安卓平台推出，图片功能则将登陆所有平台。

例如，用户都能够上传一张粉色太阳镜的图片，并要求聊天机器人推荐与之搭配的服装，或者提交一张数学问题的图片，并请求帮助解决。

该公司还表示，付费用户和企业用户将可使用图片功能，图片搜索有点像谷歌的 Lens，只需拍下感兴趣的照片，ChatGPT 就会找出问题所在，并做出相应的回应。

分析指出，自从 2022 年初推出 ChatGPT 以来，OpenAI 一直在努力为其机器人增添更多功能和能力，同时避免造成新的问题出现。而通过这次升级，该公司试图在这条界线上寻找平衡点，通过有意识的限制其新模型能做什么来实现这一目标。

但是这种方法并非长久之计，随着慢慢的变多的人使用语音控制和图片搜索，以及 ChatGPT 慢慢的变成为一个真正的多模态、实用的虚拟助手，要保持安全和合理的边界会慢慢的变困难。

另一方面，这次升级无疑让 ChatGPT 距离超级助理更进了一步，同时与下游软件的竞争也更加激烈。

分析指出，微软和 OpenAI 均能向需要构建 AI 能力的企业客户提供技术服务，两者之间有着直接的业务冲突。从长久来看，如果 OpenAI 加速布局面向个人及企业的软件，ChatGPT 未来有很大的可能性将重塑客户端应用生态，或许两者的关系破裂是早晚的事情。

OpenAI昨日在官网宣布，将在未来两周内对ChatGPT Plus和企业用户推出ChatGPT的语音和图片功能，让用户能和ChatGPT进行语音对线