OpenAI昨日在官网宣布,将在未来两周内对ChatGPT Plus和企业用户推出ChatGPT的语音和图片功能,让用户能和ChatGPT进行语音对话或展示图片做出相关回应。
语音功能方面,ChatGPT 可以用语音来回答问题和命令,与苹果的Siri等个人助理相互较劲。 据了解,ChatGPT 将会有 5 种不同的语音供用户选择,同时支持语音音频生成文本、将播客语音翻译成其他语言等功能。
例如,OpenAI 正在与 Spotify 合作,将播客翻译成其他语言,同时保持播客的声音。 有必要注意一下的是,合成语音有很多有趣的用途,OpenAI可能会成为这一行业的重要组成部分。
OpenAI 于今年 5 月发布 ChatGPT 应用程序,并已经提供了语音转文本功能,而新增语音回复功能可让用户感觉在进行更人性化的对话。 该公司希望这项新功能能鼓励用户随时随地使用其移动App,并与谷歌的Assistant、苹果的Siri或亚马逊的Alexa等个人助理产品形成直接的竞争。
图片功能方面,用户能向 ChatGPT 传送图片并询问有关问题,其能够准确的通过图片回答或给出建议。 据悉,语音功能将在 iOS 和安卓平台推出,图片功能则将登陆所有平台。
例如,用户都能够上传一张粉色太阳镜的图片,并要求聊天机器人推荐与之搭配的服装,或者提交一张数学问题的图片,并请求帮助解决。
该公司还表示,付费用户和企业用户将可使用图片功能,图片搜索有点像谷歌的 Lens,只需拍下感兴趣的照片,ChatGPT 就会找出问题所在,并做出相应的回应。
分析指出,自从 2022 年初推出 ChatGPT 以来,OpenAI 一直在努力为其机器人增添更多功能和能力,同时避免造成新的问题出现。 而通过这次升级,该公司试图在这条界线上寻找平衡点,通过有意识的限制其新模型能做什么来实现这一目标。
但是这种方法并非长久之计,随着慢慢的变多的人使用语音控制和图片搜索,以及 ChatGPT 慢慢的变成为一个真正的多模态、实用的虚拟助手,要保持安全和合理的边界会慢慢的变困难。
另一方面,这次升级无疑让 ChatGPT 距离超级助理更进了一步,同时与下游软件的竞争也更加激烈。
分析指出,微软和 OpenAI 均能向需要构建 AI 能力的企业客户提供技术服务,两者之间有着直接的业务冲突。 从长久来看,如果 OpenAI 加速布局面向个人及企业的软件,ChatGPT 未来有很大的可能性将重塑客户端应用生态,或许两者的关系破裂是早晚的事情。
OpenAI昨日在官网宣布,将在未来两周内对ChatGPT Plus和企业用户推出ChatGPT的语音和图片功能,让用户能和ChatGPT进行语音对线