OpenAI最近宣布推迟发布备受期待的ChatGPT语音助手功能,旨在确保其能够安全高效地处理来自数百万用户的请求。这家人工智能初创公司在今年5月的产品发布会上介绍了GPT-4o的语音选项,GPT-4o是GPT-4模型的升级版,在实时处理文本、音频和图像方面表现更为出色。
最初,OpenAI计划在6月底向一小部分ChatGPT Plus付费用户推出语音功能,但公司认为还需要额外的一个月时间才能“达到我们的标准”。OpenAI在声明中表示,他们正在改进模型检测和拒绝某些内容的能力,同时努力改善用户体验,并为扩展到数百万用户的基础设施做好准备,以保持实时响应能力。
分析人士指出,这一推迟可能对OpenAI来说是一个小小的挫折,因为该公司一直在努力在竞争日益激烈的人工智能领域保持领先地位。
此外,OpenAI表示计划在秋季向所有付费用户推出语音功能,并且还在努力发布视频和屏幕共享功能。这些功能已经在5月份的活动中进行了展示。
不过,OpenAI也表示,当下个月部分付费用户能够使用语音功能时,其功能可能会比发布会上展示的更有限。例如,聊天机器人将暂时无法使用计算机视觉功能,该功能允许其通过智能手机摄像头对用户的舞蹈动作提供语音反馈。
总体而言,新功能承诺更快的响应速度,并结合强大的图像识别功能,使ChatGPT成为一个更有用、更生动的对话伙伴。在发布会的展示中,OpenAI的员工展示了ChatGPT几乎可以即时响应请求的能力,例如通过手机摄像头解决研究人员在纸上写的数学问题。
OpenAI表示,将在未来为用户提供更多关于这些功能发布时间的信息。