电影中的人工智能来了！OpenAI发布全能大模型：文图音任意组合输出，可实现人类级别响应

AI 2025-08-18 17:29:40

资讯

北京时间5月14日凌晨，OpenAI发布最新多模态大模型 GPT-4o（o代表omini，全能），支持文本、音频和图像的任意组合输入，并生成文本、音频和图像的任意组合输出。文本、推理和编码智能方面性能达到了GPT-4 Turbo水平，同时在多语言、音频和视觉能力方面也达到新高。据介绍，GPT-4o的速度比GPT-4 Turbo快2倍，速率限制提高5倍，最高可达每分钟1000万token，而价格则便宜了一半。

OpenAI首席技术官米拉·穆拉蒂（Muri Murati）在发布会上表示：“通过语音、文本和视觉进行推理非常重要，因为我们正在研究与机器交互的未来。”

官网显示，GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户，Plus用户的消息数量使用上限是免费版的5倍（使用上限后会切换回GPT-3.5版本）。而新版语音模式将在未来几周向Plus用户推出，同时也将会在API（应用接口）中向小范围推出对GPT-4o的新音频和视频功能的支持。

AI ChatGPT GPT OpenAI token Windows 人工智能代码多模态大模型工具开发者搜智能工具最新机器人神经网络聊天机器人苹果视频语音谷歌音频

0个人收藏收藏

电影中的人工智能来了！OpenAI发布全能大模型：文图音任意组合输出，可实现人类级别响应

评论交流

精彩推荐

马斯克宣布旗下xAI开源Grok 2.5模型 Grok 3半年后跟进

AI医疗与创新药齐热，京东健康在押什么注？

即梦AI智能多帧功能：开启视频创作新时代

这群年轻人用“AI”种菜

猜你喜欢

人形机器人「朋友圈」的明牌和暗战

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 ...

刚刚，OpenAI Sora 2重磅登场！首个AP...

把我的第一次日本旅行，完全交给AI是什么体验？

AI巨头的奶妈局

最近更新

人形机器人「朋友圈」的明牌和暗战

宇树科技专利侵权案一审判决：未构成侵权，原告败诉

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 ...

刚刚，OpenAI Sora 2重磅登场！首个AP...

字节信徒MiniMax

看360 - 吹响未来的号角！