大模型落地应用元年②:

2023,随着ChatGPT的横空出世,大模型迎来了前所未有的关注。2024,业内普遍认为,大模型将迎来落地应用热潮。大模型落地应用元年,人工智能技术也行至产业应用的临界点。红星资本局采访多家国内大模型企业,聚焦大模型应用行业前沿关键节点。

5月中旬,OpenAI推出新旗舰模型GPT-4o,一个多月之后的世界人工智能大会上,商汤科技(00020.HK)正式推出“日日新5o”,直接对标GPT-4o。据悉,这也是国内首个“流式交互”多模态大模型。

所谓多模态大模型,是近年来兴起的一个新的研究热点,指的是可以同时处理多种不同类型数据(如文本、图像、声音或视频等)的模型。也有业内观点认为,多模态已成为大模型的标配。

商汤科技联合创始人林达华在接受采访时谈到,预计下半年,大模型的推理成本会快速下降,且比上半年下降一个数量级甚至更多。他认为下半年还会催生出更新型的实时交互体验。

大模型的真正考验

在近日召开的人工智能大会的发布现场,工作人员与“日日新5o”对话,后者能瞬间自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。当工作人员随便翻开一本书的任何一页,“日日新5o”能自动介绍,不是简单的OCR识别文字,而是识别图文给出易于理解的总结,做到实时交互。

0个人收藏 收藏

评论交流