传统操作系统中的每一个按钮和菜单都是由开发者事先编写和设计的,用户的每一次点击和操作都是对预设功能的调用。而在谷歌的神经操作系统中,用户的每一次互动都被视为生成新界面的指令。简而言之,用户不再是在一个固定的界面中寻找功能,而是如同在一座不断变化的城市中,每一步都会有新的景象展现。
为了实现这一创新,谷歌研究团队设计了一套精巧的机制,将给模型的指令分为 “界面构成” 和 “界面互动” 两部分。“界面构成” 定义了整个系统的基本外观,而 “界面互动” 则记录用户的每一次操作,并以 JSON 格式发送给模型。模型根据这些信息生成新的界面,确保用户体验的一致性和连贯性。
此外,谷歌的系统具备快速响应的能力,采用流式传输技术使得用户界面几乎瞬间生成,避免了用户在等待过程中的不适感。更重要的是,系统可以通过 “生成式界面图” 来缓存已经生成的界面,这样用户在再次访问同一位置时,可以直接调用缓存,提升了系统的稳定性和用户的操作流畅性。
值得一提的是,学术界也在进行类似的研究。一个名为 NeuralOS 的项目,通过预测屏幕图像生成实时界面,展现了神经网络在操作系统模拟中的潜力。
虽然目前谷歌的神经操作系统仍处于原型阶段,但其背后的技术理念已显示出广泛的应用前景。通过实时生成的界面,用户的操作将更加便捷,从而提升整体的使用体验。
论文:https://arxiv.org/abs/2507.08800