近日,阿里巴巴通义实验室推出了一种名为 ZeroSearch 的强化学习框架,该框架能够在无需与真实搜索引擎交互的情况下,显著提升大型语言模型(LLM)的搜索能...
ZeroSearch,大型语言模型,强化学习,搜索能力,监督微调,课程学习
07月29日
0
近日,DeepSeek团队在arXiv上发布了题为《Insights into DeepSeek-V3: Scaling Challenges and Refl...
AI架构,DeepSeek-V3,内存效率,大型语言模型,硬件与模型协同设计,计算效率,通信效率
07月29日
0
一、OpenAI 推出智能体构建指南人工智能领域的领军企业 OpenAI 近日重磅发布了一份名为《构建智能体实践指南》的实用性文档。这份 34页 的指南旨在为产...
OpenAI,大型语言模型,安全保障,工作流,智能体,构建指南,自动化
07月29日
0
Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。模型概况Mistral ...
Mistral AI,AI,大型语言模型,语言模型
07月30日
0
谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning...
谷歌,DeepMind,大型语言模型,语言模型
07月30日
0
最近,西班牙瓦伦西亚理工大学的科学家进行了一项研究,揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现,...
大型语言模型,语言模型
07月30日
0
最近,富士通正式发布了名为 “Takane” 的大型语言模型(LLM),这款模型特别为企业用户打造,旨在满足安全私密环境下的需求。Takane 是与 Coher...
大型语言模型,语言模型,企业智能化,智能化,升级
07月30日
0
最近 SK 电信又有大动作了!他们在周二宣布推出了自家的人工智能(AI)服务 A.的 PC 版本,用户现在可以通过网站 adot.ai 免费访问多种大型语言模型...
SK,AI,免费,大型语言模型,语言模型
07月30日
0
麻省理工学院本周展示了一种训练机器人的新模型,旨在解决模仿学习在引入小挑战时可能会失败的问题。研究人员指出,模仿学习在照明、不同环境或新障碍等情况下可能会失败,...
麻省理工学院,大型语言模型,语言模型,机器人
07月30日
0
近日,密歇根大学的一项新研究发现,一种训练大型语言模型的省力方法可以在相同的时间内完成,但能耗可降低30%。这种方法可以节省足够的能源,到2026年为110万美...
研究人员,大型语言模型,语言模型
07月30日
0