大型语言模型

资讯

ZeroSearch：无需搜索引擎即可提升LLM搜索能力的创新框架

近日，阿里巴巴通义实验室推出了一种名为 ZeroSearch 的强化学习框架，该框架能够在无需与真实搜索引擎交互的情况下，显著提升大型语言模型（LLM）的搜索能...

ZeroSearch,大型语言模型,强化学习,搜索能力,监督微调,课程学习 07月29日 0 0
资讯

DeepSeek-V3：AI架构中的硬件与模型协同设计新突破

近日，DeepSeek团队在arXiv上发布了题为《Insights into DeepSeek-V3: Scaling Challenges and Refl...

AI架构,DeepSeek-V3,内存效率,大型语言模型,硬件与模型协同设计,计算效率,通信效率 07月29日 0 0
资讯

OpenAI 发布“智能体构建实践指南”，助力开发者打造高效智能应用文末附下载地址

一、OpenAI 推出智能体构建指南人工智能领域的领军企业 OpenAI 近日重磅发布了一份名为《构建智能体实践指南》的实用性文档。这份 34页的指南旨在为产...

OpenAI,大型语言模型,安全保障,工作流,智能体,构建指南,自动化 07月29日 0 0
资讯

Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B

Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2，这一模型在成本效益、速度和性能方面都取得了显著突破。模型概况Mistral ...

Mistral AI,AI,大型语言模型,语言模型 07月30日 0 0
资讯

谷歌DeepMind推出SCoRe：大型语言模型自我纠正新技术

谷歌DeepMind研究团队最近取得重大突破，开发出名为SCoRe（Self-Correction through Reinforcement Learning...

谷歌,DeepMind,大型语言模型,语言模型 07月30日 0 0
资讯

研究发现:大型语言模型可能更倾向于撒谎而非承认无知

最近，西班牙瓦伦西亚理工大学的科学家进行了一项研究，揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现，...

大型语言模型,语言模型 07月30日 0 0
资讯

富士通推出 Takane 大型语言模型，助力企业智能化升级

最近，富士通正式发布了名为 “Takane” 的大型语言模型（LLM），这款模型特别为企业用户打造，旨在满足安全私密环境下的需求。Takane 是与 Coher...

大型语言模型,语言模型,企业智能化,智能化,升级 07月30日 0 0
资讯

SKT发布PC版AI服务：免费接入多款大型语言模型

最近 SK 电信又有大动作了!他们在周二宣布推出了自家的人工智能（AI）服务 A.的 PC 版本，用户现在可以通过网站 adot.ai 免费访问多种大型语言模型...

SK,AI,免费,大型语言模型,语言模型 07月30日 0 0
资讯

麻省理工学院首次推出受大型语言模型启发的方法用于教授机器人新技能

麻省理工学院本周展示了一种训练机器人的新模型，旨在解决模仿学习在引入小挑战时可能会失败的问题。研究人员指出，模仿学习在照明、不同环境或新障碍等情况下可能会失败，...

麻省理工学院,大型语言模型,语言模型,机器人 07月30日 0 0
资讯

研究人员发现一种训练大型语言模型的省力方法能耗降低30%

近日，密歇根大学的一项新研究发现，一种训练大型语言模型的省力方法可以在相同的时间内完成，但能耗可降低30%。这种方法可以节省足够的能源，到2026年为110万美...

研究人员,大型语言模型,语言模型 07月30日 0 0

点击加载更多