RLHF

  • 清华新研究:无需任何奖励模型,利用人类反馈微调扩散模型

    大模型是训练强化学习代理的好老师 综述:多模态大型语言模型 可视化上下文提示 Soulstyler:使用大型语言模型引导目标对象的图像风格转移 清华领衔新研究:...
    AI,CLIP,Diffusion,GPT,GPU,large language models,LLM,prompt,RLHF,创新,大模型,强化学习,文字,机器人,机器学习,研究方法,计算机视觉,论文,音频, 08月18日 0 0
  • GPT2能监督GPT4,Ilya带头OpenAI超级对齐首篇论文来了:AI对齐AI取得实证结果

    本文来自公众号机器之心,编辑:陈萍、蛋酱 过去一年,以「预测下一个 Token」为本质的大模型已经横扫人类世界的多项任务,展现了人工智能的巨大潜力。 在近日的一...
    AI,ChatGPT,GPT,Hinton,NLP,OpenAI,RLHF,token,人工智能,大模型,强化学习,机器学习,论文,超级人工智能,预训练模型, 08月18日 0 0
  • 智东西:AIGC明星独角兽被曝卖身?投资者点名CEO,9个月流失近20名高管

    作者 | 香草 编辑 | 李水青 智东西12月25日报道,近期,AI生图赛道迎来一波新的爆发期。不仅Meta、谷歌等科技巨头接连推出新的文生图模型,现象级产品M...
    Adobe,AI,,AI安全,AI模型,AI营销,AWS,ChatGPT,Diffusion,GPT,GPU,Meta,Midjourney,OpenAI,RLHF,Snapchat,TikTok,Transformer,VR,云计算,亚马逊,基金经理,大模型,开发者,微软,技术突破,文生图,文生视频,机器人,机器学习,版权保护,生成式,生成式AI,生物,社交媒体,英伟达,营销平台,视频,谷歌,音频, 08月18日 0 0
  • 郭全中:AI能力新突破下的AIGC:内容生产新范式

    作者:郭全中(中央民族大学新闻与传播学院教授,互联网平台企业发展与治理研究中心主任);袁柏林(中央民族大学新闻与传播学院硕士研究生) 来源:《青年记者》2023...
    360,AI,,AI客服,AI技术,AI模型,ChatGPT,GPT,OpenAI,PGC,RLHF,UGC,云计算,人工智能,人工智能生成内容,人机交互,元宇宙,内容生产,写作,出海,创新,参考文献,周鸿祎,图灵测试,大数据,大模型,宇宙,客服,引用格式,强化学习,微软,搜索引擎,数字孪生,文字,无监督学习,未来发展,机器人,深度学习,生成式,生成式人工智能,监督学习,社交媒体,程序员,网页,自然语言处理,芯片,视频,论文,谷歌,音频, 08月18日 0 0
  • 开源模型还是商业模型?阿里云智能张翅提出金融企业选择大模型的6大挑战

    大模型发展背景与趋势 大模型是DT时代标志性产物 大模型是数字转型(DT)时代的产物,标志着人工智能技术的一次重大突破,尤其是在自然语言处理(NLP)、图像识别...
    AI,AI Native,AI工具,AI技术,AI模型,AWS,CPU,Gemini,Generative AI,Google,GPT,GPU,IDC,LLM,Meta,NLP,OpenAI,prompt,RLHF,Transformer,云计算,人工智能,人机交互,人机协同,健康,创新,发展趋势,图片,多模态技术,大模型,客户支持,客服,开发者,抖音,操作系统,数字员工,数据分析,数据处理,文字,智能决策,智能客服,机器人,机器学习,深度学习,物联网,生成式,生成式AI,生成式人工智能,生成式人工智能服 08月18日 0 0
  • 「经观讲堂第33期」窦德景:从大模型的前世今生,理解AI时代的盼与忧

    经济观察网 史额黎/文 【经观讲堂】系经济观察报社年度培训项目,邀请来自经济、传媒、科学、文化、法律、商业等领域知名人士讲授常识与新知,分享经典和创新,是助力提...
    1950,360,AI,AI技术,BERT,ChatGPT,GPT,Hinton,iPhone,Meta,OpenAI,RLHF,token,Transformer,人工智能,健康,创新,华为,卷积神经网络,图灵奖,图灵测试,图片,大数据,大模型,宇宙,客户支持,客服,强化学习,技术突破,搜索引擎,文字,文心一言,文生视频,斯图尔特·罗素,智能客服,机器人,杰弗里·辛顿,深度学习,生成式,生成式AI,生物,研究成果,神经网络,聊天机器人,自然语言处理,芯片,英伟达,视频,论文,谷歌,销售,黄仁勋, 08月18日 0 0
  • 用AI监督AI?OpenAI方面宣布基于GPT4推出新模型CriticGPT,用于捕捉ChatGPT代码输出中的错误。

    AI会因为幻觉(AI Hallucinations)而胡说八道这件事,已经是当下AI行业的共识。无论国内的文心一言、Kimi、混元,还是海外的ChatGPT、G...
    AI,AI开发者,AI检测,ChatGPT,Gemini,GPT,OpenAI,rl,RLHF,人工智能,代码,代码生成,多模态,大数据,大模型,工具,开发者,强化学习,搜,搜索,数据标注,文心一言,混元,监督学习,程序员, 08月18日 0 0
  • 当前AI模型安全能力的提升远远落后于性能。周伯文:AI安全与性能发展失衡,探索AI 45°平衡律

    当前AI模型安全能力的提升远远落后于性能,导致AI的发展是跛脚的,失衡的背后是两者投入上的巨大差异。目前世界上99%的算力用于模型预训练,只有不到1%用于对齐或...
    agi,AI,AI安全,AI技术,AI模型,ChatGPT,GPT,rl,RLHF,Transformer,上海人工智能实验室,人工智能,图灵奖,大数据,大模型,强化学习,生成式,生成式人工智能,预训练, 08月18日 0 0
  • AI训练师的困局:喂饱AI,饿死自己

    “工作越积极,我被淘汰得越快!” 这听起来荒诞的现象却在AI行业如火如荼地上演。 当一种新技术诞生时,往往会带来新的工作类型。数据标注就是大火AI下的其中一种新...
    AI,AI模型,AI训练师,GPT,OpenAI,prompt,rl,RLHF,人工智能,图片,大模型,工具,强化学习,数据标注,数据标注员,最新,生成式,生成式AI,视频,论文,语音,谷歌,预训练, 08月18日 0 0
  • 2024合肥市人工智能生态大会举行

    7月20日,2024年合肥市人工智能生态大会在科大硅谷核心区中安创谷片区举办。这场“AI盛宴”吸引了来自人工智能领域的多位专家、企业家以及投融资机构代表,以“应...
    AI,,lora,rl,RLHF,人工智能,人工智能大模型,人机交互,代码,内容生产,华为,大数据,大模型,工具,星火,生成式,讯飞星火, 08月18日 0 0