开源

学习

VSP LLM

使用场景在多语言环境中，使用VSP-LLM进行实时语音翻译利用VSP-LLM分析视频内容，提取关键信息并生成摘要在教育应用中，使用VSP-LLM辅助语言学习，提...

AI模型,AI语音识别,视觉语音处理,大型语言模型,多任务学习,普通产品,开源, 08月01日 0 0
音频

AV HuBERT

使用场景研究人员使用AV-HuBERT框架进行音视觉语音识别的实验研究开发者利用AV-HuBERT模型开发能够理解不同语言环境下的语音识别应用教育工作者使用AV...

AI语音识别,AI音频增强器,音视觉处理,自监督学习,音视觉语音识别,普通产品,开源, 08月01日 0 0
创作

Refined Anime Text

使用场景使用Refined-Anime-Text数据集训练一个专门生成动漫剧情的AI模型开发者利用该数据集优化聊天机器人，使其能够更好地与动漫爱好者交流研究人员...

AI模型,AI模型推理训练,动漫文本,数据集,文本生成,普通产品,开源, 08月01日 0 0
创作

Benchmark Medical RAG

使用场景研究人员使用Benchmark Medical RAG评估他们开发的医疗问答系统开发者利用该平台的数据集训练和优化医疗领域的聊天机器人教育机构使用该基准...

AI学术研究,AI医疗健康,医疗问答,基准测试,信息检索,普通产品,开源, 08月01日 0 0
创作

Medrag

使用场景医院使用MedRAG模型为患者提供24/7的在线医疗咨询服务医学研究人员利用MedRAG快速获取最新的医学研究资料教育机构使用MedRAG作为教学工具，...

AI医疗健康,AI问答,医疗AI,检索式问答,自然语言处理,普通产品,开源, 08月01日 0 0
创作

Melotts

使用场景开发者使用MeloTTS为多语言应用提供语音合成功能教育软件利用MeloTTS为学习材料生成不同语言的语音游戏开发者集成MeloTTS，为游戏角色提供多...

AI语音合成,AI文本转语音,文本转语音,多语言支持,开源库,普通产品,开源, 08月01日 0 0
图像

Multi LoRA Composition

使用场景艺术家使用Multi-LoRA Composition创作独特的数字艺术作品游戏开发者利用该技术为游戏角色生成多样化的服装和表情广告设计师通过Multi...

AI图像生成,AI模型,图像生成,LoRA,人工智能,普通产品,开源, 08月01日 0 0
创作

Mobillama

使用场景在智能手机上使用MobiLlama进行实时语言翻译物联网设备利用MobiLlama进行语音识别和交互智能家居系统集成MobiLlama以提供更智能的语音...

AI模型,AI模型推理训练,小型语言模型,边缘设备,资源优化,普通产品,开源, 08月01日 0 0
创作

Chatmusician

使用场景音乐家使用ChatMusician创作新的音乐作品音乐教师利用ChatMusician分析和解释音乐理论软件开发者集成ChatMusician到音乐应用...

AI音乐生成,AI模型,音乐生成,语言模型,音乐理论,普通产品,开源, 08月01日 0 0
图像

Opendit

产品特色快速、高效的DiT训练和推理FlashAttention、Fused AdaLN和Fused layernorm核心优化ZeRO、Gemini和DDP的...

AI模型推理训练,AI图像生成,DiT,训练,推理,文本到视频,文本到图像,图像生成,普通产品,开源, 08月01日 0 0

点击加载更多