使用场景
在网页上实现实时语言翻译功能。
通过浏览器进行图像内容的自动标注和分类。
开发一个支持语音到文本转换的网页应用程序。
产品特色
支持多种自然语言处理任务,如文本分类、命名实体识别、问答、语言模型、摘要、翻译等。
支持计算机视觉任务,包括图像分类、目标检测和分割。
支持音频任务,如自动语音识别和音频分类。
支持多模态任务,如零样本图像分类。
使用ONNX Runtime在浏览器中运行模型,易于将预训练模型转换为ONNX格式。
提供pipeline API,简化模型的输入预处理和输出后处理。
使用教程
安装transformers.js库,可以通过npm运行'npm install @xenova/transformers'。
引入库到项目中,例如使用ES模块'import { pipeline } from '@xenova/transformers';'。
选择或配置所需的模型,可以通过pipeline函数指定模型ID或路径。
使用pipeline API进行模型推理,传入待处理的文本、图像或音频数据。
处理模型输出,获取所需的结果,如文本分类的标签和置信度。
根据应用场景,将结果展示给用户或进一步处理。