Found 317 repositories(showing 30)
modelscope
A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
yan5xu
开源免费的 Wispr Flow 替代方案 | 集成FunASR本地模型和可配置大语言模型的下一代中文桌面语音工作流
harry0703
快速提取音视频内容,整理成一份结构化的markdown笔记
wwbin2017
百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,集成DeepSeek R1等优秀大模型,接入openClaw,真正的个人语音助手,时延低至800ms,Mac等低配置也可运行,支持打断
HG-ha
MTools 是一个功能强大的全能桌面应用程序,集成了音视频处理、图片编辑、文本操作和编码工具,内置AI增强功能。旨在简化您的工作流程,提升生产效率
RapidAI
📣 商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.
lovemefan
Port of Funasr's Sense-voice model in C/C++
233stone
VocoType 是一款运行在本地端侧的隐私安全语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持语音转文字MCP、AI 优化文本、自定义替换词典、录音视频转文字等功能,让语音输入更高效、更安全。
FireRedTeam
A SOTA Industrial-Grade Voice Activity Detection & Audio Event Detection, supporting 100+ languages, outperforming Silero-VAD, TEN-VAD, FunASR-VAD and WebRTC-VAD
Quantatirsk
Speech recognition API service powered by FunASR and Qwen-ASR, supporting 52 languages, compatible with OpenAI API and Alibaba Cloud Speech API. 基于 FunASR 与 Qwen3-ASR 的语音识别 API 服务,支持 52 种语言,兼容 OpenAI API 与阿里云语音 API。
gpustack
A text-to-speech and speech-to-text server compatible with the OpenAI API, supporting Whisper, FunASR, Bark, and CosyVoice backends.
Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型
TheDeathDragon
Real-time audio translation, captures system audio + mic, runs ASR (Whisper/SenseVoice), translates via LLM API with streaming display. Perfect for VTubers, livestreamers, and watching foreign content. Windows 实时音频翻译,ASR 语音识别后 LLM 流式翻译显示,适合 VTuber、主播和外语视频观看。
lukeewin
这是一款基于FunASR实现的说话人分离的GUI程序
lovemefan
A enterprise-grade Voice Activity Detector from modelscope and funasr.
zaigie
开箱即用的本地私有化部署语音服务,快速搭建FunASR与CosyVoice2/3后端
lovemefan
SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime
LeonardNJU
高性能 Linux 离线中文语音输入法,基于 Ali FunASR(VocoType-cli). ~0.1s 瞬时上屏,输入法级稳定性, 极高中文准确率、低资源占用(CPU Only).支持 IBus / Fcitx5
LuckLittleBoy
基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi
AliceNavigator
Simple data labeling script with funasr inside. 使用阿里fanasr进行VITS训练数据标注
Wasser1462
A lightweight demo of FunASR-Nano using ONNX runtime.
pengling9405
妙语 - 智能语音输入,妙语亦可生花。
jianyangshi
funasr-android 本地化部署 生成.so给安卓那边调用
oddmeta
An ASR API server for FunASR
HaujetZhao
No description available
Ikaros-521
基于FunASR官方Demo修改的WS服务端,配合FastAPI提供HTTP服务,可以在浏览器中进行实时ASR测试
peilongchencc
基于FunASR实现语音识别,包含常规版和ONNX版(推荐)。
cheatofrom
🎙️ 基于FunASR的本地会议纪要系统 - 支持会议记录、文件转录、AI智能总结,说话人识别,富文档编辑器,纪要总结导出doc文档(如果对您有帮助,请帮忙点点star,非常感谢)
rickymao-apple
📘 项目简介:为什么要做这个工具? 很多高中生在 B 站上听网课,但现实情况是: 周末时间有限,大量课程根本听不完 学校不允许使用电子设备,无法在课堂或晚自习继续学 想补知识,却只能挤在零碎时间听视频,效率非常低 为了帮助这些学生,我开发了这个 「B 站视频一键转文字」工具: 输入一个 B 站视频链接,本工具会自动: 下载视频 提取音频 用 FunASR 进行语音识别 输出可打印的 文字稿(含标点) 这样学生就可以: 把网课内容 打印出来,带到学校随时看 随手做笔记、划重点 复习效率比听视频快几倍 周末不用被大量未听完的视频压着喘不过气 这是一个为 真正需要高效复习的学生 而生的小工具,希望能让大家的学习轻松一点。
lovemefan
Port of Funasr's Paraformer model in C/C++