Search Results

Found 2 repositories(showing 2)

Audio-Multimodal-AI-Resources

danielrosehill

❤️35

A compilation of resources (model profiles, benchmarks, docs) for multimodal AI models with audio understanding (esp. focused on ASR and transcription use-cases)

Updated 3 months ago

asraudio-multimodalaudio-text-to-text+3

Integrating Text, Audio, and Vision:- A next-generation multimodal AI system that mimics human-like understanding by integrating Natural Language Processing (NLP), Speech Recognition, and Computer Vision into one intelligent platform. Resources

Python

Updated 11 months ago

All 2 repositories loaded

GitHub Explorer

Search Results

Audio-Multimodal-AI-Resources

SMART-AI

Audio-Multimodal-AI-Resources

SMART-AI