Search Results

Found 2,447 repositories(showing 30)

MiniCPM-o

OpenBMB

💚95

A Gemini 2.5 Flash Level MLLM for Vision, Speech, and Full-Duplex Multimodal Live Streaming on Your Phone

24.3k

1.9k

Apache-2.0

Python

Updated 1 hour ago

minicpmminicpm-vmulti-modal

live-api-web-console

google-gemini

💛80

A react-based starter app for using the Live API over websockets with Gemini

2.5k

723

Apache-2.0

TypeScript

Updated 21 hours ago

geminigemini-api

VisionClaw

Intent-Lab

💛76

Real-time AI assistant for Meta Ray-Ban smart glasses -- voice + vision + agentic actions via Gemini Live and OpenClaw

2.1k

373

NOASSERTION

Updated 51 minutes ago

sokuji

kizuna-ai-lab

💛72

Live speech translation powered by on-device AI and cloud providers — OpenAI, Google Gemini, Palabra.ai, Kizuna AI, Volcengine, and more

861

AGPL-3.0

TypeScript

Updated 3 hours ago

aichrome-extensionelectron+8

A responsive web-based UI that provides an intuitive interface for Google's Gemini CLI, enabling AI-assisted coding from any device. Features include interactive chat, integrated terminal, file explorer with live editing, Git integration, and session management.

656

159

GPL-3.0

JavaScript

Updated 1 hour ago

code-assistantgemini-aigemini-cli+3

immersive-language-learning-with-live-api

ZackAkil

💛72

Immergo is an immersive language learning application powered by the Google Gemini Live SDK. It simulates real-world roleplay scenarios (e.g., buying a bus ticket, ordering coffee) to help users practice speaking in various languages with an AI that acts as a native speaker.

439

154

Apache-2.0

JavaScript

Updated 46 minutes ago

bigqugeminigemini-live-api+6

gemini-2-live-api-demo

ViaAnthroposBenevolentia

💛72

Vanilla JS web interface for Gemini 2.0 flash-exp Multimodal API with text, audio, camera, screen inputs and audio responses and function calling

390

159

MIT

JavaScript

Updated 8 hours ago

function-callinggemini-apigemini-flash+3

ductor

PleasePrompto

🧡61

Control Claude Code, Codex CLI and Gemini CLI from Telegram. Live streaming, persistent memory, cron jobs, webhooks, Docker sandboxing.

250

MIT

Python

Updated 11 minutes ago

ai-assistantautomationclaude-code+7

gemini-multimodal-live-dev-guide

heiko-hotz

🧡51

A developer guide for Gemini's Multimodal Live API

241

Apache-2.0

Jupyter Notebook

Updated 2 months ago

gemini-multimodal-live-demo

pipecat-ai

🧡66

Chat Application Starter Kit — Gemini Multimodal Live API + Pipecat

225

BSD-2-Clause

TypeScript

Updated 3 days ago

ai-trading-agent-gemini

danilobatson

🧡61

AI Trading Agent that transforms social media sentiment into actionable trading signals using LunarCrush analytics and Google Gemini AI. Features real-time progress tracking, background job processing with Inngest, and live dashboard updates via Supabase subscriptions. Built with Next.js 15, TypeScript, and modern AI integration patterns.

211

TypeScript

Updated 5 days ago

aicryptocurrencygoogle-gemini+3

gemini-webrtc-web-simple

pipecat-ai

🧡66

Gemini Multimodal Live + WebRTC in a single `app.ts`

210

Python

Updated 3 days ago

super-voice-assistant

ykdojo

🧡66

macOS voice assistant with global hotkeys - transcribe speech to text with offline models (WhisperKit or Parakeet) or cloud-based Gemini API, capture and transcribe screen recordings with visual context, and read selected text aloud with Gemini Live.

179

NOASSERTION

Swift

Updated 4 days ago

Google_GenerativeAI

gunpal5

🧡61

Most complete C# .Net SDK for Google Generative AI and Vertex AI (Google Gemini), featuring function calling, easiest JSON Mode, multi-modal live streaming, chat sessions, and more!

169

MIT

Updated 1 week ago

gemini-live-api-examples

google-gemini

💛71

Gemini Live provides multimodal realtime agent capabilities. Build voice agents that can process vision and text in realtime.

152

Apache-2.0

JavaScript

Updated 1 hour ago

symfony-ux-skills

smnandre

🧡65

Symfony UX skills for Claude, Gemini, Codex, ... Live Component, Twig Component, Turbo, Stimulus

134

MIT

Updated 1 day ago

claudeclaude-pluginclaude-skills+15

dadbod-grip.nvim

joryeugene

🧡65

Edit database tables like Vim buffers. Staged mutations + live SQL preview, transaction undo, schema browser + ER diagrams + DDL, FK navigation, cross-database federation, data profiling, SQL notebooks, AI SQL via Anthropic/OpenAI/Gemini/Ollama, Parquet/CSV/remote files. PostgreSQL · SQLite · MySQL · DuckDB · MotherDuck

133

MIT

Lua

Updated 2 days ago

aicross-databasedatabase+15

live-fact-checker

alandaitch

🧡60

Real-time AI fact-checker for YouTube videos and live streams. Uses Gemini 2.0 Flash with Google Search grounding.

MIT

JavaScript

Updated 1 week ago

GlassFlow

Intent-Lab

🧡60

Real-time transcription and AI assistant for Meta Ray-Ban smart glasses. Live speech-to-text, speaker diarization, Gemini Live vision+voice, and WebRTC streaming.

NOASSERTION

Updated 1 week ago

asciivision

lalomorales22

🧡65

play mp4 files through terminal, chat with claude, grok, chatgpt, and gemini, live stream via web cam, 3d visualizations in CLI

Rust

Updated 5 days ago

climp4rust+1

gemini-nextjs

yeyu2

❤️40

Gemini Multimodal Live App with Next.js Framework, welcome to my YouTube channel for more interesting projects.

TypeScript

Updated 1 month ago

ai-agent-session-center

coding-by-feng

🧡65

Real-time dashboard that turns AI coding agent sessions (Claude Code, Gemini CLI, Codex) into animated 3D robots — with live terminals, prompt history, tool logs, and queuing. Runs on any device.

TypeScript

Updated 16 hours ago

aiai-agentsclaude+5

sip-to-ai

aicc2025

💛70

Turn any SIP call into a realtime AI voice agent (OpenAI Realtime / Deepgram/Gemini Live)

Apache-2.0

Python

Updated 1 hour ago

asteriskcallcenterdeepgram+8

Fully-Autonomous-Polymarket-AI-Trading-Bot

dylanpersonguy

🧡60

Polymarket Trading Bot — Autonomous AI prediction market bot with multi-model ensemble forecasting (GPT-4o, Claude, Gemini), automated research engine, 15+ risk checks, whale tracking, fractional Kelly sizing, and real-time 9-tab monitoring dashboard. Paper & live trading. Open source.

Python

Updated 5 hours ago

ai-tradingalgorithmic-tradingautomated-trading+17

OpenVision

rayl15

🧡65

Open-source iOS app connecting Meta Ray-Ban smart glasses to AI assistants (OpenClaw + Gemini Live)

MIT

Swift

Updated 2 days ago

ai-assistantgeminiios+5

word-wrangler-gemini-live

daily-co

❤️40

A demo using Gemini Live where you describe a word and your AI partner tries to guess it

BSD-2-Clause

Python

Updated 3 months ago

langgraph-voice-call-agent

ahmad2b

💛70

A real-time voice/call AI agent that lets you talk to a LangGraph agent over LiveKit — similar to "voice mode" experiences in ChatGPT Voice, OpenAI Realtime API sessions, and Gemini Live. This repo demonstrates adapting any LangGraph agent into a full-duplex, low-latency voice assistant using LiveKit Agents.

MIT

Python

Updated 1 day ago

agentscall-agentlanggraph+5

vibe-architect

mohdhd

💛70

🏗️ AI-powered project spec generator — go from idea to implementation-ready spec in minutes. Multi-model support (GPT-5.2, Gemini 3, Claude), live design previews, voice input, and export to markdown.

MIT

TypeScript

Updated 1 hour ago

hrm

arii

🧡50

A real-time fitness monitoring dashboard that streams live heart rate data from Bluetooth devices to a multi-client web interface, with Spotify playback control and a Tabata interval timer. Developed by a fully automated CI/CD system using gemini AI and Jules.

TypeScript

Updated 5 days ago

gemini-apigithub-actionsjules+3

jarvis

addyosmani

🧡65

JARVIS built using the Gemini Live API

Apache-2.0

TypeScript

Updated 2 days ago

geminigemini-apigemini-live+5

GitHub Explorer

Search Results

MiniCPM-o

live-api-web-console

VisionClaw

sokuji

Gemini-CLI-UI

immersive-language-learning-with-live-api

gemini-2-live-api-demo

ductor

gemini-multimodal-live-dev-guide

gemini-multimodal-live-demo

ai-trading-agent-gemini

gemini-webrtc-web-simple

super-voice-assistant

Google_GenerativeAI

gemini-live-api-examples

symfony-ux-skills

dadbod-grip.nvim

live-fact-checker

GlassFlow

asciivision

gemini-nextjs

ai-agent-session-center

sip-to-ai

Fully-Autonomous-Polymarket-AI-Trading-Bot

OpenVision

word-wrangler-gemini-live

langgraph-voice-call-agent

vibe-architect

hrm

jarvis

MiniCPM-o

live-api-web-console

VisionClaw

sokuji

Gemini-CLI-UI

immersive-language-learning-with-live-api

gemini-2-live-api-demo

ductor

gemini-multimodal-live-dev-guide

gemini-multimodal-live-demo

ai-trading-agent-gemini

gemini-webrtc-web-simple

super-voice-assistant

Google_GenerativeAI

gemini-live-api-examples

symfony-ux-skills

dadbod-grip.nvim

live-fact-checker

GlassFlow

asciivision

gemini-nextjs

ai-agent-session-center

sip-to-ai

Fully-Autonomous-Polymarket-AI-Trading-Bot

OpenVision

word-wrangler-gemini-live

langgraph-voice-call-agent

vibe-architect

hrm

jarvis