🏆 1st Place ElevenLabs Hackathon – $20,000🚀 EBRD Star Venture Program🥈 2nd Place Sevan Startup Summit🚀 Google Cloud $25K Grant
Kallina AI
RO
Kallina Voice AI

WebSocket Voice Implementation

Ghid tehnic complet pentru implementare WebSocket în aplicații Voice AI.

De Ce WebSocket

WebSocket oferă comunicare bidirectională full-duplex, esențială pentru conversații vocale în timp real. Latență minimă, overhead redus.

Full-duplex
Transmit și receive simultan
Low latency
No HTTP overhead
Persistent
Single connection

Connection Flow

1

Handshake

HTTP upgrade la WebSocket protocol

2

Authentication

Token JWT sau API key în header

3

Configuration

Setări audio: sample rate, encoding

4

Streaming

Bidirectional audio flow

Message Types

TypeDirectionDescription
audio_dataClient → ServerRaw audio chunks (PCM/Opus)
transcriptServer → ClientReal-time transcription
audio_responseServer → ClientTTS audio chunks
controlBidirectionalStart/stop/interrupt signals
vad_eventServer → ClientVoice activity detection
errorServer → ClientError messages

Code Example

// Connect to Kallina WebSocket
const ws = new WebSocket('wss://api.kallina.ai/v1/voice/stream');

ws.onopen = () => {
  // Send configuration
  ws.send(JSON.stringify({
    type: 'config',
    audio: {
      encoding: 'linear16',
      sample_rate: 16000,
      channels: 1
    },
    language: 'ro-RO'
  }));

  // Start streaming audio from microphone
  startAudioCapture();
};

ws.onmessage = (event) => {
  const data = JSON.parse(event.data);

  if (data.type === 'transcript') {
    // Show real-time transcription
    updateTranscript(data.text, data.is_final);
  }

  if (data.type === 'audio_response') {
    // Play AI response audio
    playAudioChunk(data.audio);
  }
};

Best Practices

Chunk Size

20-50ms audio per chunk (320-800 bytes la 16kHz)

Buffer

Client buffer 100-200ms pentru smooth playback

Heartbeat

Ping every 30s pentru keep-alive

Reconnect

Exponential backoff: 1s, 2s, 4s, 8s, max 30s

Compression

Opus codec pentru bandwidth reduction 50%+

Error Handling

Connection Lost

Retry cu exponential backoff, restaurează context

Audio Gaps

Buffer management, PLC (Packet Loss Concealment)

High Latency

Reduce chunk size, check network quality

Kallina WebSocket API

Documentație completă și SDK-uri pentru toate platformele.

Vezi Documentația →
Începe Astăzi

Transformă Comunicarea cu Clienții

Agenți vocali AI care răspund 24/7 în română și rusă. Implementare în 2 săptămâni, fără infrastructură specială.

Setup în 24 oreSuport dedicatGDPR compliant

Rămâi la curent

Obține cele mai recente știri despre tehnologia de apelare AI și actualizările platformei

Made with ♡ by Kallina AI Team — 2025