Pi-card: L’Assistente Vocale AI per Raspberry Pi

Pi-card è un assistente vocale AI completamente funzionante su Raspberry Pi, capace di eseguire qualsiasi attività tipica di un modello linguistico avanzato come ChatGPT, in un contesto conversazionale. Inoltre, se equipaggiato con una fotocamera, Pi-card può scattare foto, descrivere ciò che vede e rispondere a domande sull’immagine.

Il progetto nasce con l’obiettivo di creare un assistente vocale offline, garantendo la privacy dell’utente e la sicurezza dei dati, che non vengono inviati a server di terze parti. Pi-card ascolta una parola di attivazione per iniziare una conversazione e continua a ricevere comandi fino a quando l’utente non dice “stop”, “exit” o “goodbye”. Durante la conversazione, il sistema mantiene la memoria, permettendo di ripetere o elaborare argomenti precedenti.

Pi-card può essere potenziato collegandolo a servizi esterni tramite API, attivati da specifiche parole chiave. Ad esempio, comandi come “scatta una foto” o “cosa vedi” attiveranno la fotocamera.

Per quanto riguarda l’hardware, Pi-card richiede un Raspberry Pi 5 Model B, un microfono USB, un altoparlante e una fotocamera. Il software utilizza librerie ottimizzate in C++ per la trascrizione audio e i modelli di visione, garantendo un funzionamento fluido e rapido. L’installazione richiede il download delle librerie whisper.cpp per la trascrizione e llama.cpp per il modello di visione, con l’aggiunta dei rispettivi percorsi nel file config.py.

I benchmark mostrano tempi di risposta competitivi per i vari modelli utilizzati, con opzioni di overclocking per migliorare ulteriormente le prestazioni, sebbene con rischi associati.

In futuro, sono previsti miglioramenti come l’aggiunta di nuovi servizi esterni, la possibilità di interrompere l’assistente per fare nuove domande, e l’integrazione con dispositivi smart home.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Main Menu